Бурков В. Н. - Теория активных систем - Состояние и перспективы

Теория активных систем (ТАС) - раздел теории управления социально-экономическими системами, изучающий свойства механизмов их функционирования, обусловленные проявлениями активности участников системы. Основным методом исследования является математическое (теоретико-игровое) и имитационное моделирование.
За тридцать лет своего развития в ТАС были разработаны, исследованы и внедрены множество эффективных механизмов управления, соответствующие модели и методы находят применение при решении широкого круга задач управления в экономике и обществе - от управления технологическими процессами до принятия решений на уровне регионов и стран.
Полученные результаты нашли отражение в сотнях публикаций (примерная оценка общего числа публикаций в рамках ТАС - около двух тысяч). По основным своим подходам и используемым методам исследований теория активных систем чрезвычайно тесно связана с такими разделами теории управления социально-экономическими системами как: теория иерархических игр (или информационная теория иерархических систем - научная школа Н.Н.Моисеева и Ю.Б.Гермейера, развиваемая в основном сотрудниками ВЦ РАН и МГУ - Ф.И.Ерешко, А. Ф. Кононенко, В.В.Федоров и др. [276, 279, 336, 360]), киевская школа теории управления сложными системами (В.Л.Волкович, В.С.Михалевич и др.), разделы экономикоматематического моделирования, исследующие задачи
согласованного планирования, и программно-целевого планирования (К.А.Багриновский, В.Л.Макаров, Г.С.Поспелов, В.А.Ириков и др.), управление проектами (В.И.Воропаев, Д.И.Голенко-Гинзбург и др.), теория контрактов (theory of contracts (ТК), развиваемая в основном зарубежными учеными - O.Hart, B.Holmstrom и др., и исследующая задачи стимулирования в условиях вероятностной неопределенности - см. обзоры [152,153,371]), теория реализуемости (implementation theory (ТР) как раздел mechanism design, также развиваемая в основном зарубежными учеными - E.Maskin, R.Myerson и др., и исследующая задачи реализуемости соответствий группового выбора механизмами планирования, а также их свойства -неманипулируемость и др. - см. обзоры [152, 153, 371]) и др. Огромное число опубликованных работ, а также тесная взаимосвязь и глубокое взаимопроникновение идей и результатов ТАС и других разделов теории управления, делают практически невозможным создание относительно полной библиографии. Более того, полная библиографизация, наверное, нецелесообразна - во-первых, в упомянутых выше работах содержатся достаточно полные сравнительные аналитические обзоры близких к ТАС научных направлений, а, во-вторых, настоящая публикация содержит перечисление основных работ по теории активных систем.
Среди этих основных работ можно выделить несколько классов.
Первый класс работ - монографии, содержащие полное и систематическое изложение текущих теоретических результатов, а также результатов прикладных исследований [54, 84, 94, 112, 123, 177, 195, 201, 214, 234, 363, 382, 384, 410].
Второй класс работ - учебные пособия, ориентированные на студентов ВУЗов, аспирантов и слушателей системы повышения квалификации [74, 173, 233, 236, 343]. Следует признать, что на настоящий момент ощущается острая нехватка работ подобного типа, которые содержали бы описание результатов ТАС, методически ориентированных на широкий круг читателей, являющихся представителями различных специальностей -психологов, экономистов, математиков и др.
Третий класс работ, отражающих, в основном, теоретические результаты - статьи в научных журналах (в основном - Автоматика и Телемеханика, а также - Приборы и системы управления, Известия ВУЗов, Проблемы безопасности при чрезвычайных ситуациях, Systems Science, Mathematical Social Sciences и др.) и сборниках статей Института проблем управления и других организаций (в их числе - Активные системы (1973, 1974), Согласованное управление (1975), Синтез механизмов управления сложными системами (1980), Механизмы
функционирования организационных систем: теория и приложения (1982), Неопределенность, риск, динамика в организационных системах (1984), Планирование, оценка деятельности и
стимулирование в активных системах (1985), Механизмы
управления социально-экономическими системами (1988), Управление большими системами (1997) [235, 380] и др.).
Четвертый класс работ - брошюры и препринты (Института проблем управления РАН, а также других научных институтов и ВУЗов), содержащие в основном описание прикладных моделей и результатов их практического использования или популяризованное изложение результатов теории [13 36, 42, 66, 97, 159, 169, 172, 175, 186, 188, 206, 216, 244, 248, 328, 337, 338, 339, 369, 372, 374].
И, наконец, пятый - наиболее многочисленный - класс работ -доклады на российских и международных научных и научнопрактических конференциях, съездах, симпозиумах и т.д.
Распределение во времени основных работ по ТАС (приводимая ниже библиография содержит 432 ссылки) представлено следующей гистограммой (по горизонтали отложены годы, по вертикали - число работ).
Бурков В. Н. - Теория активных систем - Состояние и перспективы

Настоящее описание является предисловием к приводимой ниже библиографии основных работ по теории активных систем и преследует следующую цель - кратко охарактеризовать круг задач, решаемых в ТАС (параллельно вводя основные термины), с тем, чтобы уважаемый Читатель имел возможность более свободно ориентироваться в их проблематике и легко находить ссылки на работы, максимально близкие к конкретной области его научных интересов. При этом следует признать, что в силу ограниченного объема мы были вынуждены практически отказаться от описания собственно результатов исследований, ограничиваясь краткими описаниями постановок задач и в большинстве случаев лишь качественным обсуждением существующих моделей - достаточно полное изложение самих результатов приведено в работах, на которые указывают соответствующие ссылки.
Последующее изложение имеет следующую структуру. Сначала описывается модель активной системы (АС) и приводится общая формулировка задачи управления. Затем вводится система классификаций задач управления активными системами, имеющая ключевое значение для ориентации в приводимом далее списке литературы. После этого для базовых (простейших) моделей рассматриваются два основных класса теоретических задач ТАС -задачи анализа и синтеза механизмов стимулирования и планирования, а также обсуждаются расширения базовых моделей.
Помимо теоретических исследований задач стимулирования и планирования, в ТАС было разработано множество так называемых базовых механизмов управления АС и соответствующих прикладных моделей, среди которых можно выделить механизмы: комплексного оценивания, активной экспертизы, формирования состава и структуры активной системы, распределения ресурса, финансирования, оперативного управления и др. В заключение обсуждаются перспективные направления исследований.
2. Модель активной системы и общая постановка задачи управления
Рассмотрим задачу управления некоторой (пассивной или активной) системой. Пусть состояние системы описывается переменной ye A, принадлежащей допустимому множеству A. Состояние системы в некоторый момент времени зависит от управляющих воздействий u e U: y = F(u).
Предположим, что на множестве UxA задан функционал F(u,y), определяющий эффективность функционирования системы. Величина
K(u) = Ф(u,F(u)) называется эффективностью управления u е U. Тогда задача управляющего органа заключается в выборе такого допустимого управления, которое максимизировало бы значение его
эффективности при условии, что известна реакция системы F(u) на 2 управляющие воздействия :
K(u) ® max.
ueU
Рассмотрим теперь различия в моделях управления пассивными и активными системами. Для пассивной (технической, формальной и т.д.) системы зависимость y = F(u) является, фактически, моделью системы - управляемого объекта, отражающей законы и ограничения ее функционирования. Например, для динамической системы эта зависимость может являться решением системы дифференциальных уравнений, для некоторого черного ящика - быть результатом экспериментов и т.д.
Общим для всех пассивных систем является их детерминизм с точки зрения управления - не в смысле отсутствия неопределенности, а в смысле отсутствия у управляемого объекта свободы выбора своего состояния и возможности прогнозирования поведения управляющего органа.
Иначе обстоит дело в активных системах, то есть системах, в которых управляемые субъекты (точнее говоря, хотя бы один субъект) обладают свойством активности - в том числе - свободой выбора своего состояния. Помимо возможности выбора своего состояния, элементы АС обладают собственными интересами и предпочтениями, то есть осуществляют выбор состояния целенаправленно (в противном случае их поведение можно было бы рассматривать как пассивное).
Соответственно конкретизируется и модель системы F(), которая должна учитывать проявления активности управляемых субъектов. Проявления эти описываются следующим образом - считается, что управляемые субъекты стремятся к выбору таких своих состояний, которые являются наилучшими с точки зрения их предпочтений при заданных управляющих воздействиях, а управляющие воздействия, в свою очередь, зависят от состояний управляемых субъектов (см. игру Г2 ниже).
Одним из важнейших проявлений активности также является способность управляемых субъектов предсказывать (в рамках имеющейся информации) поведение управляющего органа - его реакцию на состояние системы и т.д.
Если управляющий орган имеет модель реальной активной системы, которая адекватно описывает ее поведение, то задача управления АС (задача синтеза оптимального управляющего воздействия) сводится к сформулированной выше - выбрать оптимальное управление u = u (y) е U, то есть допустимое управление, максимизирующее эффективность.
Закончив краткое качественное обсуждение постановки задачи управления в пассивных и активных системах, перейдем к более детальному описанию собственно модели активной системы.
Любая конкретная активная система (и ее модель) задается перечислением следующих параметров.
1. Состав АС - совокупность субъектов и объектов, являющихся элементами системы (в дальнейшем для их обозначения будет использоваться термин участники АС).
2. Структура АС - совокупность информационных, управляющих и других связей между участниками АС, включая отношения подчиненности и разделение прав принятия решений. В большинстве моделей теории активных систем исследовались двухуровневые АС веерного типа, состоящие из одного управляющего органа - центра на верхнем уровне иерархии и одного или нескольких подчиненных ему управляемых субъектов -активных элементов (АЭ) на нижнем уровне.
3. Число периодов функционирования отражает наличие или отсутствие динамики (однократности или многократности выбора стратегий участниками АС в течение рассматриваемого периода времени).
4. Целевые функции участников системы, отражающие их интересы и предпочтения. В формальных моделях ТАС считается, что рациональному поведению участников соответствует выбор состояний (стратегий), которые максимизировали бы их целевые функции (см. теоретико-игровые модели ниже).
5. Допустимые множества состояний (стратегий) участников АС, отражающие индивидуальные и общие для всех ограничения на выбор состояний, накладываемые окружающей средой, используемой технологией и т. д.
6. Порядок функционирования - последовательность получения информации и выбора стратегий участниками АС.
7. Информированность участников - та информация, которой обладают участники АС на момент принятия решений о выбираемых стратегиях.
Состав, структура, целевые функции, допустимые множества, число периодов функционирования, порядок функционирования и информированность участников определяют механизм функционирования (управления) АС в широком смысле -совокупность законов, правил и процедур взаимодействия участников системы. В узком смысле механизм управления представляет собой совокупность правил принятия решений (ППР) участниками АС при заданных ее составе, структуре и т. д. (например, ППР центра - зависимость u (у), ставящая соответствие состояниям АЭ конкретное значение управляющего воздействия).
Умея решать задачу синтеза механизма управления в узком смысле, можно решать задачи синтеза оптимального состава участников АС, ее структуры и т.д., то есть задачи синтеза механизма управления в широком смысле.
Рассмотрим базовую модель активной системы, состоящей из центра и n активных элементов, функционирующих в условиях полной информированности обо всех существенных внешних и внутренних по отношению к системе параметрах (детерминированная АС). Структура АС приведена на рисунке 1.
Бурков В. Н. - Теория активных систем - Состояние и перспективы

Термин базовая по отношению к описываемой модели несет следующую нагрузку: рассматриваемая модель является с одной стороны простейшей (как с точки зрения структуры, описания и т.д., так и с точки зрения ее исследования), так как в ее рамках не учитываются многие факторы (динамика, неопределенность и т.д., которые учитываются в расширениях базовой модели), а с другой стороны на ее примере можно проследить многие закономерности управления АС с тем, чтобы использовать их при переходе к более сложным моделям. Кроме того, следует отметить, что нами был избран индуктивный стиль изложения материала настоящего предисловия, соответствующий историческому подходу к описанию результатов ТАС; переход от базовой модели к ее расширениям обсуждается ниже. Альтернативой является дедуктивный подход - рассмотрение максимально подробной модели АС, учитывающей все возможные постановки задач
управления, и дальнейшая конкретизация ее для тех или иных частных случаев. Недостаток последнего подхода очевиден - при его использовании исходное описание было бы перегружено деталями, которые можно рассматривать по отдельности (что и делается ниже), и затрудняло бы понимание качественных, но чрезвычайно важных, аспектов управления в активных системах.
Теоретико-игровая формулировка задачи управления
n
заключается в следующем. Пусть y = (yh y2, yn) е A = П A, -
i=1
вектор действий активных элементов, компоненты которых они могут выбирать независимо (гипотеза независимого поведения (ГНП)). Если ГНП не выполнена, то есть существуют общие (глобальные) ограничения на выбираемые АЭ состояния, то сначала решают задачу управления в рамках ГНП, а затем исследуют реализуемость состояний с точки зрения глобальных ограничений. Так, например, для согласованных механизмов управления (обеспечивающих совпадение состояний АЭ с плановыми значениями - планом называется желательное с точки зрения центра состояние АЭ) достаточно чтобы глобальным ограничениям удовлетворяли только планы.
Альтернативой (часто используемой в теории игр с непротивоположными интересами [276, 336]) является наложение на АЭ бесконечных штрафов в случае нарушения глобальных ограничений.
Предположим, что целевая функция i-го АЭ fi(y,u), отражает его предпочтения на множестве AxU. Определим P(u) - множество решений игры АЭ (множество реализуемых действий) как множество равновесных при заданном управлении и е U стратегий АЭ.
В одноэлементной АС P(u) является множеством точек максимума целевой функции АЭ, в многоэлементных системах -множество равновесий (в максиминнных стратегиях, или доминантных стратегиях, или равновесий Нэша, Байеса, Штакельберга и т.д. - в зависимости от конкретной задачи). Множество решений игры отражает предположения центра (исследователя операций) о поведении управляемых субъектов (активных элементов) при заданном управлении.
Далее, центр, интересы которого идентифицируются с интересами АС в целом и на позициях которого находится исследователь операций (см. 12 обсуждение этого предположения в [84, 195, 276]), должен конкретизировать свои предположения о стратегиях, выбираемых элементами из множества решений игры. Наиболее часто применяются два предельных подхода - метод максимального гарантированного результата (МГР), при использовании которого центр рассчитывает на наихудший для него выбор АЭ, и гипотеза благожелательности (ГБ), в рамках которой АЭ выбирают из множества решений игры наиболее предпочтительные с точки зрения центра действия.
Далее по умолчанию будем считать выполненной гипотезу благожелательности. При этом задача управления АС заключается в поиске допустимого управления, максимизирующего целевую функцию центра:
u е Arg max max F(u,y), ueU y eP(u)
то есть управления, имеющего максимальную эффективность
K(u)= max F(u,y) (или максимальную гарантированную
y eP(u)
эффективность Kg(u) = min F(u,y)).
y eP(u)
Отметим, что приведенная теоретико-игровая формулировка задачи управления АС, в которой центр является метаигроком, обладающим правилом первого хода и имеющим возможность назначать свою стратегию, которая зависит от стратегий АЭ: u=u (y), является игрой типа Г2 в терминологии теории иерархических игр [276]. Зависимость u () называется механизмом управления в узком смысле (см. определение выше).
Два важных частных случая общей постановки составляют задачи стимулирования и задачи планирования.
Содержательно, в задаче стимулирования6 стратегией центра является выбор системы (механизма) стимулирования (набора функций стимулирования) s(y) = (7i(y)}, ставящих в соответствие действиям АЭ величины вознаграждений, получаемых от центра, то есть u = s(y). Задачей синтеза оптимальной функции стимулирования называется задача поиска допустимой системы стимулирования, имеющей максимальную эффективность.
При их изучении основной акцент делается на исследовании влияния параметров АС и ограничений механизма стимулирования на множество решений игры, которое в задачах стимулирования называется множеством реализуемых действий.
В задаче планирования стратегией центра является выбор множества возможных сообщений АЭ и механизма (процедуры) планирования, ставящей в соответствие сообщениям элементов центру о неизвестных ему существенных параметрах назначаемый АЭ вектор планов. При их изучении основной акцент, помимо анализа эффективности, делается на исследовании выгодности для АЭ сообщения центру достоверной информации - так называемая проблема манипулируемости.
В более узком значении термин задача планирования используется в задачах стимулирования, когда на втором шаге ее решения (см. ниже) при известных множествах реализуемых действий решается задача оптимального согласованного планирования (ОСП), то есть задача выбора конкретного действия АЭ, которое центру наиболее выгодно реализовать.
Закончив краткое описание базовой модели, перейдем к классификации задач управления АС.

3. Классификация задач управления активными системами

Перечисленные в предыдущем разделе параметры, определяющие конкретную модель активной системы, можно рассматривать в качестве оснований системы классификации [152, 231, 233, 239, 382]. Основные значения признаков классификации по различным основаниям приводятся ниже.
В рамках каждого из значений признаков возможна более детальная иерархическая классификация.
1. Состав АС: число АЭ - одноэлементные и многоэлементные АС (см. более подробно [152, 153, 195, 371]).
2. Структура АС: число уровней иерархии - двухуровневые, трехуровневые и др. АС; подчиненность АЭ - АС с унитарным контролем (веерного типа, в которых структура подчиненности имеет вид дерева, то есть каждый АЭ подчинен одному и только одному управляющему органу) и АС с распределенным контролем (АС РК, в которых АЭ может быть подчинен одновременно нескольким управляющим органам, в том числе - многоканальные АС); взаимозависимость показателей деятельности, функций выигрыша и индивидуальных управлений АЭ - независимые АЭ, слабо связанные АЭ, сильно связанные АЭ (см. более подробно [13, 152, 363, 382, 406]).
3. Число периодов функционирования: статические (участники АС производят выбор стратегий однократно) и динамические АС. Динамические АС, в зависимости от взаимосвязи периодов функционирования и учета участниками АС влияния последствий принимаемых решений на будущие периоды функционирования, могут в свою очередь подразделяться на АС с дальновидными и недальновидными АЭ, адаптивные и неадаптивные АС и т.д. (см. более подробно [31, 195, 201, 371, 410, 425, 426]).
4. Целевые функции определяют конкретный тип задачи управления - задача стимулирования, задача планирования или какие-либо их частные случаи - базовые модели и т.д. (см. ниже).
5. Допустимые множества - независимые или взаимозависимые множества возможных выборов (состояний) участников АС (см. ГНП выше); размерность пространства индивидуальных состояний АЭ и планов - АЭ со скалярными и векторными предпочтениями (см. более подробно [28, 46, 54, 195, 224, 363, 406]).
6. Порядок функционирования: в первом приближении достаточно выделить стандартный и нестандартный порядок функционирования. Стандартный порядок функционирования соответствует, например, базовой модели, описанной выше.
7. Информированность участников - основание классификации, по которому на сегодняшний день предложено наибольшее число значений признаков и, соответственно, наибольшее число подклассификаций. Наиболее грубым является разделение АС на АС с симметричной (одинаковой) и асимметричной
информированностью участников (в первую очередь важно определить различие в информированностях АЭ и центра), а также на детерминированные АС и АС с неопределенностью. В свою очередь АС с неопределенностью могут классифицироваться по следующим основаниям.
7.1. Тип неопределенности: внутренняя неопределенность (относительно параметров самой АС), для внутренней неопределенности - относительно целевых функций, допустимых множеств или и того и другого; внешняя неопределенность (относительно параметров окружающей среды, то есть внешних по отношению к АС) и смешанная неопределенность (для части участников АС - внутренняя, для других - внешняя; или обеих типов).
7.2. Вид неопределенности: интервальная (когда участнику АС известно множество возможных значений неопределенного параметра), вероятностная (известно вероятностное распределение
- вероятностные АС) и нечеткая (известна функция принадлежности - нечеткие АС) неопределенность, а также смешанная неопределенность (все возможные комбинации перечисленных видов неопределенности для различных участников).
7.3. Принципы поведения участников АС (методы устранения неопределенности и принципы рационального поведения - напомним, что выше мы ввели предположение о бескоалиционное™ поведения АЭ): использование МГР, ожидаемых полезностей, максимально недоминируемых альтернатив, сообщения информации, выбор структуры системы и т.д.
По различным основаниям возможно значительное число различных признаков классификации и их комбинаций. Следует также отметить, что не все комбинации значений признаков являются допустимыми. Так, например, использование ожидаемых полезностей возможно только в вероятностных АС, сообщение информации имеет смысл только при асимметричной информированности и должно предусматриваться порядком функционирования АС и т. д.
В соответствии с приведенной системой классификаций рассмотренная в предыдущем разделе базовая модель АС является: многоэлементной с несвязанными АЭ, двухуровневой с унитарным контролем, статической, со стандартным порядком функционирования, скалярными предпочтениями АЭ, детерминированной с симметричной информированностью участников активной системой. Аналогичным образом в рамках введенной системы классификаций можно описать любую модель АС, что позволит нам в дальнейшем достаточно кратко и унифицированно определять классы активных систем, исследованию которых посвящены приводимые в библиографии работы.
4. Механизмы стимулирования в активных системах
Рассмотрим сначала одноэлементную задачу. В соответствии с классификацией, введенной выше, базовой детерминированной задачей стимулирования является следующая задача. Пусть активная система состоит из центра и одного активного элемента.
Интересы участников выражены их целевыми функциями: Фі(у) = H(y) и f(y) = s(y) - c(y), где y e A - действие АЭ, H(y) - функция дохода центра, s(y) e M - функция стимулирования, c(y) - функция затрат АЭ. Стратегией центра является назначение функции стимулирования из класса M с целью максимизации своей целевой функции Fj(y) при условии, что АЭ выберет при известной функции стимулирования действие из множества A, максимизирующее его собственную целевую функцию f(y). Множество действий АЭ, доставляющих максимум его целевой функции при данной системе стимулирования называется множеством реализуемых действий (множеством



Эффективность стимулирования

решений игры): P(a) = Arg max {a(y) - c(y)}.
y eA
Эффективность стимулирования в рамках гипотезы благожелательности определяется как K(a) = max F(y). Задачей
yeP(a)
синтеза оптимальной функции стимулирования называется задача
K(a)® max . Если целевая функция центра имеет приведенный выше
a eM
вид, то соответствующая задача стимулирования называется задачей первого рода [236,382]. Задачей второго рода называется аналогичная задача, отличающаяся лишь видом целевой функции центра - в ней из дохода вычитаются затраты на стимулирование: FII(y) = H(y) - a(y). В многоэлементных задачах затратами на
n
стимулирование называется величина J(y,a) = Е a (yi), где І -
i=1
номер АЭ, i е I = {1, 2, n}, n - число АЭ в системе, y = (y1t y2, , yn). Затратами на стимулирование по реализации действия ye A' = n
П Ai системой стимулирования a е M называется величина J(y, a), i=1
где yeP(a). Минимальные затраты на стимулирование по
реализации действия yeA есть J(y) = min J(y,a). Если
{a eM\y eP( a)}
действие не реализуемо ни одной из систем стимулирования из класса M, то затраты на его реализацию считаются равными бесконечности. Такое определение минимальных затрат на стимулирование делает их инструментом анализа задач стимулирования первого рода, эквивалентным анализу свойств множеств реализуемых действий.
Понятно, что в задачах стимулирования второго рода исследования множеств реализуемых действий недостаточно [152, 195, 382].
При решении задач стимулирования в АС со скалярными предпочтениями АЭ, как правило, вводятся следующие стандартные предположения (если в многоэлементной системе индекс i опущен то по умолчанию будем считать, что предположение (уравнение, неравенство и т.д.) имеет место для всех АЭ): A=%+; c(y) -ограничена снизу, непрерывна и монотонно возрастает, c(0)=0, иногда дополнительно предполагают, что c(y) выпукла и непрерывно дифференцируема и c'(0) = 0. Обозначим M' - множество положительнозначных кусочно-непрерывных функций, M = {а | ~ n
ye A 0a(y)C}, M = {a | ye A' У і(Уі) R}. Константа С
i=1
8 называется ограничением механизма стимулирования .
Известны следующие факты: - в задаче стимулирования первого рода оптимальна система
Г 0,y x
стимулирования С-типа (скачкообразная): sC(x,y) = , где x
[C,y x
e P = [0, y+], y+ = max {y e A | c(y) C }, а оптимальный план определяется как решение следующей задачи ОСП:
x = arg max H(x); x eP
- в задачах стимулирования первого и второго рода оптимальна система стимулирования QK-типа (квазикомпенсаторная):
aQK(y)
0, у Ф x
c(y),y = x ’
- решение задачи стимулирования второго рода состоит из двух этапов:
1) определение системы стимулирования, реализующей заданное действие с минимальными затратами - минимальные затраты на стимулирование по реализации действия x e A равны: J(x)
= c(x) - cmin, где cmin = min c(y).
у eA
2) выбор оптимального реализуемого действия (задача ОСП): x
= arg max B(y), где B(y) = H(y) - J(y). у eA
8 Мы надеемся, что использование при дальнейшем изложении не совсем удачной, но исторически сложившейся, системы обозначений (c(y) - функция затрат, C - ограничение механизма и т.д.) не приведет к неоднозначности.
Содержательно, в задаче первого рода АЭ поощряется на фиксированную величину, если его действие не меньше заданного (плана), если же его действие строго меньше плана, то он не поощряется вообще. В задачах второго рода элементу в точности компенсируются его затраты в случае выбора действия, совпадающего с планом.
Вариации рассмотренной выше детерминированной модели АС с независимыми АЭ (отличающиеся вводимыми предположениями о целевых функциях и допустимых множествах) можно найти в [34, 39, 48, 54, 59, 60, 70, 143, 146, 150, 192, 278, 299, 301, 316, 341, 382].
Обширный и достаточно глубоко и подробно исследованный подкласс задач стимулирования составляют задачи синтеза согласованных механизмов стимулирования.
Пусть система стимулирования зависит от параметра - плана xeXи действия АЭ yeA, где X - множество допустимых планов (для простоты положим X = A): s = (s(x,y). Тогда целевая функция АЭ зависит от стимулирования, плана и действия АЭ: f = f(s, x, y). Множество реализуемых действий также параметрически зависит от
плана: P(s,x) = Argmax f(s,x,y). Изменяя планы, центр может
y еА
системой стимулирования s(,y) реализовать следующее множество действий: P(s) = - P(s, x).
x eX
Обозначим B(s) = {x e X | y e A s(x,x) - c(x) s(x,y) - c(y)} множество согласованных планов, то есть таких планов, выполнять которые при заданной системе стимулирования для АЭ выгодно.
Как уже отмечалось выше при обсуждении соотношения между задачами планирования и задачами стимулирования, задавая систему стимулирования s(x,y), центр имеет возможность оперативно изменять значения планов, не меняя функцию стимулирования, что достаточно привлекательно, так как особенно в динамике частые изменения механизма управления целиком не всегда возможны с точки зрения адаптивных свойств АЭ.
Согласованной называется система стимулирования s e M, для которой выполнено B(s) = P(s). Значительное внимание исследователей уделялось поиску необходимых и достаточных условий согласованности систем стимулирования, а также изучению соотношения таких свойств как согласованность и эффективность систем стимулирования - подавляющее большинство работ в ТАС на рубеже 70-80 годов было посвящено именно этой тематике.
Поэтому проведем несколько более подробное обсуждение результатов, полученных для согласованных механизмов управления АС (достаточно полное и систематическое их изложение приведено в монографиях [54, 84, 195, 201]).
В работах по теории активных систем рассматривался целый ряд требований согласования интересов центра и АЭ, формулируемых как необходимость обеспечения требуемых соотношений между планами активных элементов и их реализациями (выбором - действиями АЭ). Среди них: механизмы, согласованные по выполнению плана (см. определение выше) в системах с полным, частичным и агрегированным планированием, x-согласованные механизмы, A(x)'-согласованные механизмы, L-согласованные механизмы [106, 146, 149-151, 196, 199, 299, 300, 324327] и др.
В упомянутых работах развиваются как методы решения задачи синтеза оптимальных механизмов функционирования, так и задачи синтеза оптимальных механизмов функционирования, согласованных по выполнению плана.
Наиболее известным и изящным достаточным условием согласованности системы штрафов c(x,y) (для задачи стимулирования, в которой целевая функция АЭ представляет собой разность между доходом и штрафами - эта постановка является двойственной к описанной выше модели, в которой целевая функция АЭ определяется разностью между стимулированием и затратами [382]) является так называемое неравенство треугольника: x, y, z c(x,y) ? c(x,z) + %(z,y). Описание достаточных условий согласованности можно найти в [195].
Важным шагом в развитии методологии и понимании проблем оптимальности в АС явилось построение основ теории необходимых и достаточных условий оптимальности механизмов, согласованных по выполнению планов, разработка техники получения конструктивно проверяемых условий их выполнения. Результаты этих исследований нашли отражение в упомянутых выше монографиях и статьях [49-51, 150, 328].
Понятие степени централизации, введенное в [84] и отражающее жесткость штрафов, позволило получить ряд результатов по сохранению свойства выполнения плана при увеличении степени централизации [195]. Результаты решения задач оптимального синтеза согласованных систем стимулирования и их составляющих изложены в [47, 48, 285-287]. Дальнейшее развитие этого направления (для согласованных механизмов, оптимальных по критерию гарантированного относительно неизвестных параметров результата) было произведено в [134, 135, 305, 333].
Результаты по задачам последовательного синтеза адаптивных согласованных механизмов можно найти в [31-38, 201, 409-412].
Задачи оптимального планирования дискретных производственных систем, сформулированные в виде задач теории расписаний, и методы их решения, которые использовались для оценки целевой функции системы в соответствующих задачах согласованного планирования, рассмотрены в работах [52, 53, 61-64, 284, 358, 359, 395].
Перейдем к рассмотрению задач стимулирования в многоэлементных АС - проведем их классификацию и укажем работы, содержащие описание результатов исследования различных классов. Обозначим y, е А, - действие i-го активного элемента, y=(yi, п У2, , Уп) е A' = п А( - вектор действий активных элементов, z=Q(y), i=1
где Q: А' ® А0 - результат деятельности активных элементов системы, А0 - множество возможных результатов деятельности.
Индивидуальные затраты i-го активного элемента по выбору действия yi в общем случае зависят от действий всех АЭ, то есть ci=ci(y). Стимулирование i-го АЭ si(), назначаемое центром, в общем случае может зависеть от действий всех АЭ и от результата деятельности системы, то есть si: А'хА0 ® Ж. Таким образом, целевая функция i-го АЭ имеет вид стимулирование минус затраты: f(y,Gi) = Si(y,z) - с(у), i е I = {1, 2, , п}.
Целевая функция центра, в задаче второго рода представляющая собой разность между доходом от действий АЭ и результатов деятельности системы - H(y,z) и суммарными затратами на стимулирование, имеет вид:
F(y, о) = H(y,Q(y)) - XSi(y, Q(y)) , где s = (оь оъ , On) e M, M-i=1
множество допустимых систем стимулирования, которое может определяться M, M’ или M (см. выше).
Предположим, что при использовании центром системы стимулирования s e M множество решений игры АЭ (то есть -множество действий, реализуемых системой стимулирования s) есть Р(о) с A'. В многоэлементной АС в качестве множества решений игры (множества реализуемых действий) Р(о) может рассматриваться равновесие в доминантных стратегий Ed(s) (если оно существует), равновесие Нэша En(o) или какая-либо другая некооперативная (и оговариваемая в каждом конкретном случае) теоретико-игровая концепция равновесия.
По умолчанию под равновесием (множеством реализуемых действий) ниже мы будем подразумевать равновесие Нэша (точнее - множество равновесных по Нэшу при заданной системе стимулирования векторов стратегий АЭ).
Как и в одноэлементной АС, эффективностью (гарантированной эффективностью) стимулирования является максимальное (минимальное) значение целевой функции центра на множестве решений игры: K(s) = max Ф(у, о), а задача синтеза оптимальной уеР(о) функции стимулирования заключается в поиске допустимой системы стимулирования о eM, имеющей максимальную эффективность о = arg max K(s).
И в одноэлементных, и в многоэлементных АС задача синтеза оптимальной системы стимулирования фактически сводится либо к анализу множеств реализуемых действий, либо (и) к анализу минимальных затрат на стимулирование [195, 382]. В одноэлементной активной системе множеством решений игры (реализуемых действий) является множество действий активного элемента, доставляющих максимум его целевой функции. В многоэлементной АС активные элементы вовлечены в игру -выигрыш каждого АЭ в общем случае зависит как от его собственных действий, так и от действий других активных элементов (еще раз напомним, что в настоящей работе допускается лишь некооперативное взаимодействие участников системы).
Поэтому основное качественное отличие задач стимулирования в многоэлементных системах по сравнению с одноэлементными (помимо простого увеличения числа участников системы и соответствующего ему линейного по их числу росту сложности задачи) заключается в том, что в многоэлементных системах множество решений игры может иметь достаточно сложную структуру. В том числе, например, одной системой стимулирования могут реализовываться несколько Парето эффективных (с точки зрения АЭ) векторов действий и т.д.
Другими словами, отсутствие на сегодняшний день относительно полных (если принять за идеал совокупность результатов исследования одноэлементных задач) аналитических методов решения многоэлементных задач стимулирования, помимо высокой их структурной и вычислительной сложности, отчасти объясняется отсутствием единой концепции решения игры в теории игр - в зависимости от информированности игроков (участников АС), гипотез об их поведении и т.д. может изменяться эффективность тех или иных управлений.
Так как целевая функция АЭ определяется разностью стимулирования и затрат, то, классифицируя задачи стимулирования в многоэлементных АС, необходимо учитывать возможные свойства и ограничения на функции стимулирования и затрат. Для описания конкретной теоретико-игровой модели стимулирования
предлагается использовать значения признаков классификации по 9 следующим основаниям , приводимым в следующем порядке -первичное основание, вторичное и т.д.:
1. Переменные, от которых зависит функция стимулирования (индивидуальное вознаграждение АЭ). По данному основанию возможны следующие значения признаков:
- индивидуальное вознаграждение конкретного АЭ явным образом зависит только от его собственных действий. При этом возможны следующие варианты: 9 Основанием классификации оснований вводимой системы классификаций служит набор параметров, который однозначно описывает большинство моделей многоэлементных АС.
- отсутствуют общие ограничения на индивидуальные стимулирования АЭ;
- присутствуют общие ограничения на стимулирование.
- индивидуальное вознаграждение конкретного АЭ явным образом зависит только от вектора действий всех АЭ.
- индивидуальное вознаграждение конкретного АЭ явным образом зависит только от результата деятельности АС.
- смешанная зависимость, когда индивидуальное вознаграждение конкретного АЭ явным образом зависит и от результата деятельности АС и от вектора действий всех АЭ (например, аддитивно).
2. Свойства функций затрат АЭ. Ограничимся пока рассмотрением двух случаев - сепарабельных и несепарабельных затрат. Сепарабельными называются такой набор функций индивидуальных затрат АЭ, в котором затраты каждого АЭ зависят только от его собственных действий: у, е A, у-і е A-i с(у) = с(у),
где у4 = (уі, у2, , у,-:, Уі+і, , Уп) - обстановка для і-го АЭ, Л4 = П Aj. J * і
Несепарабельными называются индивидуальные затраты АЭ, зависящие от его собственных действий и действий других игроков.
3. Унифицированность системы стимулирования. В первом приближении ограничимся персонифицированными и унифицированными системами стимулирования. В первом случае функции стимулирования различных АЭ различны (общий случай обычных систем стимулирования, оперируя с которыми мы будем опускать прилагательное персонифицированная).
Во втором случае функция стимулирования одинакова для всех АЭ, но может для различных АЭ зависеть от различных параметров (например, их индивидуальных действий и т.д.). Унифицированные системы стимулирования описаны в [363].
Комбинируя четыре значения признаков по первому основанию классификации и два по второму, получаем следующие восемь (не учитывающих унифицированность) основных классов моделей стимулирования в многоэлементных АС.
1. Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от его собственных действий, затраты сепарабельны. Возможные следующие варианты.
Первый - общие ограничения на индивидуальные стимулирования АЭ отсутствуют -получаем набор несвязанных одноэлементных задач стимулирования (см. выше). Второй вариант - присутствуют общие ограничения на систему стимулирования в АС - получаем АС со слабо связанными активными элементами, решение задачи стимулирования в которой распадается на решение набора параметрических одноэлементных задач и последующим поиском оптимального значения параметра (например, плана и т.д.) в результате решения соответствующей стандартной задачи условной оптимизации [195, 233, 237, 382].
2. Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от его собственных действий, затраты несепарабельны. Общие результаты для этого класса задач стимулирования отсутствуют - см. обзоры [141, 152, 371].
3. Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от вектора действий всех АЭ, затраты сепарабельны. Подклассом являются ранговые системы стимулирования, при использовании которых индивидуальное вознаграждение АЭ зависит либо от принадлежности его действия заранее заданному элементу разбиения множества A - так называемые нормативные ранговые системы стимулирования, либо от места, занятого конкретным АЭ в упорядочении действий всех АЭ - так называемые соревновательные ранговые системы стимулирования [84, 195, 293, 392, 396, 397, 410, 412, 420].
Для этого класса задач стимулирования в многоэлементных АС можно показать, что в случае сепарабельных затрат для любой системы стимулирования из некоторого класса, зависящей от вектора действий всех АЭ, в том же классе найдется система стимулирования, зависящая для каждого АЭ только от его индивидуальных действий, и реализующая тот же вектор действий, что и исходная система стимулирования [410, 415].
4. Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от вектора действий всех АЭ, затраты несепарабельны. Общие результаты для этого класса задач стимулирования отсутствуют - см. обзоры [141, 152, 371].
5. 6. Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от результата деятельности АС, затраты сепарабельны или несепарабельны. Эти классы моделей называются моделями коллективного стимулирования.
Немногочисленные результаты их изучения приведены в [156, 294, 296, 363, 429].
7, 8. Индивидуальное вознаграждение конкретного АЭ явным образом зависит и от вектора действий всех АЭ, и от результата деятельности АС (смешанная зависимость), затраты сепарабельны или несепарабельны. Общие результаты для этого класса задач стимулирования отсутствуют - см. обзоры [141, 152, 371].
5. Механизмы планирования в активных системах
Рассмотрим двухуровневую многоэлементную активную систему, структура которой приведена на рисунке 1 (см. выше). Стратегией каждого из активных элементов является сообщение центру некоторой информации у- е Qi, i е I. Центр на основании сообщенной ему информации назначает АЭ планы xi = pi(s), где p -
процедура (механизм) планирования, se Q' = П Qi - вектор i сообщений всех АЭ. Функция предпочтения АЭ, отражающая интересы АЭ в задачах планирования: (pi(xi,ri): Ж2 ® Ж1 является сепарабельной, то есть зависит от соответствующей компоненты назначенного центром плана и некоторого параметра (связь между функциями предпочтения и целевыми функциями описана в [195, 375, 376, 382]).
Условно, между задачами планирования и стимулирования можно провести следующую аналогию (см. таблицу ниже).
Стимулирование Планирование Стратегия АЭ У е A ’ s е Q’ Управление и е U s(y) P(s) Предпочтения АЭ f(y,s) j(s,P)
На момент принятия решений каждому АЭ известны: процедура планирования, значение его собственного параметра ri е Ж1 (идеальной точки, точки пика), целевые функции и допустимые множества всех АЭ. Центру известны зависимости ji(xi,) и множества возможных сообщений АЭ и неизвестны точные значения идеальных точек.
Последовательность функционирования следующая: центр выбирает процедуру планирования и сообщает ее АЭ, активные элементы при известной процедуре планирования сообщают центру информацию, на основании которой и формируются планы.
Так как решение, принимаемое центром (назначаемые им планы), зависит от сообщаемой элементами информации, последние могут воспользоваться возможностью своего влияния на эти решения, сообщая такую информацию, чтобы получить наиболее выгодные для себя планы. Понятно, что при этом полученная центром информация в общем случае может не быть истинной.
Следовательно, возникает проблема манипулирования.
Как правило, при исследовании механизмов планирования, то есть АС с сообщением информации, вводится предположение, что функции предпочтения АЭ однопиковые с точками пика {r}, то есть функции предпочтения непрерывны, строго монотонно возрастают до единственной точки максимума r и строго монотонно убывают после нее. Это предположение означает, что предпочтения АЭ на множестве допустимых планов таковы, что существует единственное наилучшее для него значение плана - точка пика, степень же предпочтительности остальных планов монотонно убывает по мере удаления от идеальной точки.
Будем считать, что АЭ ведут себя некооперативно, выбирая доминантные или равновесные по Нэшу стратегии. Пусть 5 - вектор равновесных стратегий.
Очевидно 5 = 5 (r), где r - вектор точек пика.
Соответствующим механизму p(): W ® Ж прямым механизмом планирования h(): Ж n ® Ж n называется механизм h(r)=p(5 (r)), ставящий в соответствие вектору точек пика активных элементов вектор планов. Если в соответствующем прямом механизме сообщение достоверной информации является равновесной стратегией, то такой механизм называется эквивалентным прямым (неманипулируемым) механизмом.
Рассмотрим возможные способы обеспечения достоверности сообщаемой информации. Наиболее очевидной является идея введения системы штрафов за искажение информации (в предположении, что центру в конце концов становятся известными истинные значения параметров {r}).
В [195] показано, что введением достаточно сильных штрафов действительно можно обеспечить достоверность сообщаемых оценок. Если отказаться от предположения, что центру становятся известными {ri}, то возникает задача идентификации неизвестных параметров по имеющейся у центра информации и, следовательно, задача построения системы штрафов за косвенные показатели искажения информации [195].
Другим возможным способом обеспечения достоверности сообщаемой информации является использование прогрессивных механизмов, т.е. таких механизмов, в которых функция j монотонна по оценке si, i е I. Понятно, что если при этом справедлива гипотеза реальных оценок: si ri , что достаточно распространено на практике, то доминантной стратегией каждого элемента будет сообщение si = ri [195].
Фундаментальным результатом теории активных систем является принцип открытого управления [84, 169, 215]. Основная идея принципа открытого управления (ОУ) заключается в том, чтобы использовать процедуру планирования, максимизирующую целевую функцию каждого АЭ, в предположении, что сообщаемая элементами оценка достоверна, т. е. центр идет навстречу АЭ, рассчитывая на то, что и они его не обманут [84, 87, 109, 123, 130, 131, 133, 137, 153]. Это объясняет другое название механизма открытого управления - механизм честной игры.
Дадим строгое определение.
Условие: j(ni(s),s) = max ji(xhSi), i е I, s е Q', где XJs.) - xi i(si)
устанавливаемое центром множество допустимых планов при заданном s, а s-i = (sh s2, si_i, si+1, , sn ) - обстановка, называется условием совершенного согласования. Процедура планирования, максимизирующая целевую функцию центра F(n,s) на множестве планов, удовлетворяющих условиям совершенного согласования, называется законом открытого управления.
Имеет место следующий факт - для того, чтобы сообщение достоверной информации было доминантной стратегией АЭ необходимо и достаточно, чтобы механизм планирования был механизмом открытого управления [84, 123, 195].
Приведенное утверждение не гарантирует единственности ситуации равновесия. Конечно, если выполнено условие благожелательности (если si = rit i e I - доминантная стратегия, то элементы будут сообщать достоверную информацию), то использование закона ОУ гарантирует достоверность сообщаемой элементами информации.
Приведем достаточное условие существования единственной ситуации равновесия вида si = ri в системе с законом ОУ. Обозначим: Ei(si) = Arg max (pi(xi, si) - xi eXi
множество согласованных планов i-го АЭ. Будем считать, что для i-го элемента выполнено условие равноправия функций предпочтения, если имеет место: si Ф si e Wi Ei(siI) n Ei(si2) = 0, то есть при любых допустимых несовпадающих оценках соответствующие множества согласованных планов не пересекаются.
Справедливо следующее утверждение: условие равноправия функций предпочтения для всех АЭ является достаточным условием единственности ситуации равновесия.



Лобовой поиск аналитического решения

Имея критерий сравнения эффективностей различных систем стимулирования на их допустимом множестве, задача синтеза в АС с неопределенностью (и в детерминированных АС - см. выше) формулируется следующим образом: найти допустимую систему стимулирования, имеющую максимальную эффективность. Все трудности при решении этой задачи (поиска точки в области функционального пространства, максимизирующей заданный функционал, переменные которого в свою очередь сложным образом зависят от искомой функции) возникают потому, что она в общем случае не может быть сведена к какой-либо стандартной задаче оптимизации. В детерминированном случае свойства решения (которое является скачкообразной или компенсаторной системой стимулирования) дается теоремой Ю.Б. Гермейера [276]. В ряде АС с неопределенностью удается дискретные задачи стимулирования свести к тем или иным известным оптимизационным (см. обзоры [152, 153, 371]).
Высокая вычислительная сложность алгоритмов численного решения дискетных задач и отсутствие возможности анализа зависимости оптимального решения от параметров модели, приводят к необходимости разработки методов получения именно аналитического решения. Поэтому основной акцент в ТАС делается именно на поиск аналитического решения задачи синтеза.
Лобовой поиск аналитического решения, как правило, не приводит к успеху - в большинстве случаев приходится угадывать решение, а затем доказывать его оптимальность, благо, что эвристические принципы угадывания, да и техника формального доказательства для различных моделей АС, имеют много общего.
Техника доказательства большинства результатов использует анализ множества реализуемых действий - тех действий АЭ, которые он выбирает (гарантированно или по ГБ) при заданной функции стимулирования. Критерий сравнения различных систем стимулирования по эффективности может быть сформулирован в терминах множеств реализуемых действий: чем шире множество действий, реализуемых системой стимулирования, тем в рамках ГБ выше ее эффективность (двойственным подходом является сравнение минимальных затрат на стимулирование по реализации фиксированного действия) [382].
Поэтому оптимальная система стимулирования (точнее - их класс) имеет максимальное множество реализуемых действий. Следовательно, для того, чтобы доказать оптимальность некоторого класса систем стимулирования достаточно показать, что не существует другой допустимой системы стимулирования, имеющей большее множество реализуемых действий.
Этот подход оказывается плодотворным не только при доказательстве оптимальности, но и при исследовании свойств решения, влияния неопределенности и т.д.
Более того, в рамках каждой из перечисленных выше базовых моделей М1-М13 возможны различные постановки задачи стимулирования - прямые и обратные, первого и второго рода, с различными представлениями целевых функций участников АС и т.д. В то же время, опыт их исследования свидетельствует, что достаточно исследовать полностью одну из них - решение остальных задач данного класса требует лишь незначительных модификаций.
В качестве иллюстрации использования единства предложенного подхода сформулируем общую для всех моделей АС с неопределенностью последовательность их исследования, включающую следующие этапы:
1. Описание модели: определение целевых функций и допустимых множеств, их свойств, а также порядка функционирования и информированности участников АС и т.д.
2. Определение рационального поведения АЭ в рамках рассматриваемой модели: задание процедуры (метода) устранения неопределенности и рационального выбора АЭ (определение множества решений игры - множества реализуемых действий).
3. Определение эффективности механизма стимулирования и формулировка, собственно, задачи синтеза оптимального механизма стимулирования.
4. Решение задачи синтеза: поиск аналитического решения и/или разработка алгоритмов численного решения задачи и исследование их свойств: сходимости, сложности и т.д.
5. Нахождение необходимых и достаточных условий оптимальности.
6. Анализ оптимального решения:
а) свойства оптимального решения и множества реализуемых действий, содержательные интерпретации;
б) влияние неопределенности на эффективность и свойства оптимального механизма стимулирования;
в) влияние параметров модели и определения рационального поведения на эффективность и свойства оптимального механизма стимулирования, в том числе - анализ устойчивости оптимального решения.
7. Исследование частных случаев (при усилении предположений и допущений о параметрах и свойствах модели АС) и возможностей обобщения (соответственно, при ослаблении).
8. Исследование устойчивости решений и адекватности модели моделируемой системе.
9. Внедрение модели: корректировка, разработка рекомендаций по практическому использованию, создание вычислительных средств, автоматизированных систем поддержки принятия решений и имитационных моделей.
Итак, этапы 1-3 включают описание АС и постановку задачи, этапы 4-5 соответствуют аналитическому и/или численному решению задачи, этапы 6-8 - исследованию модели и свойств оптимального решения, этап 9 - внедрению и практическому использованию результатов исследования.
Обнадеживающим представляется тот факт, что оптимальными в базовых моделях оказываются достаточно простые системы стимулирования . Так, результаты теоретического исследования подтверждают высокую эффективность следующих широко распространенных на практике систем стимулирования (см. их подробное описание в четвертом разделе): - скачкообразных (С-типа), компенсаторных (К-типа) и пропорциональных (L-типа) [299, 363, 382]. Отдельно следует отметить, что ни в одной из базовых моделей пропорциональные системы стимулирования (L-типа) не доминируют скачкообразные и компенсаторные.
Таблица 3 содержит сводку результатов теоретического исследования задач стимулирования в АС с неопределенностью (см. подробное описание, а также вводимые предположения в [382]): для базовых моделей М1-М13 (за исключением М3 и М9, которые на сегодняшний день недостаточно полно исследованы, быть может - в силу затруднений в их содержательных интерпретациях) указаны оптимальные системы стимулирования ((ОСС) - и означает -одновременно, или означает - в зависимости от вводимых предположений), соотношение между эффективностями K и гарантированными эффективностями Kg стимулирования в АС с неопределенностью и соответствующих детерминированных АС (K0 и Kg0), изменение эффективности (гарантированной эффективности) с ростом неопределенности (t - возрастает, n[ - убывает, t^ -может как возрастать, так и убывать).
Отдельного обсуждения заслуживает влияние
неопределенности на эффективность управления АС, так как возможность использования единого подхода к анализу базовых моделей механизмов управления (стимулирования) в АС с различными типами и видами неопределенности позволяет сделать ряд общих выводов о роли неопределенности в управлении АС. В детерминированной активной системе оптимальным оказывается целое множество систем стимулирования - от наиболее жестких - скачкообразных до наиболее слабых - компенсаторных. Все задачи стимулирования в АС с неопределенностью, рассматриваемые в ТАС, удовлетворяют принципу соответствия: при предельном переходе (стремлении неопределенности к нулю) они переходят в детерминированные АС, а их оптимальные решения - в оптимальные решения соответствующих детерминированных задач стимулирования. Причем в большинстве случаев оптимальными оказываются граничные системы стимулирования - С-типа или К-типа.
Таким образом, множество оптимальных систем стимулирования в АС с неопределенностью является подмножеством (иногда собственным) систем стимулирования, оптимальных в соответствующих детерминированных активных системах.
Ключевыми понятиями детерминированной теории активных систем являются понятия согласованного плана и согласованной системы стимулирования (см. выше). Если при исследовании моделей механизмов стимулирования в АС с неопределенностью основной акцент делается на анализ множества реализуемых действий, а условие реализуемости есть ни что иное, как условие согласованности (в ТК этому термину соответствует ICC - Incentive Compatibility Constraint - ограничение согласованности стимулирования [152]), то вопрос о том, что следует понимать под согласованностью плана в АС с неопределенностью заслуживает особого обсуждения. Так как, например, в вероятностных АС, результат деятельности АЭ является случайной величиной, то вряд ли разумно определять план как некоторую точку (хотя, задавая область, можно считать ее планом, который выполняется, если при выборе АЭ реализованного действия результат деятельности оказывается в этой области, например, с вероятностью не ниже заданной и т.д.). Считать планом точку скачка в системах стимулирования С-типа (проводя полную аналогию с детерминированным случаем) нецелесообразно по тем же причинам.
Так или иначе, даже не наблюдая действий АЭ, центр, подбирая систему стимулирования, управляет именно выбором действия. Поэтому можно считать планом действие, реализуемое заданной системой стимулирования (такой план всегда согласован). Важный методологический вывод, который следует из проведенного анализа, заключается в следующем: непосредственное обобщение понятий плана и согласованного плана с детерминированной модели на модели АС с неопределенностью невозможно, так как в общем случае в последних план (в детерминированном понимании) не совпадает ни с выбором (действием) АЭ, ни с результатом его деятельности.
Поэтому требуется дополнительное исследование и введение нового общего понятия плана для АС с неопределенностью, которое удовлетворяло бы принципу соответствия и включало в себя детерминированное определение как частный случай.
Вполне согласованными с практическим опытом представляются результаты о том, что во всех базовых моделях с ростом верхнего ограничения механизма стимулирования расширяется множество реализуемых действий, что совместно с результатами анализа влияния информированности участников на эффективность управления АС позволяет расширить класс моделей АС, для которых применима уже разработанная технология и техника анализа, включив в него АС с платой за информацию, смешанной неопределенностью, некоторые динамические и многоэлементные АС и т.д. Поэтому, по-видимому, целесообразно следовать следующей рекомендации: первыми кандидатами на оптимальность в любой новой (неисследованной) социальноэкономической системе являются скачкообразные и компенсаторные системы стимулирования.
Имеющиеся методы исследования эффективности систем стимулирования позволяют достаточно просто проверять оптимальность этих кандидатов в широком классе реальных систем и их моделей.
Принципу соответствия удовлетворяют также большинство выводов о влиянии неопределенности на эффективность стимулирования, причем, что представляется крайне важным, опять же, общей является следующая технология анализа роли неопределенности в АС с неопределенностью. Для двух АС, отличающихся либо множеством значений неопределенного фактора, либо той информацией, которую имеют о нем участники АС, вводится критерий сравнения величин неопределенности, с одной стороны учитывающий специфику задачи, а с другой -согласованный с известными мерами неопределенности (например -энтропией и т.д.) [381, 382].
Далее показывается, что в АС с большей неопределенностью множество действий АЭ, реализуемых любой допустимой системой стимулирования, не шире (шире), чем в АС с меньшей неопределенностью, что позволяет сразу сделать вывод о сравнительной эффективности оптимальных систем стимулирования в этих АС.
При использовании гипотезы благожелательности в ряде базовых моделей АС с неопределенностью (например, М4, М7, М8, М12) эффективность стимулирования оказывается не меньше, чем в соответствующих детерминированных АС, и возрастает с ростом неопределенности (содержательные интерпретации и подробное обсуждение этого парадокса приведены в [365, 372, 382]). Если же эффективность управления (стимулирования) определяется как гарантированное значение целевой функции центра на множестве реализуемых действий, то для всех моделей, независимо от типа и вида неопределенности, справедливы следующие выводы: эффективность стимулирования в АС с неопределенностью не выше, чем в детерминированной АС, причем с ростом неопределенности эффективность стимулирования уменьшается, а с уменьшением неопределенности - возрастает и стремится к аналогичному показателю для соответствующей детерминированной активной системы.
Общность описания и технологии анализа задач стимулирования в различных социально-экономических системах с неопределенностью позволяет также сравнивать неопределенности различных видов, выделяя классы интервалов, вероятностных распределений и нечетких информационных функций, то есть информацию о неопределенном параметре, при которых эффективность стимулирования удовлетворяет заданным свойствам (например, не ниже заданной и т.д.) [382].
Как отмечалось выше, во всех моделях величина неопределенности связана с информированностью участников: чем большей информацией обладает центр и/или АЭ, тем меньше неопределенность. В большинстве известных моделей считается, что участники АС, обладая на момент принятия решения некоторой информацией, могут использовать эту информацию и только ее.
Возможность получения дополнительной информации отсутствует (использование механизмов с сообщением информации от АЭ центру не является исключением: несмотря на то, что центр получает новую информацию, он получает ее после выбора процедуры планирования, причем сам факт обмена информацией изначально заложен в механизме функционирования). Такой порядок функционирования достаточно распространен на практике.
Однако встречаются ситуации, в которых участники АС имеют возможность до принятия решения целенаправленно получать информацию от окружающей среды или от других участников системы, причем, в большинстве случаев, для получения этой информации необходимы некоторые финансовые или какие-либо другие затраты.
Механизмы управления, в которых участники АС имеют возможность за плату приобрести информацию, получили название механизмов с платой за информацию [233, 234, 377, 382]. При использовании механизмов с платой за информацию имеют место две противоположные тенденции.
С одной стороны, получение дополнительной информации может повысить эффективность управления. С другой стороны, часть средств, потраченная на приобретение информации, уменьшает доход участника АС или его возможности по управлению, что может привести к снижению эффективности управления. Если точность и количество поступающей информации монотонно связаны с затратами по ее получению, то, очевидно, существует некоторый оптимум -компромисс между снижением эффективности, вызванным уменьшением управляющих возможностей, и ее ростом, обусловленным большей информированностью.
При этом не исключается, что возможны ситуации, в которых приобретать дополнительную информацию вообще не имеет смысла (плата слишком высока), или наоборот, оказывается целесообразным полное устранение неопределенности.
Существенной чертой механизмов с платой за информацию является добровольность ее приобретения: каждый из участников АС вправе самостоятельно решать приобретать ли ему дополнительную информацию и в каком объеме. Понятно, что, в принципе, приобретать информацию могут как центр, так и активные элементы. Важно также различать, у кого приобретается информация - у третьих лиц, не входящих в состав АС, или у участников самой активной системы. Так, например, возможны механизмы с сообщением информации в АС, в которых центр может, заплатив АЭ определенную сумму, например, уменьшить диапазон возможных (неизвестных для него) значений неопределенного параметра, а затем использовать механизм планирования уже в условиях меньшей неопределенности.
Задача манипулирования при этом все равно возникает, однако, следует учитывать, что плата за информацию может изменить значение целевой функции АЭ.
Для получения ответа на вопрос целесообразно ли использование механизмов с платой за информацию и определения оптимальной величины этой платы необходимо в каждом конкретном случае:
1. Определить зависимость информированности участников АС от величины платы за информацию.
2. Найти соотношение между эффективностью управления и информированностью участников (величина платы за информацию выступает при этом как параметр).
3. Вычислить величину платы за информацию,максимизирующую эффективность управления.
7. Дискретные модели активных систем
Одним из выделенных выше оснований классификации является структура множеств допустимых стратегий участников АС. Важный класс составляют так называемые дискретные АС, в которых множество возможных действий АЭ конечно. Понятно, что все результаты, полученные для непрерывных АС (в которых множество допустимых действий является, например, отрезком действительной оси) могут быть переформулированы и для частного случая дискретных АС.
Тем не менее, дискретные АС интересны тем, что для них иногда удается, используя технику дискретной оптимизации, получить результаты в тех случаях, когда анализ их непрерывных аналогов трудоемок или затруднителен. Поэтому перечислим основные направления их исследования.
При описании задач синтеза согласованных по выполнению плана механизмов стимулирования выше уже упоминалось, что решение ряда задач согласованного планирования сводится к анализу стандартных задач дискретной оптимизации (теории расписаний и др.) [61-64, 395].
Вторым направлением является использование аппарата теории графов при решении задач синтеза согласованных механизмов для дискретных моделей АС [85, 107, 123]. Качественно, основная идея заключается в том, что, поставив в соответствие действиям АЭ вершины взвешенного графа, условия согласования (условия реализуемости определенных действий и т.д.) можно интерпретировать как систему ограничений на потенциалы вершин этого графа.
Следовательно, задачу поиска оптимального или согласованного механизма можно формулировать как задачу о потенциалах, для которой известны общие условия существования решения (формулируемые обычно в виде ограничений на свойства контуров и путей в графе), а также хорошо развита техника анализа (использующая, как правило, теорию двойственности) свойств решения.
И, наконец, третьим направлением является изучение моделей АС со сравнительными предпочтениями АЭ, то есть таких систем, в которых интересы и предпочтения АЭ на конечном множестве его возможных действий описываются не целевой функцией (или функцией, дохода, затрат и т.д.), как это делается в большинстве моделей ТАС, а метризованным бинарным отношением. В [45,372,382] показано, что в детерминированных АС и в ряде АС с неопределенностью задание предпочтений АЭ в виде аддитивно транзитивных метризованных отношений и целевых функций эквивалентно (в смысле класса описываемых предпочтений и, следовательно, решений задач управления).
В то же время, метризованные отношения (в частности, не обладающие аддитивной транзитивностью) отражают более широкий класс предпочтений АЭ, и их дальнейшее изучение представляется перспективным направлением будущих исследований.
8. Базовые механизмы управления активными системами
Подробно исследованные в ТАС практически значимые детализации общих задач планирования и стимулирования получили условное название базовых механизмов управления. Они являются элементами конструктора, используя которые можно синтезировать механизмы управления теми или иными классами реальных АС.
8.1. Механизмы комплексного оценивания
Для выработки эффективных управляющих воздействий, начиная с этапа целеполагания и заканчивая этапом оперативного управления, центру необходимо обладать достаточной информацией о поведении управляемых субъектов, в частности - относительно результатов их деятельности. В сложных (многоэлементных, многоуровневых АС, деятельность которых описывается многими критериями) системах в силу ограниченности возможностей центра по переработке информации или в силу отсутствия детальной информации целесообразно использование механизмов комплексного оценивания, которые позволяют осуществлять свертку показателей, то есть агрегировать информацию о результатах деятельности отдельных АЭ.
При исследовании механизмов комплексного оценивания решаются две задачи. Первая - синтез процедуры агрегирования информации, которая адекватно отражала бы содержательные аспекты взаимодействия участников АС и позволяла центру принимать решения на основании агрегированной информации.
Это направление тесно связана с проблематикой многокритериальной оптимизации и теорией информационных управляющих систем. В ТАС в начале и середине 80-х годов были разработан ряд механизмов автоматизированной комплексной оценки результатов деятельности [68, 197, 201, 401, 405, 431], использующих различные процедуры агрегирования (широкое распространение получили процедуры матричных сверток [95, 111, 119, 120, 201, 205, 230, 234, 403, 404] и др.).
Второе направление, отражающее специфику ТАС -исследование манипулируемости механизмов комплексного оценивания. Действительно, механизмы комплексного оценивания являются механизмами с сообщением информации, а при сообщении информации в АС возникает проблема манипулирования.
Кроме того, так как исходными оценками деятельности АЭ, зачастую, являются мнения экспертов, то возникает проблема манипулируемости механизмов экспертизы, обсуждаемая в следующем подразделе.
8.2. Механизмы активной экспертизы
Исследованию формальных моделей получения и обработки экспертной информации в ТАС посвящено значительное число работ [79, 119, 123, 140, 155, 165, 177, 190, 245, 246, 256, 386-389, 418].
Под механизмом активной экспертизы в двухуровневой АС понимается следующая модель. Имеются n АЭ - экспертов, каждый из которых имеет собственные представления rte[d;D]c^ (идеальные точки, точки пика функций предпочтения АЭ) об оцениваемой скалярной величине и сообщает центру информацию у е [d;D] о своих представлениях. Итоговое мнение xe[d;D] определяется в соответствии с процедурой планирования p(s), то есть x = n(s).
Относительно процедуры планирования предполагают, что она непрерывна, строго монотонно возрастает по всем переменным и удовлетворяет условию единогласия: Vte[d;D] p(t, t, , t) = t. Без потери общности можно положить d=0, D=1. Если предположить, что каждый из экспертов заинтересован в том, чтобы результат экспертизы - коллективное решение - был максимально близок к его истинному мнению, то в общем случае он может сообщать недостоверную информацию, искренне стремясь повлиять на результат в требуемую с его точки зрения сторону.
Следовательно, возникает проблема манипулируемости механизма экспертизы.
В работах [123, 155] доказано, что для любого механизма экспертизы, удовлетворяющего введенным выше предположениям, существует эквивалентный прямой (неманипулируемый) механизм, причем итоговое мнение в равновесии определяется совокупностью истинных мнений экспертов {r}, сообщение которых является П доминантной стратегией, и числами w(p)={wi(p)} , которые вычисляются следующим образом: если собственные представления всех экспертов различны и упорядочены в порядке возрастания, то wk(n) = к(0,0„.30, Ц3.1), k = 0,п . к т-к
При этом равновесное итоговое мнение (коллективное решение) x ищется следующим образом: x (r,w(p)) = max min (wk_1,rk). к=1,П
Подкласс механизмов экспертизы составляют механизмы согласия (которые также могут рассматриваться как разновидность механизмов распределения ресурса - см. ниже) [119, 120, 234, 338]. Основная идея, используемая в механизмах согласия, заключается в том, чтобы эксперты сообщали не просто оценки некоторых величин, а соотносили важность оцениваемого показателя с некоторым общим для всех - так называемым базовым - показателем.
В [119] доказана возможность выделения одного базового показателя из трех, следовательно при организации экспертизы с использованием механизмов согласия возможно разбиение экспертов по тройкам, обеспечивающее неманипулируемость механизма в предположении, что каждый эксперт в той или иной степени заинтересован в определенных итоговых значениях всех показателей.



Многоканальные активные системы

Отдельно следует отметить прикладные модели коллективного стимулирования, основанные на различных системах поощрения в однородных и неоднородных коллективах (бригадах и т.п.), для которых накоплен большой практический опыт использования, а также анализа соответствующих имитационных моделей [294-297, 429].
Описание ряда других частных прикладных моделей стимулирования можно также найти в обзоре [152].

8.8. Механизмы обмена

В современных экономических условиях для предотвращения остановки производства предприятия применяю различные хозяйственные стратегии: в рамках договоров о совместной деятельности создаются различные давальческие схемы, широко распространена система многоступенчатого бартера и т.д. Давальческие схемы характерны и особенно эффективны для технологически взаимосвязанных предприятий, составляющих так называемые производственные цепочки [43, 65, 255, 312-314].
Для их описания с необходимой адаптацией используются общие результаты анализа обменных механизмов [66, 67, 181-184], разрабатываются конкретные модели, методы и алгоритмы построения обменных схем, оптимальных с позиций фирмы оператора. В качестве критериев оптимальности также используются: прибыль от реализации конечной продукции на рынке, продолжительность цикла производственной цепочки (например, оборачиваемость вложений) и риск, связанный с возможным срывом обязательств в каком-либо звене цепочки или со сбоем при реализации на рынке.
Теоретико-игровой анализ механизмов обмена позволяет учесть тенденции занижения участниками обменных коэффициентов, которые определяют количество ресурса, которое участник АС согласен отдать в обмен на единицу требуемого ему ресурса. Перспективным представляется дальнейшее исследование обменных сетей, объединяющих несколько обменных цепочек, изучение роли государства в формировании оптимальных обменных цепочек, а также дальнейшее развитие теоретико-игровых методов анализа этого класса задач.

8.9. Механизмы оперативного управления

Одним из аспектов рассмотрения динамических АС является возможность использование механизмов оперативного управления, которые учитывают наблюдаемую динамику поведения АС и позволяют вносить изменения в условия ее функционирования в режиме реального времени (см. также раздел 6.1).
Наиболее простым вариантом механизма оперативного управления является рассмотрение в каждом периоде времени задачи синтеза механизма управления, оптимального с учетом наблюдаемой реализации. Однако в большинстве случаев адекватными являются динамические модели, в которых задачи, решаемые в каждом периоде, связаны между собой.
Примерами прикладных механизмов оперативного управления, относительно полно исследованные на сегодня в ТАС, являются следующие модели.
В механизмах пересоглашения контрактов обе стороны (центр и АЭ) по мере получения новой информации об условиях функционирования имеют возможность предложить пересмотреть условия контракта [234, 371]. Новый контракт заключается, если условия нового контракта не менее выгодны обеим сторонам, чем условия действующего на текущий момент контракта. Оказывается, что даже в условиях симметричной информированности не всегда уменьшение неопределенности приводит к пересмотру договоренностей.
Задачам перезаключения контрактов посвящено множество работ по теории контрактов (см. обзор [371]), в ТАС же исследования в этой перспективной области начались сравнительно недавно.
Как правило, решение задач анализа и синтеза механизмов управления требует значительных временн'ых затрат, что может вступать в противоречием с требованием принятия решений в реальном режиме времени. Поэтому в механизмах оперативного управления риском центр априори (до начала функционирования системы) вырабатывает набор правил, параметрически зависящих от будущих возможных ситуаций, которые могут сложиться в процессе функционирования АС.
Имея достаточный запас (иногда упрощенных) механизмов на все случаи жизни, центр может оперативно принимать управленческие решения [234] (см. также ссылки на работы по прикладным механизмам управления безопасностью).
При отклонении результатов деятельности АЭ от запланированных центру желательно как можно раньше иметь информацию об этом для того, чтобы своевременно принять соответствующие меры. Механизмы, стимулирующие возможно более раннее информирование центра активными элементами об отклонениях от плана, называются механизмами опережающего самоконтроля.
Идея таких механизмов состоит в том, что наказание (поощрение) АЭ при отклонении реализации от плана меньше (больше), если он своевременно сообщит об отклонениях, что позволит центру либо произвести компенсационные мероприятия, либо скорректировать план [234].
Влияние случайных и неопределенных факторов во многих случаях может приводить к нарушению запланированных сроков работ и их этапов. Для таких случаев центр предусматривает финансовые и материальные резервы и соответствующие компенсационные меры.
Механизмы, реализующие эти компенсационные меры, называются компенсационными механизмами [234].

9. Имитационное моделирование в теории активных систем

Теоретические исследования, связанные с анализом механизмов функционирования организационных систем, сталкиваются с двумя принципиальными проблемами. Прежде всего, это - сложность моделирования организационных механизмов. Вторая сложность вытекает из первой.
Описание поведения человека или коллективов людей в организационной системе при разработке моделей, как наиболее полно отражающих присутствие человека в системе, так и предельно упрощенных, приводит к необходимости формирования определенных гипотез о поведении людей в моделируемой обстановке. Разработка рекомендаций по совершенствованию механизмов функционирования организационных систем основывается на сравнении результатов деятельности этих систем при действии различных механизмов и определении наилучшего результата по заданному критерию.
Естественно, что для такого сравнения должны быть разработаны соответствующие критерии и построены процедуры оценки эффективности организационных механизмов. В ТАС при разработке и исследовании соответствующих моделей необходимо сформулировать гипотезы о поведении, как отдельной личности, так и целого коллектива людей. Математические модели коллективного поведения рассматривались в [44, 195, 368, 384, 409]. После того как гипотеза сформулирована, необходимо ее формализовать, чтобы применять подходящий математический аппарат. В основе оценки эффективности организационного механизма лежит понятие решения игры, которое основывается на формализации механизма функционирования системы и гипотез о поведении людей.
От обоснованности этих гипотез в значительной степени зависит и обоснованность теоретических выводов. А отсюда следует необходимость разработки соответствующих методов экспериментального исследования организационных систем, позволяющих, во-первых, оценить эффективность исследуемого механизма в случае, если теоретически этого не удалось сделать, а во-вторых, повысить обоснованность теоретических оценок и выводов путем экспериментальной проверки соответствия принятых гипотез поведению реальных людей.
К такому методу экспериментального исследования организационных систем относится метод имитационных игр.
Фактически имитационная игра выступает как экспериментальное средство исследования модели организационной системы в тех случаях, когда теоретическое исследование слишком сложно или для принятых гипотез не удалось подобрать достаточно обоснованных аргументов. Одновременно с этим, ТАС предоставляет возможности провести теоретическое исследование имитационной игры, позволяя заранее более или менее точно оценить (предсказать) ее результаты при тех или иных правилах игры.
Рассматриваемые в ТАС имитационные игры, с помощью которых проводится экспериментальное исследование функционирования организационных систем с целью повышения обоснованности теоретических оценок и выводов и оценки эффективности исследуемых механизмов, построены по типовой схеме. Основой для построения этих игр служат математические модели соответствующих задач и общая для всех этих игр схема обмена информацией между элементами системы, описанная выше.
Методология игрового имитационного моделирования изложена в [123, 132, 191, 223, 227, 273, 333, 345, 350, 422].
Во всех моделях описание игры соответствует описанию организационной системы. Как отмечалось выше, в ТАС описание любой организации состоит из описания ее частей - структуры системы, модели ограничений на возможные состояния элементов системы и системы в целом и механизма функционирования.
Соответственно, описанию структуры организационной системы соответствует описание структуры имитационной игры. При этом роль центра исполняет ведущий (или ЭВМ, если игра проводится в машинном варианте), а активным элементам соответствуют участники игры или автоматы, если игра проводится с участием автоматов. Вторая составляющая описания - это модели, описывающие ограничения на возможности отдельных игроков при достижении целей, поставленных в игре.
Наконец, понятию механизма функционирования или организационного механизма при описании имитационной игры соответствует сразу два понятия -правила игры и оценка результатов игры.
Под правилами игры понимается описание последовательности действий участников игры, порядка и способов обмена информацией между ведущим и командами, процедур принятия решений ведущим и, наконец, процедура определения выигрышей команд. В ТАС эта часть описания механизма функционирования в узком смысле, связана со способами формирования данных, процедурой выработки управляющих воздействий и системой стимулирования.
Оценка результатов игры может пониматься и более широко в зависимости от целей игры (например, оценка соответствия реального поведения участников игры принятым гипотезам, оценка степени отклонения состояния системы, определяемой состояниями, выбираемыми участниками игры, от состояния системы в некоторой равновесной ситуации, полученной при теоретическом исследовании модели). Методика организации и проведения деловых и имитационных игр, а также опыт их использования в процессе обучения, отражены в [74, 173, 175, 176, 339, 351, 354, 422, 428].
Теоретико-игровая оценка эффективности организационного механизма и других его характеристик (степень достоверности информации, степень совпадения прогнозируемых показателей с фактическими) дополняется реально полученными в процессе игры значениями соответствующих показателей, которые позволяют с более высокой степенью точности провести оценку эффективности механизма функционирования.
Теория организационного управления и имитационные игры вместе образуют взаимно дополняющую совокупность методов теоретического и экспериментального исследования организационных систем. Это достигается путем использования единого языка, как при описании игры, так и при описании организационной системы, которая моделируется при помощи игры.
Фактически, имитационная игра выступает как экспериментальное средство исследования модели организационной системы в тех случаях, когда теоретическое исследование слишком сложно или принятые гипотезы не достаточно обоснованы. С другой стороны, теория активных систем выступает как инструмент теоретического исследования имитационной игры, позволяя заранее оценить (предсказать) ее результаты при тех или иных правилах игры.
Описания конкретных игр и результатов моделирования приведены в [75, 113, 123, 163, 172, 187, 210, 211, 228, 311, 315, 340, 344, 355, 356, 424, 427].

10. Опыт практического использования прикладных моделей

Полученные в ТАС теоретические результаты нашли свое применение при создании прикладных моделей (см. краткий обзор выше), которые, в свою очередь, использовались на практике при синтезе или модификации механизмов управления реальными социально-экономическими системами. Следует отметить, что многие классы одних и тех же прикладных механизмов с соответствующими модификациями использовались при решении самых разных прикладных задач.
Ниже перечисляются основные работы, содержащие описание методик внедрения и опыта практического использования прикладных моделей.
Обширной областью применения результатов ТАС стали механизмы управления проектами (УП), охватывающие большинство задач УП и используемые на протяжении всего жизненного цикла проекта [232, 234, 255, 319, 339, 364, 367].
Другой областью являются организационные и экономические механизмы управления безопасностью сложных систем [69, 98, 101, 118, 126, 179, 257, 274, 275, 280, 379, 383, 430], в том числе -создаваемые в рамках Федеральной Программы Безопасность.
Богатый опыт был накоплен в ТАС по реализации механизмов управления развитием приоритетных направлений науки и техники [119, 120, 180, 206, 311, 338, 402, 417], в том числе -разрабатываемых совместно с Миннауки РФ.
Интересную, как с содержательной, так и с методической точки зрения, область представляют механизмы управления качеством подготовки специалистов [236], которые, с одной стороны, ориентированы на эффективное управление образовательными системами, а с другой стороны использовались, совместно с имитационными играми, в качестве содержания и форм учебного процесса (см. выше).
Многоканальные механизмы управления внедрялись на предприятиях черной металлургии [7, 23, 310, 321], в
здравоохранении [21, 22, 72, 390] и в процессах обучения [15, 16, 321].
Противозатратные и конкурсные механизмы использовались в Институте проблем управления и на некоторых предприятиях и научных институтах Минрадиопрома [123, 207, 259, 330].
Макроэкономические модели и модели межотраслевого управления с позиций ТАС исследовались в [159, 160, 168, 309, 361].
Согласованные и другие механизмы управления широко использовались на добывающих и перерабатывающих предприятиях [71, 282, 398], предприятиях черной металлургии [283, 302] и радиопромышленности [1, 41, 73, 100, 161, 247, 261], в системах типа поставщик-потребитель [55, 166, 198, 241, 331, 332, 352], а также в управлении водохозяйственными [102, 122, 123, 204, 290, 362] и транспортными системами [158, 209, 347, 348, 353].
Системы планирования и управления промышленным производством рассматривались в [55, 92, 93, 105, 108, 114, 226, 252, 262, 281, 289, 298, 306, 349], исследования хозяйственного механизма - в [76, 80, 117, 164, 170, 269-272, 357].
Процедуры комплексной оценки применялись в научных организациях [35, 36, 128, 139, 254, 265, 320, 419, 426] и в системе Минрадиопрома [115, 116, 162, 202, 203, 334, 423].

11. Перспективные направления исследований

В заключение настоящего обзора основных постановок и результатов теории активных систем перечислим перспективные направления будущих исследований.
Введенная выше система классификаций задач управления АС, во-первых, позволила достаточно полно охарактеризовать рассматриваемую предметную область. Во-вторых, она дала возможность провести обзор известных подходов.
И, наконец, в третьих, выявила белые пятна, которые и являются потенциальными предметами будущих исследований.
Стоящие перед ТАС на сегодняшний день задачи можно условно разделить на организационные и научные. Организационные задачи - популяризация ТАС, подготовка специалистов, установление более тесных содержательных и информационных связей с близкими разделами теории управления социально-экономическими системами (см. их перечисление выше) и др.
Более важными являются научные задачи - исследование новых классов механизмов управления АС, среди которых выделим общие теоретические задачи (систематическое перечисление частных теоретических задач выходит за рамки настоящей работы, да и, наверное, нецелесообразно, в силу многообразия подходов и индивидуальных мнений ученых) и прикладные задачи - разработки конкретных, ориентированных на практику, механизмов управления.
Общие теоретические задачи:
- адекватного учета и дальнейшего развития в формальных моделях современных представлений психологии, экономики и социологии;
- анализа и синтеза механизмов управления в условиях возможности образования коалиций участниками АС;
- исследования механизмов управления АС, функционирующими в условиях неопределенности (в первую очередь - смешанной неопределенности);
- разработки моделей и методов синтеза состава и структуры АС, в том числе - многоуровневых и сетевых структур управления;
- изучения механизмов управления в АС с сильно связанными АЭ при использовании различных концепций равновесия и различных предположений о рациональном поведении АЭ;
- получения необходимых и достаточных условий неманипулируемости механизмов планирования общего вида;
- анализа условий оптимальности правильных (согласованных и неманипулируемых) механизмов управления;
- изучения АС с предпочтениями АЭ и центра, задаваемых в виде метризованных и других отношений;
- теоретического исследования устойчивости решений задач управления активными системами и адекватности моделей АС реальным организационным системам;
- исследования АС с векторными структурами систем управления - АС с распределенным контролем, векторными предпочтениями АЭ и др.
Важнейшей прикладной задачей ТАС на сегодняшний день, пожалуй, является унификация описания частных механизмов управления, создание информационной базы, содержащей как прикладные (ориентированные на использование неспециалистом по исследованию операций) компьютерные программы, реализующие эти механизмы, так и систематизированное описание имеющихся результатов их практического использования.
Естественно, полученные в ТАС и отраженные в настоящей работе теоретико-игровые модели механизмов управления организационными системами не следует рассматривать как исчерпывающие все многообразие проблем управления - с одной стороны практика постоянно ставит перед учеными все новые проблемы, с другой стороны, к сожалению, решены не все даже уже поставленные задачи - нашей целью было дать лишь временной срез современного состояния ТАС. Дальнейшее успешное решение теоретических и практических задач возможно только совместными усилиями математиков, психологов, экономистов, социологов и представителей других отраслей науки.
Можно надеяться, что объединению этих усилий отчасти будет способствовать приводимая ниже библиография.
БИБЛИОГРАФИЯ
1. Абдушешвили Г.З. Методологические аспекты автоматизации календарного планирования основного производства (на заводе УВМ г. Тбилиси) / Материалы республиканской научно-технической конференции по вопросам вычислительной техники.
Тбилиси, 1974.
2. Абдушешвили Г.З. Некоторые вопросы использования ЭВМ во внутризаводском оперативном планировании на приборостроительных предприятиях / Труды проблемной лаборатории автоматики и вычислительной техники.
Тбилиси.
1975. 5.
3. Абдушешвили Г.З., Бурков В.Н., Горгидзе А.Я., Горгидзе И.А. Некоторые проблемы оптимального распределения ресурсов / Труды Всесоюзной школы-семинара по управлению большими системами.
Тбилиси, 1973.
4. Абдушешвили Г.З., Бурков В.Н., Горгидзе И.А., Ловецкий С.Е. Об одной задаче выбора экстремальных путей // Сообщения АН ГССР. 1973.
Т. 71. 3.
5. Авдеев В.П., Андрусевич В.В., Еналеев A.K. Динамика модели оператор-советчик оператора" / Механизмы функционирования организационных систем. Теория и приложения.
М.: ИПУ, 1982. С. 88 - 92.
6. Авдеев В.П., Белостоцкий А.А., Мышляев Л.П. Оперативный анализ и стимулирование человеко-машинного взаимодействия в промышленных системах // Приборы и системы управления. 1978.
1. С. 10 - 12.
7. Авдеев В.П., Берлин А.А., Кулаков С.М. О формировании первичной информации в активных системах управления металлургическими объектами / Сборник докладов Всесоюзной школы-семинара по управлению большими системами.
Тбилиси: Мецниереба, 1976. С. 118 - 124.
8. Авдеев В.П., Берлин А.А., Мышляев Л.П. Алгоритмы оценки эффективности оперативного управления // Известия ВУЗов. Черная металлургия.
1976. 12.
С. 138 - 142.
9. Авдеев В.П., Бурков В.Н., Еналеев A.K., Мышляев Л.П., Пинтов А.В. Двухканальная активная система с переменной структурой // Известия Вузов.
Черная металлургия. 1982.
8. С. 100 - 106.
10. Авдеев В.П., Бурков В.Н., Еналеев А.К.
Многоканальные активные системы // Автоматика и Телемеханика. 1990.
11.
11. Авдеев В.П., Бурков В.Н., Еналеев А.К. Многоканальные
конкурсные механизмы в активных системах / Всесоюзный научно-практический семинар Опыт использования
распределенных систем управления технологическими процессами и производством. Новокузнецк: ВСНТО, 1986.
12. Авдеев В.П., Бурков В.Н., Еналеев А.К., Изаак К.И., Кузнецов А.Ф., Киселева Т.В.
Организационная оптимизация человеко-машинного взаимодействия в автоматизированных технологических комплексах / Создание и внедрение автоматизированных и автоматических систем управления непрерывными и дискретно-непрерывными технологическими процессами. М.: НТО Приборпрома, 1983.
13. Авдеев В.П., Бурков В.Н., Еналеев А.К., Киселева Т.В. Многоканальные организационные механизмы (Опыт применения в АСУ).
М.: ИПУ, 1986.
14. Авдеев В.П., Бурков В.Н., Еналеев А.К., Киселева Т.В., Кузнецов А.Ф. Двухканальный организационный механизм функционирования автоматизированных систем / Неопределенность, риск, динамика в организационных системах.
М.: ИПУ, 1984. С. 24 - 31.
15. Авдеев В.П., Бурков В.Н., Еналеев А.К., Киселева Т.В., Кузнецов А.Ф., Щепкин А.В. Состояние и перспективы развития многоканальных игровых обучающих систем /
Modemizace vyucovacino procesu na vysokych skolach a pri vichove a vzdelavani dospelych. Praha, 1986.
16. Авдеев В.П., Бурков В.Н., Еналеев А.К., Киселева Т.В., Кулагин Н.М., Кулаков С.М., Михалева Т.Г. Имитационные обучающие системы с многовариантной структурой / Содержание, формы и методы обучения в высшей школе: обзорная информация. Вып.
2. М.: НИИВШ, 1990.
17. Авдеев В.П., Бурков В.Н., Еналеев А.К., Кондратьев В.В., Мышляев Л.П. Организационное управление с использованием нормативной модели / Синтез механизмов управления сложными системами.
М.: ИПУ, 1980. С. 15 - 23.
18. Авдеев В.П., Бурков В.Н., Еналеев А.К., Кондратьев В.В., Мышляев Л.П. Процедуры человеко-машинного взаимодействия в АСУ // Известия ВУЗов.
Черная металлургия. 1980. 4.
19. Авдеев В.П., Бурков В.Н., Еналеев А.К., Мышляев Л.П., Пинтов А.В. Двухканальная активная система с переменной структурой // Известия ВУЗов.
Черная металлургия. 1982.
6. С.100 - 106.
20. Авдеев В.П., Бурков В.Н., Еналеев А.К., Пинтов А.В.
Взаимодействие в активных многоканальных системах / Планирование, оценка деятельности и стимулирование в активных системах. М.: ИПУ, 1985.
21. Авдеев В.П., Бурков В.Н., Еналеев А.К., Пинтов А.В.
Метод активной многоканальной организации выработки решений в здравоохранении / Всесоюзная конференция Нечисловая статистика, экспертные оценки и смежные вопросы. М.: ВИНИТИ, 1984.
22. Авдеев В.П., Бурков В.Н., Колтун В.З., Пинтов А.В. Здоровье трудовых коллективов как система управления / Всесоюзная конференция Теория, методология и практика системных исследований.
Москва, 1984.
23. Авдеев В.П., Бурков В.Н., Мышляев Л.П. К развитию человеко-машинного взаимодействия // Известия ВУЗов.
Черная металлургия. 1980.
4. С. 139 - 143.
24. Авдеев В.П., Еналеев A.K., Мышляев Л.П., Опойцев В.И. Стимулирование человека-оператора в условиях АСУ ТП / Механизмы функционирования организационных систем. Теория и приложения.
М.: ИПУ, 1982. С. 66 - 74.
25. Авдеев В.П., Еналеев А.К., Зельцер С.Р., Мышляев Л.П.
Натурно-математическое моделирование в деловых играх и промышленных исследованиях / Деловые игры и имитационное моделирование. 16-й семинар ИФАК/ИСАГА.
М.: ИПУ, 1985.
26. Авдеев В.П., Еналеев А.К., Киселева Т.В.
Competitive mechanisms in multichannel active systems / Preprints of 11th IFAC World Congress Automatic Control in the Service of Mankind. Tallinn, 1990.
27. Авдеев В.П., Еналеев А.К., Мышляев Л.П., Опойцев В.И. Стимулирование производственного персонала в АСУТП / Механизмы функционирования организационных систем.
М.: ИПУ, 1982. С. 66 - 75.
28. Айдарханов М.Б., Арсланов М.З., Мурзахметов А.Б. Согласованная оптимизация в активных системах: многокритериальность нечеткость, связь с векторной оптимизацией / Проблемы информатики и управления.
Алма-Ата: Гылым, 1995. С. 3 - 12.



Структура трехуровневой активной системы

Приведем ряд необходимых и достаточных условий сообщения достоверной информации как доминантной стратегии. Необходимым и достаточным условием сообщения достоверной информации как доминантной стратегии при любых идеальных точках является существование множеств Xi(s_i), для которых выполнены условия совершенного согласования [137, 169].
Напомним, что Xi(s.i) - множество допустимых планов i-го АЭ, которое в соответствии с условиями приведенного выше результата зависит от сообщений остальных элементов s-i и не зависит от сообщения si i-го АЭ. Рассмотрим механизм с сильными штрафами за отклонение состояния от плана, то есть механизм с полной централизацией планирования [84, 148, 195].
Пусть множество допустимых планов представимо в виде: $ Di(s-i): Xi(s-i) = Xi n Di(s-i) Ф 0. В [137] доказана теорема о том, что для того, чтобы механизм с сильными штрафами обеспечивал сообщение достоверной информации как доминантной стратегии при любых точках пика, необходимо и достаточно, чтобы: 1) существовали множества Di(s-i); 2) выполнялись условия совершенного согласования. Соответствующие вычислительные процедуры рассматривались в [136, 138, 145, 318].
Интересным и перспективным представляется предложенный в [240] геометрический подход к получению достаточных условий неманипулируемости путем анализа конфигураций множеств диктаторства. В рамках этого подхода уже удалось получить ряд конструктивных условий индивидуальной и коалиционной неманипулируемости механизмов планирования в АС.
Достоверность сообщаемой информации при использовании принципа ОУ при условии, что множество допустимых планов АЭ не зависит от сообщаемой им оценки, интуитивно обосновывает рассмотрение систем с большим числом элементов. Пусть часть плановых показателей 1 является общей для всех элементов, то есть номенклатура плана имеет вид p = (1, {xJ). Если искать управления 1, выгодные для всех элементов системы (как это делается при использовании принципа согласованного планирования), то возникает принципиальный вопрос о существовании решения.
Такого рода проблем не возникает в системах с большим числом элементов, когда влияние оценки отдельного элемента на общее управление мало. Если при сообщении своей оценки у- каждый АЭ не учитывает ее влияния на 1(s), то считается выполненной гипотеза слабого влияния (ГСВ).
При справедливости ГСВ необходимо согласовывать планы только по индивидуальным переменным. В [84, 123, 137] доказано, что если выполнена ГСВ и компоненты x(s) плана удовлетворяют условиям совершенного согласования, то сообщение достоверной информации является доминантной стратегией.
В [84, 242] приведены условия выполнения гипотезы слабого влияния и для ряда примеров показано, что при достаточно большом числе элементов в системе это условие выполняется.
До сих пор мы интересовались, в основном, условиями сообщения достоверной информации. Возникает закономерный вопрос: как соотносятся такие свойства механизма
функционирования как неманипулируемость и оптимальность? Иначе говоря, всегда ли среди оптимальных механизмов найдется неманипулируемый и, соответственно, всегда ли среди неманипулируемых механизмов содержится хоть один оптимальный.
Получить ответ на этот вопрос необходимо, так как, быть может, не обязательно стремиться к обеспечению достоверности информации, лишь бы механизм имел максимальную эффективность. Поэтому приведем ряд результатов по оптимальности (в смысле максимальной эффективности) механизмов открытого управления (см. также условия неманипулируемости ^согласованных механизмов в [195]).
Известно [142, 155], что в АС с одним активным элементом для любого механизма существует механизм открытого управления не меньшей эффективности.
Для систем с большим числом элементов результат об оптимальности механизмов открытого управления справедлив лишь для ряда частных случаев. Например, аналогичные результаты были получены для механизмов распределения ресурса [123, 194, 243] и для механизмов выработки коллективных экспертных решений (задач активной экспертизы) [123, 155] (см. также ниже описание базовых механизмов ТАС).
Более общие, но достаточно громоздкие достаточные условия неманипулируемости, обобщающие результаты по механизмам распределения ресурса и механизмам активной экспертизы, приведены в [375, 376].
Если в рамках ГСВ ввести дополнительное предположение, что план x(s) может быть представлен в виде функции от общего управления l(s) и сообщения si, то при Xi =Xi(s_i) на множестве таких механизмов существует оптимальный механизм ОУ [123, 243, 315] (см. также выше). Оптимальность механизма ОУ имеет место также на множестве механизмов с сильными штрафами. Анализ законов ОУ в задачах распределения ресурса проведен в [242].
В этой работе также вводится ряд условий на законы управления (названные законами минимально разумного управления), обеспечивающих асимптотически оптимальное распределение ресурса в точке равновесия Нэша с ростом числа элементов.
Полученные в ТАС результаты о связи оптимальности и неманипулируемости механизмов вселяют некоторый оптимизм, в том смысле, что эти два свойства не являются взаимно исключающими. В то же время ряд примеров (см., например, [84, 153, 233, 240, 376]), свидетельствуют о неоптимальности в общем случае механизмов, обеспечивающих сообщение элементами достоверной информации.
Вопрос о соотношении оптимальности и неманипулируемости в общем случае остается открытым.
Неманипулируемость механизма функционирования является одним из основных его свойств, изучаемых в теории коллективного выбора. Сравнительный обзор основных результатов, полученных отечественными и зарубежными авторами в этой области, приведен в [153].
Выше при рассмотрении механизмов стимулирования в АС согласованными были названы механизмы, побуждающие АЭ к выполнению планов. В АС, в которых стратегией АЭ является как выбор сообщений, так и действий (комбинация задач стимулирования и планирования - см. формальное описание в [195]), механизмы, являющиеся одновременно согласованными и неманипулируемыми, получили название правильных. Значительный интерес представляет вопрос о том, в каких случаях оптимальный механизм можно искать в классе правильных механизмов.
Ряд достаточных условий оптимальности правильных механизмов управления АС приведен в [149, 195, 376, 382]. Также следует отметить результаты исследования механизмов критериального управления [84, 323, 342, 346], при использовании которых центр выбирает целевую функцию АЭ из заданного класса.
6. Расширения базовой модели
Под расширениями базовой модели управления активными системами понимаются рассматриваемые ниже динамические активные системы (функционирующие в течение нескольких периодов времени), многоуровневые активные системы и активные системы, функционирующие в условиях неопределенности (см. классификацию задач управления АС выше).
6.1. Динамические активные системы
Интуитивно понятно, что при таком естественном обобщении простейшей базовой (статической) модели, как рассмотрение нескольких несвязанных периодов функционирования, задачу управления удается декомпозировать, развалив ее на набор базовых. Трудности появляются при исследовании систем со связанными периодами функционирования. Методы и алгоритмы решения задачи синтеза оптимального механизма управления в этом случае характеризуются высокой структурной и вычислительной сложностью. Как правило, универсального подхода к аналитическому решению этого класса задач найти не удается.
Однако, преодоление трудностей анализа оправданно, так как в динамических АС присутствуют новые качественные свойства, отсутствующие в базовой модели (не говоря уже о том, что большинство реальных организационных систем функционируют достаточно долго).
Динамические АС, функционирующие в течение длительного времени, существенно отличаются от статических: возможность адаптации, сглаживания влияния случайных параметров на результаты деятельности АЭ, пересмотра стратегий - все эти эффекты появляются при переходе от статических к динамическим АС. Основными характеристиками динамических моделей являются степень учета игроками будущего и конечность или бесконечность игры. Модели, учитывающие дальновидность АЭ - способность спрогнозировать будущие последствия принимаемых сегодня решений, гораздо труднее поддаются анализу, нежели чем модели с недальновидными АЭ, но, в то же время, являются более адекватными действительности.
В бесконечных играх (бесконечное повторение одношаговых игр) центр имеет больше возможностей по управлению элементами, в отличие от конечных игр, в которых в последние периоды АЭ может, не опасаясь будущего наказания, делать что ему заблагорассудится [276, 371]. Отметим, что используемые здесь и далее термины конечная и бесконечная (игра) характеризуют не множества допустимых стратегий АЭ, а число периодов функционирования АС.
Содержательно, качественное отличие повторяющихся (многопериодных) игр от обычных (статических, однопериодных) заключается в том, что наличие нескольких периодов повышает ответственность игроков за свои действия - если кто-то повел себя не так как следовало, то в следующих периодах он может быть наказан остальными игроками за это отклонение. Для того, чтобы
предотвращать отклонения, наказание должно быть достаточно сильным и компенсировать возможный выигрыш игрока, который тот получает отклоняясь. Переключение с нормального режима на наказание (и быть может возвращение к исходному режиму через несколько периодов) получило название триггерной стратегии.
Примеры того, как строить триггерные стратегии и того, как определить наилучший момент переключения (ведь не всегда можно достоверно установить факт отклонения), приведены в [371].
Существенной в повторяющихся играх оказывается информированность игроков. Если все игроки наблюдают все стратегии, выбранные партнерами в прошлом, то говорят, что имеет место полная информированность [371]. Если же стратегии, выбираемые в прошлом, ненаблюдаемы, а есть другая информация, например, если наблюдаемы полезности игроков, то имеет место неполная информированность.
При полной информированности в суперигре (последовательности однопериодных игр) может существовать равновесие Нэша, доминирующее по Парето равновесие Нэша однопериодной игры. Если игроки не дисконтируют будущие полезности, то множества равновесных векторов полезностей в однопериодной и многопериодной игре совпадают.
Если игроки дисконтируют будущие полезности, то все равновесия суперигры, в принципе, могут быть неэффективны (по Парето), хотя, обычно, при условии, что дисконтирующие множители не очень малы, существуют равновесия суперигры, доминирующие по Парето однопериодные [276, 336, 371].
В теории активных систем исследование динамики функционирования проводилось, в основном, для следующей модели [31, 410, 425]. В активной системе, состоящей из центра и одного АЭ, целевая функция центра в периоде t имеет вид Ft(xt,yt), а активного элемента: ft(xt,y), xt - план на период t, yt - действие, выбранное АЭ в этом периоде. Траектория x = (x1t x2, , xT) называется плановой траекторией, а траектория y = (y1t y2, , yT) -траекторией реализаций.
Как и в одноэлементной статической задаче, центр выбирает систему стимулирования и устанавливает планы (на каждый период), а АЭ выбирает действие, максимизирующее его целевую функцию. Возникает вопрос - что понимать под целевой функцией АЭ в этой повторяющейся игре.
Если допустимые множества не изменяются со временем и АЭ вообще не учитывает будущего (недальновидный АЭ), то задача сводится к набору статических задач.
Достаточно детально в ТАС были изучены так называемые активные системы с динамикой модели ограничений [32, 40, 195, 414, 416]. Изменение модели ограничений (допустимых множеств) со временем учитывается зависимостью множества допустимых действий АЭ в периоде t от его действий в предыдущем периоде и от плана текущего периода, то есть At = At(xt, yt-1), t = 2,T, A1 = Aj(xj).
Таким образом, при известной плановой траектории недальновидный АЭ будет решать задачу поиска траектории реализаций: ft(xt,y)® max , t = 2,T. Целевая функция
yt eAt(xt,yt-i) I дальновидного АЭ имеет вид: gt = ft(xt,y) + X d k fk(xk,yk), где d - k=t+1
коэффициент дисконтирования. Для верхнего индекса суммирования возможны следующие варианты: I = t + N (фиксированный горизонт) - АЭ учитывает N будущих периодов, I = T - АЭ учитывает все будущие периоды и т.д. [425, 426, 432].
То есть дальновидный АЭ в каждом периоде t решает задачу выбора реализаций (действий - yt, yt+1, ) с целью максимизации gt. Задача центра заключается в выборе плановой траектории, т максимизирующей его целевую функцию, имеющую вид: X d t
t=i
Ft(xt,yt), считая, что реализации будут совпадать с планами. Если АЭ и центр имеют различные степени дальновидности (N + 1 T), то АЭ не может построить прогноз на весь плановый период.
В работах [425, 426] приведены условия на распределения дальновидностей, обеспечивающие совпадение реализации с планом, и показано, что динамическую задачу удается свести к статической, решаемой в расширенном пространстве параметров.
При решении задачи планирования центр может предполагать, что реализации совпадут с планами. Известно, что достаточным условием согласованности системы стимулирования в статической АС является, например, выполнение неравенства треугольника для функций штрафов. Для согласованности в динамической модели достаточно выполнения неравенства треугольника для взвешенных сумм штрафов.
Если в течение нескольких периодов штрафы не являются согласованными, то для согласования в динамике достаточно существования сильных штрафов в будущем [426].
Рассмотренная выше модель ограничений зависела от параметров, выбираемых участниками системы. Однако возможны случаи, когда допустимые множества зависят от случайных параметров (или когда, как в повторяющихся играх при неполной информированности, не все выбираемые стратегии наблюдаемы).
Следовательно, возникает задача идентификации, решаемая при использовании адаптивных механизмов функционирования [31-39, 104, 263, 266-268, 407-416].
Суть механизмов адаптивной идентификации заключается в использовании центром информации о планах, реализациях и т.д. дальновидного АЭ для оценки параметров его модели ограничений, прогноза состояний, поощрения и т.д. Пусть множество возможных действий зависит от неизвестного центру потенциала АЭ, а потенциал, в свою очередь, зависит от управления со стороны центра и некоторой случайной величины. На основании наблюдаемой реализации центр может определить оценку потенциала с помощью той или иной рекуррентной процедуры прогнозирования [410].
Примером решения задачи адаптивного планирования может служить модель динамического простого АЭ, подробно описанная в [84].
При исследовании адаптивных механизмов возникают задачи выбора наилучшей процедуры прогнозирования; синтеза механизма, при котором АЭ полностью использует свой потенциал (такие механизмы получили название прогрессивных [408, 410, 413]); определения реальности плановых траекторий; синтеза оптимального механизма управления и т.д.
Основной вопрос, возникающий при изучении динамических контрактов (подкласса моделей стимулирования), заключается в выяснении преимуществ, которыми обладает динамический контракт со связанными периодами и памятью (в контракте с памятью вознаграждение в текущем периоде зависит от результатов текущего и предыдущих периодов), по сравнению с последовательностью обычных однопериодных контрактов. Обычно в моделях рыночной экономики предполагается, что если число АЭ велико, то игра некооперативная, а если мал'о, то -кооперативная.
В динамических моделях возможность кооперации появляется именно из-за динамики - элементы имеют время договориться и наказать тех, кто отклоняется от соглашений [371].
Решение однопериодной задачи - равновесные по Нэшу платежи (значения целевых функции центра и АЭ), как правило, неэффективны и доминируются по Парето другими платежами. Следовательно, в последовательности однопериодных контрактов (игр) средние платежи равны равновесным по Нэшу, а в динамическом контракте они могут достигать или приближаться к Парето оптимальным значениям (см. также выше).
Обычно результаты об оптимальности (достижимости Парето-решения) требуют бесконечного повторения однопериодных игр, а для конечного числа периодов доказывается е-оптимальность. При отсутствии дисконтирования любое индивидуально-рациональное распределение выигрышей в однопериодной игре является достижимым и Парето оптимальным распределением выигрышей в суперигре [276, 371].
В то же время, если в однопериодном контракте центр может достаточно сильно наказывать АЭ (соответствующие условия на ограничения механизма стимулирования приведены в [234, 371]), то последовательное заключение краткосрочных контрактов оказывается не менее эффективно, чем заключение долгосрочного контракта. Иными словами, если долгосрочный контракт реализует некоторую последовательность действий, то при достаточно сильных штрафах, существует оптимальная последовательность краткосрочных контрактов, реализующая ту же последовательность и дающая всем участникам те же значения ожидаемой полезности.
Содержательно, возможная сила штрафов должна быть такова, чтобы за их счет достаточно сильно наказать АЭ за отклонение именно в однопериодном контракте (в динамике эту роль играют стратегии наказания, используемые в следующих периодах).
6.2. Многоуровневые активные системы
С одной стороны, во многих основополагающих работах по теории управления организациями подчеркивается необходимость исследования именно иерархических АС, а с другой стороны подавляющее большинство исследований формальных моделей ограничивалось двухуровневыми расширениями базовой модели. Исключениями для ТАС являются следующие перечисляемые ниже работы.
Исторически, в теории активных систем неоднократно производились попытки обобщения результатов исследования двухуровневых моделей на случай многоуровневых систем, однако в итоге дело, к сожалению, ограничивалось лишь качественным обсуждением или формулировкой частных задач [84, 87, 147, 195, 242, 329]. В теории иерархических игр рассматривались задачи точного агрегирования, задачи с двумя управляющими органами и модели кооперации (образования коалиций между элементами нижнего и промежуточного уровней) в трехуровневой системе [276, 279, 336].
Одной из первых попыток относительно систематического изучения многоуровневых АС явилась монография [363].
Рассмотрим трехуровневую активную систему, состоящую из одного центра - на верхнем уровне иерархии, n промежуточных центров {Ц} на втором уровне, j=1,n, и N управляемых объектов -
_ _ n активных элементов {АЭ^}, i =1,nj, j=1,n, ^nj = N, на нижнем j=1 уровне (см. рис.2).
Будем считать, что каждый АЭ подчинен одному и только одному центру промежуточного уровня, то есть структура подчиненности в рассматриваемой АС имеет вид дерева. Совокупность центра Ці промежуточного уровня и nj подчиненных ему АЭ называют j-ой подсистемой, совокупность центра и промежуточных центров называют метасистемой.
Было установлено, что влияние изменения централизации (то есть централизация или децентрализация АС) на эффективность управления вызвано действием следующих, присущих многоуровневым системам, факторов.
Фактор агрегирования (А) заключается в изменении информированности участников системы в результате агрегирования информации о состояниях и поведении конкретных АЭ, подсистем и т.д. по мере роста уровня иерархии.
Метасистема
Структура трехуровневой активной системы

Рис.2. Структура трехуровневой активной системы веерного типа
Экономический фактор (Э) заключается в изменении ресурсов управления (ограничений механизмов управления, множеств допустимых стратегий и т.д.) при введении новых участников (АЭ, промежуточных управляющих органов и т.д.), обладающих собственными интересами, то есть участников, либо привносящих новые ресурсы управления, либо потребляющих часть имеющихся ресурсов.
Фактор неопределенности (Н) заключается в изменении информированности участников АС о существенных внутренних и внешних параметрах их функционирования (в том числе - в изменении неопределенности в субъективных оценках ситуации) в результате изменения состава системы, ее структуры (информационных и других связей между участниками АС) и т.д.
Организационный фактор (О) заключается в изменении отношения власти, то есть возможности влияния на деятельность элементов системы. В частности, власть как система поощрений и штрафов позволяет добиться преобладания коллективного интереса над индивидуальными целями.
Информационный фактор (И) заключается в изменении информационной нагрузки на участников АС и вызван, в первую очередь, объективной ограниченностью их способностей по передаче и переработке информации.
Строки таблицы содержат факторы, которые оказывают влияние, столбцы - факторы, на которые оказывается влияние. Если на пересечении i-ой строки и j-го столбца стоит символ , то i-ый фактор не оказывает непосредственного влияния на j-ый, если стоит символ - , то - оказывает.
В работе [363] получены достаточные условия идеального агрегирования в задачах стимулирования в трехуровневых АС, а также доказана произвольная децентрализуемомъ анонимных механизмов распределения ресурса, механизмов экспертизы, механизмов внутренних цен, а также некоторых механизмов страхования.
Возможные нарушения принципа единоначалия, то есть рассмотрение АС, в которых АЭ подчинен одновременно нескольким центрам, изучались при исследовании АС с распределенных контролем [363, 406]. Этот класс АС требует дальнейших систематических исследований.
6.3. Активные системы, функционирующие в условиях неопределенности
В соответствии с введенной выше классификацией АС, функционирующие в условиях неопределенности могут быть классифицированы по: информированности участников
(симметричная - С, асимметричная - А), типу неопределенности (внутренняя и внешняя) и виду неопределенности (интервальная, базовая и нечеткая). Перечисляя все возможные комбинации значений признаков классификации по этим основаниям, получаем двенадцать базовых моделей АС с неопределенностью, которые, совместно с базовой детерминированной моделью условно обозначим М1 - М13.
Таблица 2 содержит описание этих базовых моделей, а также указание на те разделы теории управления, в которых они исследовались (ТК - теория контрактов, ИТИС -информационная теория иерархических систем, ТР - теория реализуемости) и ссылки на основные работы, содержащие результаты изучения соответствующих моделей. Следует подчеркнуть, что в изучении АС с нечеткой неопределенностью ТАС обладает абсолютным приоритетом.
Приводимые в [382] результаты систематического исследования базовых задач стимулирования в АС с неопределенностью свидетельствуют, что в рамках базовых моделей (одноэлементных, статических) механизмов (задач) стимулирования возможен единый методологический подход (исходный принцип, охватывающий всю совокупность используемых методов) к решению задач анализа и синтеза систем стимулирования. Несмотря на многообразие изучаемых моделей, используемый подход заключается в единообразии их описания, общности технологии (совокупности методов, операций, приемов, этапов и т.д., последовательное осуществление которых обеспечивает решение поставленной задачи), и техники (совокупность навыков, приемов, умений, позволяющая реализовывать технологию) исследования, причем последняя основывается, как и детерминированная теория, на изучении множеств реализуемых действий и минимальных затрат на стимулирование.
Поясним последнее утверждение, обобщив описание, технологию и технику построения и исследования моделей механизмов стимулирования как в детерминированных активных системах, так и в АС с различными типами и видами неопределенности.
После описания модели, то есть задания в соответствии с введенными выше параметрами модели и системой классификаций задач управления в АС класса исследуемых активных систем, определяется рациональное поведение АЭ: на основании известных предпочтений АЭ на множестве результатов деятельности (эти предпочтения зависят от используемого центром механизма управления) и имеющейся информации о неопределенных факторах (взаимосвязи между действиями АЭ и результатами его деятельности) определяются предпочтения АЭ на множестве его стратегий (действий и/или сообщаемых оценок). В случае интервальной неопределенности этот переход осуществляется с использованием принципа МГР, в случае вероятностной (нечеткой) неопределенности целевая функция АЭ на множестве результатов его деятельности совместно с распределением вероятностей (нечеткой информационной функцией) индуцирует на множестве допустимых стратегий целевую функцию - ожидаемую полезность (индуцированное нечеткое отношение предпочтения (НОП) и т.д.). Множество выбора (решений игры) при заданном множестве стратегий и предпочтениях АЭ, выражаемых, например, его целевой функцией, НОП и т.д., определяется стандартным образом. В случае, если множество выбора состоит более, чем из одного элемента, необходимо доопределить однозначно (используя ГБ или МГР) выбор АЭ.
Этот выбор будет зависеть от механизма управления, эффективность которого задается значением целевой функции центра на множестве выбора АЭ (если предпочтения центра зависят от неопределенных параметров, то необходимо найти его детерминированную индуцированную систему предпочтений). Следует отметить, что структура предпочтений центра и АЭ (возможность ранжирования стратегий) в большинстве случаев позволяет определять выбор (недоминируемые стратегии) достаточно тривиально.



Тендеры

Возможность обеспечения достоверности сообщаемой экспертами информации появляется также при использовании многоканальных механизмов экспертизы. При использовании нескольких параллельных каналов выработки управляющих воздействий многоканальная структура системы в ряде случаев позволяет снизить имеющуюся неопределенность (см. ниже описание многоканальных механизмов). В частности, при использовании модели управляемой системы, центр имеет возможность оценить какова была бы эффективность управления при реальном использовании предложений каждого из экспертов.
Использование системы стимулирования экспертов, зависящей от этой оценки и реальной эффективности управления, позволяет добиться неманипулируемости механизма. Та же идея используется и в автономных механизмах экспертизы, в которых эксперты самостоятельно (не сообщая каждый центру своих мнений) приходят к согласию относительно коллективного решения и сообщают его центру.
Использование стимулирования, пропорционального эффективности этого коллективного решения также дает возможность обеспечить неманипулируемость автономных механизмов экспертизы [117, 234].
8.3. Механизмы формирования состава и структуры активной системы
Одной из задач управления АС является синтез механизмов управления в широком смысле (см. классификацию выше), включающих механизмы формирования состава АС - в том числе, например, конкурсные механизмы формирования состава АС (тендеры), и структуры АС - в том числе, например, многоканальные механизмы. Кроме того, вопросы синтеза структуры АС изучаются при исследовании многоуровневых АС (см. соответствующий раздел настоящей работы и [363]), а также при исследовании механизмов управления риском (основывающихся на идее функциональной избыточности состава участников АС [233, 234]) на этапе формирования состава АС.

8.3.1. Тендеры

Наблюдаемая в настоящее распространенность, если не сказать мода, использования на практике всевозможных конкурсов, а также приводимые для обоснования их целесообразности качественные рассуждения наталкивают на мысль - быть может честное соревнование действительно является панацеей от многих, если не всех, бед. На самом деле, формальный анализ конкурсных механизмов (которые в случае неделимых объектов конкурса называются тендерами, или дискретными конкурсами) показывает, что не все так просто.
Более корректно тендером (дискретными конкурсами) называется конкурс, в котором победители получают в точности заявленную величину (ресурса, финансирования, выгодный проект и т.д.), а проигравшие не получают ничего. Пусть эффективность участника определяется как отношение оценки социальноэкономического эффекта (точно известной и объективно заданной извне) и сообщенной участником - активным элементом - оценки (требуемого ресурса, затрат и т.д.).
Основная идея простых конкурсов заключается в упорядочении АЭ в порядке убывания эффективностей и выделения им ресурса в требуемом объеме последовательно, пока не закончится весь ресурс. К сожалению, гарантированная эффективность простых конкурсных механизмов равна нулю (точнее - может быть сколь угодно мала) [119, 233, 234].
Несколько лучше обстоит дело в прямых конкурсных механизмах, в которых центр решает задачу о ранце, используя сообщенные АЭ оценки - гарантированная эффективность прямых конкурсов равна 0.5. Несколько более высокой эффективностью обладают двухэтапные конкурсы [233, 234, 338].
Вопрос о максимальной гарантированной эффективности конкурсных механизмов на сегодняшний день остается открытым.
Модели дискретных конкурсов, в которых (с учетом возможного манипулирования информацией со стороны АЭ) решались задачи о назначении (распределении АЭ по работам, проектам и т.д.) описаны в [119, 233, 234, 338].

8.3.2. Многоканальные механизмы

Классическим примером класса моделей управления АС, в которых решаются не только задачи синтеза механизмов управления в узком смысле, но и задачи синтеза структуры системы (которые выше были отнесены к механизмам управления в широком смысле), являются так называемые многоканальные механизмы управления (многоканальные организационные механизмы) [5-27, 123, 177, 303]. Используемый в них подход основывается на введении в состав системы одного или нескольких элементов, с которыми сравнивается функционирование исходного активного элемента.
Стимулирование, основанное на сравнительных оценках (сравнение может производиться, например, с нормативной моделью), как показано для ряда случаев [10, 13, 123], позволяет обеспечивать более эффективное функционирование активной системы.
Многоканальная АС функционирует следующим образом. Активный элемент выбирает свое состояние, в результате этого выбора и действия внешних возмущений на выходе управляемого объекта реализуется некоторый результат деятельности.
Параллельно с этими действиями с помощью нормативной модели определяются нормативные решения. В качестве нормативной модели (второго канала управления) может выступать некоторое правило выбора решений, алгоритм или человек (специалист, эксперт).
Затем информация о результате, выбранном состоянии и решении нормативной модели поступает на вход пересчетной модели управляемого объекта.
Пересчетная модель представляет собой либо математическую модель, либо физическое устройство, позволяющее на основе информации о параметрах системы и управлениях определить оценку результата деятельности, который получился бы, если на вход управляемого объекта вместо действий АЭ поступило бы другое решение. Полученные таким образом величины позволяют вычислить значения показателей эффективности различных решений.
Стимулирование АЭ осуществляется как функция показателей эффективности решений, предложенных им и другими каналами.
Для задач стимулирования в [24, 123, 177] найдены условия, при которых значение целевой функции многоканальной системы больше по сравнению с оптимальной функцией стимулирования для одноканальной АС. Так, например, в [10, 13] рассмотрены схемы взаимодействия между каналами в многоканальных активных системах, для которых показано, что механизмы стимулирования в двухканальных системах могут быть эффективнее, чем оптимальные механизмы стимулирования в одноканальных активных системах, том числе - в условиях неопределенности.
В [11, 26, 123] рассмотрены конкурсные механизмы стимулирования активных каналов в многоканальной активной системе. Доказано, что при определенных условиях схожести активных каналов, эти механизмы обеспечивают эффективность функционирования системы, равную или близкую к эффективности оптимальных механизмов стимулирования, полученных для детерминированных активных систем.

8.4. Механизмы распределения ресурса

Механизмы распределения ресурса составляют обширный и чрезвычайно важный с точки зрения практических приложений класс механизмов управления АС с сообщением информации [84, 86, 88, 91, 113, 123, 171, 234, 243, 385, 391, 394]. При их изучении решаются два основных вопроса - синтеза механизма максимальной эффективности и исследования манипулируемости механизмов планирования, то есть возможности построения для них эквивалентных прямых механизмов.
Механизмы распределения ресурса включают в себя приоритетные, конкурсные и другие механизмы, кратко рассматриваемые ниже в настоящем подразделе.

8.4.1. Неманипулируемые механизмы распределения ресурса

Приведем постановку задачи распределения ресурса в двухуровневой АС [113, 123, 200, 243] (механизмы распределения ресурса в многоуровневых АС рассматривались в [234, 363]). Пусть в распоряжении центра имеется ресурс в количестве R. Задача распределения ресурса подразумевает нахождение такого его распределения между АЭ, которое максимизировало бы некоторый критерий эффективности - например, суммарную эффективность использования ресурса активными элементами. Если эффективность использования ресурса конкретным АЭ не известна центру, то он вынужден использовать сообщения АЭ, например, о требуемых количествах ресурса.
Понятно, что, если имеется дефицит ресурса, то возникает проблема манипулируемости - АЭ могут сообщать центру недостоверную информацию, стремясь получить оптимальное для себя количество ресурса. Перейдем к описанию формальной модели.
Пусть АЭ сообщают центру информацию s, е Q, = [0;D] с Ж1 -заявки на ресурс, i е I. Центр на основании сообщенной ему информации назначает АЭ планы (выделяет ресурс) xi = pi(s,R), где p - процедура распределения ресурса (планирования).
Содержательно, точки пика г, е Ж1 соответствуют оптимальному для них количеству ресурса. Предположим, что выполнена гипотеза n дефицитности: X г, R, а оотносительно процедуры i=1
распределения ресурса будем считать, что Pi(s,R) - непрерывны, строго монотонно возрастают по si и R и строго монотонно убывают по Sj, j Ф i; весь ресурс распределяется полностью: X xi = R; ресурс i делим в произвольных пропорциях, причем любой АЭ может отказаться от ресурса вообще. Классическим примером механизма распределения ресурса является механизм пропорционального распределения: xi = ^R. X Sj =i
В работах [84, 88, 89, 113, 123, 141] доказано, что для любого механизма из рассматриваемого класса механизмов распределения ресурса существует эквивалентный прямой механизм, то есть неманипулируемый механизм, в котором все АЭ сообщают оценки точек пика и получают в равновесии то же количество ресурса, что и в исходном механизме. В этих же работах приведен конструктивный алгоритм построения соответствующего прямого механизма.
Двойственной к задаче распределения ресурса (дохода) является задача распределения затрат [113, 234].

8.4.2. Механизмы обратных приоритетов

Механизмы обратных приоритетов [113, 123] в двухуровневой АС имеют вид: Si, X Si R Xi(s) * mn[Si,ght(Si)],XSi R’ i
где hi(s) - функция приоритета АЭЪ убывающая по его заявке, а параметр g определяется из следующего балансового ограничения: X min[Si, ghi(Si)] = R. i Если используются функции приоритета вида hi(s) = A/Sj (содержательно, At - эффект, s, - затраты, h(s) - эффективность), то * стратегия S i R является гарантирующей и АЭ1 всегда i может получить любое меньшее количество ресурса, поэтому доминантной стратегией АЭ1 является sf = min {г,, s
Для механизмов обратных приоритетов доказано: что они в рамках ГСВ обеспечивают оптимальное распределение ресурса; для них можно построить соответствующие прямые (неманипулируемые) механизмы [113, 123].

8.4.3. Конкурсные механизмы распределения ресурса

Конкурсные механизмы относятся к особому типу приоритетных механизмов, в которых на основе приоритетов определяется множество победителей. Победители конкурса либо получают право на получение ресурса, либо получают выгодный заказ и т. д.
Распределение ресурсов на конкурсной основе означает, что ресурс в первую очередь получают потребители - участники конкурса, у которых эффективность использования ресурса максимальна, причем под эффективностью понимается эффект на единицу ресурса. Центр упорядочивает АЭ в порядке убывания эффективностей и распределяет ресурс в размере, заявленном АЭ, пока не закончится весь ресурс - так называемые непрерывные конкурсы (см. также выше описание дискретных конкурсов).
Если эффективности использования ресурса элементами неизвестны центру и сообщаются последними, то возникает проблема манипулируемости. Для конкурсных механизмов со штрафами за несовпадение реальной и заявленной эффективностей исследованы свойства равновесных сообщений АЭ (в частности, показано, что в ситуации равновесия эффективности всех победителей конкурса равны одному и тому же числу).
Также доказано, что конкурсный механизм обеспечивает оптимальное (с точки зрения суммарной эффективности) распределение ресурса. Более того, если выполнена ГСВ, то для любого конкурсного механизма существует эквивалентный (не меньшей эффективности) механизм открытого управления, в котором сообщение достоверной информации является доминантной стратегией АЭ [123, 124, 144, 157, 392, 393].
В работах [123, 144] исследовалась возможность образования коалиций между победителями конкурса и проигравшими АЭ в условиях, когда победители и проигравшие либо имеют возможность перераспределять ресурс между собой, либо/и перераспределять эффект от его использования.

8.5. Механизмы финансирования

С одной стороны, механизмы финансирования могут рассматриваться как подкласс механизмов распределения ресурсов (финансовых). С другой стороны, в силу их многообразия и специфичности, зачастую, их выделяют в самостоятельный класс механизмов управления АС, включающий механизмы: смешанного финансирования и кредитования, самоокупаемости, страхования, противозатратные механизмы и др.
Идея смешанного финансирования заключается в том, что средства одной из организаций на некоторый проект выделяются только при условии, что и другая организация (партнер) обязуется выделить на этот проект собственное финансирование. Жесткая фиксация долей вкладываемых средств имеет свои минусы -желающих вложить собственные средства будет либо слишком много, либо может не быть вообще.
Следовательно, возникает задача синтеза механизма с гибко настраиваемыми величинами долей финансирования. Так как эти доли должны зависеть от неизвестных центру величин, например - параметров функций предпочтения кредиторов, то возникает задача манипулируемости.
В [180, 234] получены условия, при которых механизм смешанного финансирования обеспечивает большее привлечение средств, чем прямое финансирование проекта, причем использование этого механизма выгодно как для центра, так и для АЭ - организаций-кредиторов.
Если некоторый проект состоит из совокупности работ (подпроектов), причем для начала выполнения каждого подпроекта требуются некоторые затраты, а его окончание приносит некоторую (быть может, отрицательную) прибыль, то возникает задача построения механизма самоокупаемости (самофинансирования), то есть задача определения оптимальной последовательности выполнения работ. В [234] предложена последовательность выполнения работ, минимизирующая величину привлеченных средств.
Если параметры работ (например - затраты), неизвестны центру, то он может воспользоваться оценками, сообщаемыми АЭ, там же построен неманипулируемый механизм (механизм ОУ) и показано, что оптимальная последовательность работ в исходном и эквивалентном прямом механизме одинаковы.
Важный класс механизмов финансирования составляют механизмы страхования, основанные на взаимовыгодном перераспределении риска между нейтральным к риску страховщиком - центром и несклонным к риском страхователем - АЭ [238, 338, 373]. Если имеет место асимметричная информированность (например, центр может не знать точной величины ущерба от наступления страхового случая, или иметь неточную оценку вероятности наступления этого события и т. д.), то, опять же, возникает проблема манипулирования со стороны АЭ, которая рассматривалась в [234].
Если конкурсные механизмы рассчитаны на использование в ситуациях, когда имеется несколько управляемых субъектов примерно равной силы, то противозатратные механизмы
позволяют эффективно управлять монополистами.
Противозатратными называются такие механизмы управления, которые побуждают каждый АЭ максимально повышать эффективность своей деятельности, выполнять соответствующую работу с высоким качеством и минимальными затратами.
В основе использования противозатратных механизмов лежит следующая общая идея. Предположим, что целевая функция АЭ зависит от переменных двух типов - параметров, выбираемых самим АЭ (например, затраты труда, объем выпуска и т.д.), и параметров, устанавливаемых центром - управлений (например, нормативы рентабельности, коэффициенты ценообразования, налоговые показатели и т.д.). Задача центра заключается в выборе таких значений управлений, чтобы целевая функция АЭ вела себя требуемым образом (например, возрастала или убывала по соответствующим параметрам, выбираемым АЭ) [123].
Примерами могут служить: противозатратные механизмы ценообразования [103, 185] и противозатратные механизмы налогообложения [186, 187, 259].

8.6. Механизмы внутрифирменного управления

Обширный класс прикладных механизмов, разрабатываемых в ТАС, составляют механизмы внутрифирменного управления, широко используемые в процессах реструктуризации и реформирования предприятий (в консалтинге), повышения эффективности функционирования промышленных, научных и других организаций [42, 234, 363]. Наиболее ярким и характерным представителем класса механизмов внутрифирменного управления являются механизмы внутренних цен, рассматриваемые ниже.
Классическим примером активной системы, в которой работает механизм открытого управления, ставшей, в частности поэтому, чрезвычайно популярной в экономико-математическом моделировании, является АС, в которой АЭ имеют функции затрат типа Кобба-Дугласа. Пусть в двухуровневой АС функция затрат /-го АЭ (например, подразделения некоторого объединения, фирмы и I-a, где yi e Ai с Ж1 - действие АЭ, a 1, ri 0. a У/ Гi т.д.): ci(yi,ri)
Предположим, что задача центра - руководства объединения -заключается в побуждении коллектива АЭ выбрать набор действий, сумма которых равна заданной величине R (типичная задача стимулирования в АС со слабо связанными АЭ - см. выше). Предположим, что центр устанавливает цену A 0, тогда целевая функция /'-го АЭ равна разности между доходом Ay. и затратами: f,(y,,r) = Ay/ - C/(y/,r/).
Решение задачи минимизации суммарных затрат АЭ выбором ({x.}, A) при условии x. = Arg max f/(y/,r/) и следующем У/^A/ n ограничении: X x. = R, имеет вид: i=1 r. n
x*(R,r) = W R, A*(R,r) = (R / W)a-1, где W = X r/.i=1
Рассматриваемая формальная модель имеет множество содержательных интерпретаций. В том числе: распределение объемов работ в коллективе (1 - ставка оплаты) [363, 382], распределение ресурса с ценой за ресурс 1 [123], распределение заказов в объединении (A - внутрифирменная цена) [42] и др.
Если коэффициенты {r} неизвестны центру и сообщаются элементами, то возникает задача манипулируемости используемого механизма планирования. Уникальностью рассматриваемой модели является то, что для нее существует эквивалентный прямой механизм, то есть механизм открытого управления
(неманипулируемый), в котором при гипотезе слабого влияния (ГСВ в данном случае заключается в том, что влияние каждого АЭ на общее управление - цену A(R,s) - мало) сообщение достоверной информации является доминантной стратегией каждого активного элемента. При этом механизм внутренних цен, то есть -управляющие параметры {x.}, A}, определяется из решения n следующей задачи: X x(s,A) = R, x(s,A) = arg max {A(s) y - ci(yisi)}, i=1 У/ zA/ yR, 1*(R,s) = (R/V)a-1, решение которой имеет вид: xt (R,s) n
где V = ^ s,, s - вектор сообщений АЭ. i=1
Если выполнена ГСВ, то при любых сообщениях остальных АЭ максимум целевой функции i-го АЭ по его сообщению достигается при sі = rr, то есть при ГСВ сообщение достоверной информации является доминантной стратегией каждого активного элемента. Отметим, что в ряде частных случаев выполнения гипотезы слабого влияния не требуется. Так, например, в механизмах внутрифирменного управления, если в целевой функции подразделения ее прибыль нормируется на сумму прибылей всех подразделений, то цена, входящая и в числитель, и в знаменатель, сокращается.
Другим примером борьбы с требованием слабого влияния является использование обобщенных оценок и др. [42].
Все приведенные выше в настоящем подразделе результаты могут быть обобщены на случай, когда функции затрат активны Уі элементов имеют вид ci(yi,ri) = rr j (), где j() - гладкая Гі
монотонно возрастающая выпуклая функция. Кроме того, для механизма внутренних цен возможно построение механизма B-типа: 1 si(yi,ri) = у7г,1'7, у1, который ?-оптимален [363].

8.7. Механизмы стимулирования

В прикладных моделях ключевую роль играет не столько теоретико-игровой анализ задач стимулирования, сколько содержательно интерпретируемые свойства тех или иных классов систем стимулирования. Перечислим основные классы базовых систем стимулирования в детерминированных АС (свойства систем стимулирования в АС с неопределенностью обсуждались выше при рассмотрении расширений базовой модели АС).
Скачкообразные системы стимулирования (С-типа) характеризуются тем, что АЭ получает постоянное вознаграждение (как правило, равное максимально возможному значению), при условии, что выбранное им действие не меньше заданного, и нулевое вознаграждение, при выборе меньших действий. Этот класс систем стимулирования достаточно подробно исследован.
В частности, для большинства моделей АС доказана их оптимальность в задачах первого рода (см. выше и [195, 382]).
Системы стимулирования С-типа содержательно могут интерпретироваться как аккордные, соответствующие фиксированному вознаграждению при объеме работ не ниже оговоренного заранее. Другая содержательная интерпретация соответствует случаю, когда действие АЭ - количество отработанных часов, то есть, например, фиксированному окладу без каких либо надбавок и оценки качества деятельности.
Квазискачкообразные системы стимулирования (QC-типа) отличаются от скачкообразных тем, что вознаграждение выплачивается АЭ только при точном выполнении плана. Следует отметить, что системы стимулирования QC-типа являются экзотическими (особенно в условиях неопределенности непонятно, что понимать под точным выполнением плана) и на практике используются достаточно редко.
Компенсаторные системы стимулирования (К-типа) характеризуются тем, что активному элементу компенсируют затраты при условии, что его действия лежат в определенном диапазоне, задаваемым, например, ограничениями C на абсолютную величину индивидуального вознаграждения: \c(y),c(y) ? C ?к(х,у) = і { 0,c(y) C
Квазикомпенсаторные системы стимулирования (QK-типа) отличаются от компенсаторных тем, что вознаграждение выплачивается АЭ только при точном выполнении плана. И компенсаторные, и квазикомпенсаторные системы стимулирования оказываются оптимальными во многих моделях АС, в том числе - в задачах второго рода [382].
Пропорциональные системы стимулирования (L-типа). На практике широко распространены системы оплаты труда, основанные на введении ставок оплаты: повременная оплата подразумевает существование ставки оплаты единицы рабочего 68
времени (как правило, часа или дня), сдельная оплата -существование ставки оплаты за единицу продукции и т.д. Объединяет эти системы оплаты то, что вознаграждение АЭ прямо пропорционально его действию (количеству отработанных часов, объему выпущенной продукции и т.д.), а ставка оплаты а 0 является коэффициентом пропорциональности: Сь(у) = а у. Как правило, эти системы стимулирования не оптимальны - их эффективность ниже, чем систем С-типа и K-типа.
Количественные оценки сравнительной эффективности приведены в [363, 382].
Системы стимулирования, основанные на перераспределении дохода (D-типа) используют следующую идею. Так как центр выражает интересы системы в целом, то можно условно идентифицировать его доход и доход от деятельности всей активной системы. Поэтому возможно основывать стимулирование АЭ на величине дохода центра - когда вознаграждение АЭ составляет определенную (постоянную) часть дохода центра: sD(y) = X H(y), где X ? [0;1].
На сегодняшний день формальные модели с переменной долей X = X(y), к сожалению, не исследованы. Эффективность этого класса систем стимулирования не высока - см. оценки сравнительной эффективности в [363].
Степенные системы стимулирования (B-типа) представляют собой достаточно искусственную конструкцию, когда вознаграждение АЭ пропорционально его затратам в определенной степени: sD(y) = a c3(y), где /3 ? (0,1]. Использование степенных унифицированных систем стимулирования оказывается эффективным в многоэлементных АС с неопределенностью - см. выше и [363].
Перечисленные выше системы стимулирования являются простейшими - базовыми, представляя собой элементы конструктора, используя которые можно построить другие более сложные системы стимулирования. Для возможности такого конструирования необходимо конструктивно определяются операции над базовыми системами стимулирования. Для одноэлементных детерминированных АС достаточно ограничиться операциями следующих трех типов. Первый тип операции - переход к соответствующей квази-системе стимулирования -вознаграждение считается равным нулю всюду, за исключением действия, совпадающего с планом.
Второй тип операции - разбиение множества возможных действий на несколько подмножеств и использование различных базовых систем стимулирования на различных подмножествах. Третий тип операции - алгебраическое суммирование двух систем стимулирования (что допустимо, так как стимулирование входит в целевые функции участников системы аддитивно).





    Экономика: Знания - Циклы - Макроэкономика