Коргин Н.А. - Неманипулируемые механизмы обмена в активных системах

Современный руководитель сталкивается с большим количеством проблем в процессе управления подчиненным ему субъектом (коллективом, предприятием, государством и т.д.) или планирования его деятельности. Среди наиболее насущных следует выделить проблему недостатка информации, необходимой для осуществления эффективного управления и планирования. В областях математики, исследующих управление в социально-экономических и организационных системах (теория игр, теория активных систем, микроэкономика и т.д.), предложены различные методы устранения информационной неопределенности руководителя системы.
Один из распространенных приемов - сообщение необходимой информации подчиненными руководству (например в теории активных систем механизмы управления с сообщением информации называются механизмами планирования [52]). При разработке механизмов управления с сообщением информации, наряду с традиционной задачей максимизации эффективности управления системой [18,52], возникает задача устранения возможности подчиненных манипулировать сообщаемой ими информацией в собственных целях.
Пример Традиционная проблема воровства. Если у повара, работающего в неком ресторане за фиксированную зарплату, начальство требует изготовления блюд, рецепты которых не известны руководству но известны повару, сколько продуктов нужно для приготовления того или иного блюда, то у повара возникает естественное желание завысить называемые количества, тем самым, заполучив в свое распоряжение излишки продуктов.
В настоящее время проблема манипулируемости получила достаточно широкое освещение как в отечественных [4,10-14,1622,46,47,52,53,55,58,62,63], так и в зарубежных публикациях [59,61,64,65,67-70,72-77,79-82,85-89,91,95]. Однако, до сих пор не существует единого аппарата построения неманипулируемых механизмов управления социально-экономическими и организационными системами. Основной трудностью является многообразие рассматриваемых моделей
систем и различных постановок задач управления. В данной работе развивается один из возможных подходов, призванный свести воедино многие полученные ранее результаты.
Насколько хорошо понятие обмен описывает взаимодействие между людьми? Рассмотрим произвольное сообщество. Каждый из членов этого сообщества обладает своим ресурсом (или несколькими видами ресурсов) - деньгами, знаниями, возможностью выполнить какую-либо работу, хорошим настроением и т.д. Люди, члены данного сообщества могут обмениваться между собой этими ресурсами. Зачем?
Например, с целью улучшить свое благосостояние. Оставив за рамками данной книги нетривиальный вопрос - что такое благосостояние человека, скажем лишь, что и материальное богатство человека, выраженное в деньгах, и его уважение в обществе, и даже его моральное удовлетворение можно рассматривать как благосостояние.
Важно лишь, что благосостояние человека зависит от имеющихся у него в наличии ресурсов.
Таким образом, обмен - это перераспределение ресурсов между элементами системы, с целью улучшения их благосостояния.
Очевидно, что экономические системы являются частным случаем сообщества людей, причем элементами подобных систем могут являться как отдельные люди, так и целые коллективы, предприятия, фирмы, страны и т.д. - экономические субъекты. Поэтому, процесс функционирования экономической системы может быть представлен как процесс обмена.
В качестве ресурсов, обмениваемых участниками системы, могут выступать производимые ими товары, оказываемые услуги, деньги.
Пример Взаимодействие мельника и пекаря. Схема обмена выглядит следующим образом. Мельник передает пекарю некоторое количество муки, заказывая у него выпечь из нее булок.
Обмен между мельником и пекарем здесь очевиден - обменивается ресурс типа мука на ресурс типа булки. В случае, если условия обмена определяет мельник, а пекарь либо соглашается на них либо нет, в роли управляющего органа (центра) выступает мельник, а пекарь - в роли активного элемента [23]. Проблема неполной информированности центра (мельника) о параметрах схемы (типе пекаря) может быть сформулирована следующим образом. Мельник не знает точно технологии пекаря, но знает, что на изготовление одной булки пекарю требуется от 600 до 900 грамм муки.
Возникает вопрос о том, сколько же муки обменять на сколько булок. Мельник может поступить следующим образом - он может спросить у пекаря о его технологии, и в зависимости от сообщенной информации предложить различные варианты обмена, тем самым реализовав механизм обмена с сообщением информации.
Проблема манипулируемости подобного механизма очевидна - пекарь может воспользоваться неполной информированностью мельника в своих интересах, сообщив завышенное значение требуемого количества муки, а полученные излишки использовав в своих интересах.
Рассматривая различные процессы функционирования социальноэкономических и организационных систем как процессы обмена, можно расширить области применения полученных ранее результатов решения отдельных задач управления (в частности, задачи построения неманипулируемх механизмов управления).
Для разработки эффективных неманипулируемых механизмов обмена в активных системах необходимо решение следующих основных задач:
- Разработка модели обменной схемы и формулировка общей задачи обмена в активной системе.
- Разработка общих методов построения неманипулируемых механизмов обмена в активных системах в условиях неполной информированности руководящего органа (центра).
- Синтез эффективных и неманипулируемых механизмов обмена для базовых обменных схем: двухэлементных и многоэлементных (веерного типа и типа цепочки).
Структура изложения.
Перечисленные общие теоретические задачи настоящего исследования определяют структуру дальнейшего изложения его результатов. Первая глава посвящена общей постановке проблемы построения неманипулируемых механизмов обмена в активных системах. В разделе 1.1 формулируется математическая модель обменной схемы (ОС).
Вводятся определения обмена, множества вариантов обмена (МВО) и ОС, а также ряд других ключевых определений.
В разделе 1.2 задача обмена формулируется как задача управления.
В разделе 1.3 изучается возможность рассмотрения задач теории активных систем (ТАС) как задач обмена. Проводится сравнительный анализ классификации активных система (АС) и классификации ОС.
Раздел 1.4 посвящен обзору основных математических моделей и методов, которые могут быть использованы для построения неманипулируемых механизмов для ОС. Формулируется принцип открытого управления и приводятся достаточные условия неманипулируемости прямых механизмов планирования. Приведен принцип построения неманипулируемых механизмов для решения задач теории контрактов. Рассматривается модель обменной экономики Эджворта.
Излагаются принципы построения механизмов Маскина и МакКельви, реализующих заданное соответствие группового выбора (СГВ).
В разделе 1.5 дается общая постановка задачи построения неманипулируемых механизмов обмена для АС с неполной информированностью центра. Формулируется общий метод построения неманипулируемых механизмов обмена.
Вторая глава посвящена рассмотрению базовых обменных схем, состоящих из двух агентов.
В разделе 2.1 строится модель ОС, соответствующая модели АС для задача стимулирования. Доказывается эквивалентность решений детерминированных задач стимулирования и обмена для соответствующей ОС.
Осуществляется переход от детерминированной ОС к ОС с внутренней неполной информированностью центра - вводится понятие типа АЭ, полностью характеризующее АЭ, и не известное достоверно центру. Формулируются условия на зависимость функции предпочтения АЭ от типа, при выполнении которых возможно применение общего метода построения неманипулируемого механизма обмена.
Раздел 2.2 посвящен построению механизмов ОУ в двухэлементных ОС с внутренней неполной информированностью. Рассматриваются
дискретный и непрерывный методы построения механизмов ОУ. Дискретный метод построения неманипулируемых механизмов обмена основан на графическом анализе функций предпочтения агентов. Непрерывный метод является частным случаем предложенного в разделе 1.5 общего метода построения неманипулируемых механизмов обмена.
Доказана эквивалентность двух предложенных методов.
Раздел 2.3 посвящен решению двухэлементных задач обмена без иерархии. Предлагается метод решения подобных задач, основанный на механизмах ОУ для аналогичных двухэлементных иерархических ОС.
Агенты самостоятельно распределяют между собой роли Ц и АЭ. Определяется зависимость распределение ролей от параметров ОС для квазиинтеллектуальных (не производящих анализ сообщений оппонента) и интеллектуальных (анализирующих сообщения оппонента) агентов.
Третья глава работы посвящена исследованию механизмов ОУ в ОС с конечным числом элементов.
В раздел 3.1 рассматривается ОС с веерной структурой взаимодействия элементов и одним уровнем иерархии. Т.е ОС состоит из одного центра и конечного числа АЭ.
Для многоэлементных ОС, соответствующих многоэлементной задачи стимулирования строится эффективный механизм обмена ОУ.
В разделе 3.2 рассматриваются ОС со структурой взаимодействия элементов типа цепочка и одним уровнем иерархии. Предлагаются три метода построения неманипулируемых механизмов обмена для случая, когда общий метод неприменим. Первый метод - метод консолидации АЭ - центр рассматривает всех АЭ как единый АЭ и решает задачу нахождения механизма обмена ОУ для полученной двухэлементной ОС.
Второй метод - метод разбиения схемы - цент взаимодействует с каждым АЭ по отдельности. Третий метод - метод доносчика - центр делегирует права промежуточного центра тому АЭ, который сообщит наилучшую оценку типов всех АЭ.
Заключение содержит основные результаты работы и обсуждениеперспективных направлений дальнейших исследований.


Эффективный и неманипулируемый механизм обмена

АЭ можно записать
r е Q';
(47) X2(r)
rmax
max
4r3 r3
(48) x (r) =-, r eW;
6r
2
max
3 1
~ = min{(r Y2)1/2,(-r2 F + -r- )1/3}.
v V max 2 / ? ^ 2 max - 4 min ^ ^
Ожидаемая прибыль центра будет иметь более сложный вид
(49) ЩП) =
[2r (r2 + rr . + r2. ) (r + r . )(r2 + r2. ) + r3. 1
l max v mm mm s v mm ^ v min ^ min J
6r2 (r r . )
max max min
Задача 4. Построить эффективный и неманипулируемый механизм обмена для ОС с линейными функциями полезности Ц - f1(x1,x2) = rx1 x2,
и АЭ - f1( x15 x2, r) = rx1 x2. Задача центра - максимизация гарантированной относительной прибыли от обмена
min , „ s max f0e(s)
/c(p( s))
Множество возможных значений типа АЭ -отрезок [rmin,rmax].
Распределение ресурса в схеме такое же, как в рассмотренном выше примере - весь ресурс первого типа Y1 сосредоточен у центра, весь ресурс второго типа Y 2 - у АЭ. Причем существенным будем считать ограничение на ресурс первого типа.
Легко видеть, что функция полезности АЭ удовлетворяет требованиям (F1) и (F2):
re Q,
X e х = * 0,
dr
т.е. выполнено F1. Также,
d/1( X1, x 2, r )
re Q, X еХ
dx2dr
что соответствует F2 b . Также очевидно,
d/1(x-, x2 , r)
re Q, X e Х,
’ dx1dr
что соответствует F2a.
В соответствии с (39) получаем
г
x2 (г) = rx1 (r) + J x1 (t)dT.
Для построения механизма ОУ необходимо решить следующее уравнение:
d ( f0(p( s У) ) = 0
7 ( WeW х)
ds max f0 е (s)
Очевидно, что max /0det(s) = (s - c)Y1. Поэтому получаем, что
J x1(f)dT = 0.
(50) ^xxn - xjrn+L_
dr r - c (r - c)2
(51) 0 xj(r) Yi.
Механизм имеет следующий вид:
)-1.
X2(r) = MO^r-c(1--У), Xi(r) = Yi, m(r) = (1 + In
d(r) m(r) rmin- c
= u(r ).-
г V max /
Относительная гарантированная прибыль центра f0(p(r ))
и3 (35). Для непРеРывного случая, m = Х1( Х2 е [ ^ГшпХ И
определяется из (45) и (46). Очевидно, что (х/, х2*) е m, оптимальные для АЭ, будут совпадать с p(r) = (xx(r),x2(r)), определяемым по все тем же (34) и (35) (или (45) и (46)). На левой части рисунка 8 представлено множество вариантов обмена, получаемое в задаче 3. На правой - для задачи 4. 2.3. Решение задачи обмена для двухэлементных обменных схем безиерархииРассмотрим обменную схему из двух агентов, в которой отсутствует
иерархия, т.е. нет отношений подчиненности типа Ц - АЭ. Т.к. понятие ОСподразумевает, что у агентов имеется возможность увеличить своюполезность путем обмена, то возникает вопрос поиска равновесия -обмена (множество обменов), устраивающего каждого из участниковобмена. В качестве критерия, определяющего равновесие, например, могут выступать некие внешние цены на товары, которые присутствуют в ОС. Данный критерий, как было показано в разделе 1.4, использовался в модели обменной экономики Эджворта, а само равновесие называлось равновесием Вальраса [81].
Но как быть, если применение подобного затруднительно. В данном разделе рассматривается модель, в которой агенты не полностью осведомлены о параметрах друг друга. В такой ситуации задача поиска равновесия осложняется возможностью агентов манипулировать информацией при обмене.
Предлагаемый метод решения подобных задач основан на рассмотренном выше механизме ОУ - каждый из агентов предлагает в качестве вариантов обмена свой механизм ОУ, где он выступает в роли центра. Выбранная модель ОС является модификацией модели ОС, рассматриваемой в разделе 1.1.
Агенты имеют следующие функции полезности: j( У V У 02, Г0) = Г0 у 02 + у 0У j(У ’,у'2,г) = у\ - (Y - у2)2/2г\
Начальное распределение ресурсов остается прежним:
Также, как и ограничения индивидуальной рациональности:
IR(y0) = (V/ = 0,1 j (y.) j (y.0)}.
Информационное состояние схемы выглядит следующим образом. Каждый из агентов знает все параметры схемы за исключением точного значения типа оппонента - ему известно множество возможных значений типа и вероятностное распределение типа - Q'1 = [flmin,flmax], р.г(г4),
r-і
' max
Jp г (r-i )dr = 1. Для простоты дальнейших вычислений будем
Г min рассматривать именно непрерывный случай с равномерным распределением p t (r-г) = 1- =const. Каждый агент знает точное
Г max Г min
значение собственного типа.
Функции полезности агентов от обмена в данной модели записываются следующим образом (17), (18):
f0( *1, x2 r 0) = r 0 *2 - Xi;
fl(X1 X 2 , О = X1 - X22 /2r '-
Процесс обмена (игра) происходит следующим образом:
1. Каждый из агентов сообщает свое меню или множество предлагаемых вариантов обмена, соответствующее механизму ОУ, в котором он выступает в роли центра.
2. Каждый из агентов сравнивает прибыль от наилучшего варианта обмена из предложенных оппонентом с ожидаемой прибылью от своего механизма обмена.
3. Каждый из агентов сообщает оппоненту свою заявку - по какому из предложенных механизмов он готов обмениваться (кем готов быть -центром или АЭ).
4. Если позиции агентов не противоречивы (Ц - АЭ или АЭ - Ц), то тот из них, кто выбрал роль АЭ, сообщает вариант обмена из меню оппонента, который его устраивает (или просто свой тип в случае прямого механизма). Если позиции элементов противоречивы (Ц - Ц или АЭ - АЭ), то возникает конфликтная ситуация, варианты решения которой будут рассмотрены позже.
5. Элементы совершают обмен в соответствии с выбранным планом в случае непротиворечивости выбранных ими ролей.
Предполагается, что при одинаковой выгодности роли Ц и АЭ, любой из агентов предпочтет роль АЭ.
Данный вариант игры является квазиинтеллектуальным, т.к. агенты не используют предлагаемый оппонентом план для вычисления типа оппонента.
Оба агента строят механизмы ОУ, основываясь на максимизации собственной ожидаемой прибыли Efc (r1 ,p(s-1)) max
1 p(s-1)
Механизм ОУ, предлагаемый агентом 0. Данная задача имеет вид, аналогичный задаче из примера 4, за исключением вида функции полезности от обмена для центра. Т.е. задача динамического
программирования, которую необходимо решить для построения механизма ОУ, имеет следующий вид (41):
r x (r0 r')2 у x (r0 t)2
ty)(r\Q1) = 1[r0x2(r0,r4-~xl~2Ti--1 - 1 1 drr(r‘)dr ®max’
21
r min
r min
при условиях 0 X2(r, /) Y'2, 0 xj(r, rl) ? Yi.
Решение данной задачи для равномерного распределения типа АЭ будет иметь следующий вид (43), (44):
r0rl2 '
(52) x2 (r0, r) = -{, r0 eQ0, r1 eQ1 ;
r max
. l3 i3
,2 4r - r mm
(53) Xi(r0, r v) = r
r0 eQ0, r 1 eQ1
12
6r

Q1 = [r ^min , r 1], ^ = min{( rmaxY2/^ Г',(^3 rLYJ ^ + 4

Для простоты анализа, но без потери общности, примем, что ресурсные ограничения выполняются для всех значений типов агентов. При данных предположениях ожидаемая прибыль агента 0 в качестве центра будет иметь следующий вид:
12
12
(54) Ef,(r0, Q1) =
(r
max + r max r min + r‘min ) .
6r1
Прибыль АЭ
13 13
r - r min
(55) f(r0,r1) = r0 (
).
12
6r
Механизм ОУ, предлагаемый агентом 1.
Задача центра - E/1(Q0, r') ^max. Проверим, удовлетворяет ли модель свойствам, позволяющим построить механизм ОУ. Функция полезности АЭ
f0( xn X2 , r 0) = r 0 X2 - X1-
Соответственно,
Л Q0, л еХ д^Хі’Х2’Г ) = x2 0,
dr0 2
т.е. выполнено F1. Также,
Л Q0, х ^Х ддГ(Хі’Х^r ) = 1 0,
dx2dr
что соответствует F2a. Также очевидно,
Л Q0, X еХ Х2 Г ) = 0,
dx1dr0
что соответствует F2b.
Приступим к построению механизма ОУ. Из (9) получаем x1(r0,r') = r0x2(r0,r’)- Jx2(r,rl)dt.
r min
Необходимо решить следующую задачу
x2(r,rl)2 2r1
' max
Е/1(П,r1) = J [/XJr,r1)-
t
- Jx2(t,r 1)dr]p0(r0)dr0®max,
J x~
0
r min
0
r min
при условиях
0 X2(r^, rl) Y2, 0 x1(r, rl) Yi.
Выше мы приняли, что ресурсные ограничения выполняются для любых типов агентов, поэтому решение поставленной задачи будет иметь следующий вид:
(56) x2(r0, rl) = r\2r0 - r0max), r0 eQ= [r0, r V], r1 eQ1 ; x2(r0,r) = 0, r0 eQ0/Q', r1 eQ1 ;
(57) x1(r0, r ) = r1 (r02 - (r 0max - r 0)r0), r0 eQ0 = [r0, r V], r1 eQ1 ;
x1(r0,rl) = 0, r0 eQ0/Q0 , r1 eQ1 где
(58) r 0 = max[r "min, r max/2].
Ожидаемая прибыль агента 1 в роли центра
2 U О О
r r r
(59) Ь/1(ІГ,Г) = -r---+ ry
Прибыль АЭ
(60) fo(r0,r) = r'[(r! - r0)p0 - (rmax - r0)r0]
На рисунке 9 приводится вид меню - множества вариантов обмена, предлагаемых агентом 1.
Эффективный и неманипулируемый механизм обмена

Рис. 9. Вид множества вариантов обмена, предлагаемых агентом 1.
Построив механизмы ОУ (52), (53) и (58), (59), можно
проанализировать, какая из возможных позиций в иерархии выгодна для каждого из агентов, в зависимости от следующих параметров модели -качество типа каждого из агентов, определяемое как отношение истинного типа агента к лучшему и его информированность - отношение худшего из возможных типов оппонента к лучшему. Для этого необходимо сравнить (54) и (60) для агента 0 и (59) и (55) для агента 1.
Для анализа выгодности позиций для агентов, введем следующие замены: r0 = ar0 , r0 = br0 , r1 = yrl , r1. = ml . Причем очевидно, что
(61) 0 h? 1,
и из (58) -
70
(62) 1/2 b a 1.
Множество всех значений переменных а, в, у, п, удовлетворяющих (61) и (62) обозначим ? Введенные переменны можно трактовать следующим образом:
П - осведомленность агента 0, чем больше ее значение, тем лучше информирован данный агент; у - тип агента 1;
в - осведомленность агента 1, чем больше ее значение, тем лучше информирован данный агент; а - тип агента 0;
С учетом данной замены переменных, получаем
а2
(63) в/о( I ah) = i^t (1 + h + h);
6
а2
(64) f1(iagh =1(r3 -h);
6
2 1 b
(65) E/j( I ,b,g) = 13 Y{- - 2 + b2);
(66) /о (I a, b, g) = Ig[(1 - b)b - (1 - a)a].
Здесь I = rm0ax2rmax - константа, определяемая параметрами обменной схемы.
Проанализируем зависимость выражений (63) - (66) от новых переменных.
растет с улучшением его информированности.
df
-^-(I,a,b,g) = Iy[2a -1] - с учетом (62), прибыль агента 0 в роли АЭ da
растет с улучшение его типа (собственно на этом принципе и строился механизм ОУ) df
(I,а,b,g) = Ig[ 1 - 2b] - с учетом (62), прибыль агента 0 в роли АЭ db
убывает с улучшение информированности агента 1.
(I,а, b,g) = I[(1 - b)b (1 - a)a] - прибыль агента 0 в роли АЭ
dfo
dg улучшение его типа.
улучшением типа агента 0.
Можно сформулировать следующее качественное утверждение - для любого из агентов позиция АЭ может быть более предпочтительна, если он плохо информирован, но и его оппонент плохо информирован также, и, если тип оппонента высокий. Кроме того, учитывая, что прибыль агента с худшим типом при использовании механизма ОУ нулевая, а прибыль в роли центра очевидным образом положительна, можно предположить, что позиция АЭ предпочтительна, когда тип агента достаточно высокий.
Предпочтительность позиции АЭ можно сформулировать следующим образом.
Для того, что бы агент 0 предпочел роль АЭ роли центра необходимо выполнение следующего неравенства
a
(67) Fo(a,b,g,h) = g[( 1 -b)b-(1 -a)a]- (1 + h + h2) ^ 0.
6
Для того, что бы агент 1 предпочел роль АЭ роли центра, необходимо, что бы
(68) F!(a,(igh) = ^6 (g3 - h3) - 2 g(4 - В + b2) ^ 0
6 3 4 2
В следующей лемме определяются условия необходимости, которые накладываются на тип агента 1 и область его значений, при которых возможна ситуация, когда агент 0 предпочтет позицию АЭ.
1 + h + h2
3
неравенство (67) не выполняется для V a
Лемма 5. При g
и b.
Доказательство. Функция F0(a,b,g,h) достигает своего глобального
* 1 + h + h\ -1
экстремума по а при a = (2--) т.к
3g
1 + h + h2
3
OF W1 0
Oa
(69)
(a,b,g,h) = 2ag - g - a
Данный экстремум является минимумом, если
(70) OaFr(a,b,g,h) = 2g - 1 + h3+ h 0. da2 3
Кроме того, очевидно, что
В2
(71) F0(b, B,g,h) = -^(1 + h + h2) 0.
6
Следовательно, для b, g, h, удовлетворяющих (61), (62), и (70), при
ae\fi,(2 -1 + h + h )-1] неравенство (67) не выполняется. Если 3g
1 + h + h2 1 + h + h\ /О 1 + h+h 4-1 л ~ r-
g?\--,--], то (2---) 1, т.е на всей области
6 3 3g
возможных значений а неравенство (67) не выполняется.
1 + h + h2
Если (70) является равенством - g =--, то (65) отрицательно
6
для а иb. С учетом (71) получаем, что на всей области возможных значений а неравенство (67) не выполняется.
, то функция F0(a, b,g,h) достигает при
Если g
1 + h + h
* 1 + h + h\ -і * _
а = (2--) своего максимума, причем очевидно, что а 0.
3g
Следовательно, с учетом (71) получаем, что на всей области возможных значений а неравенство (67) не выполняется. ¦
Общее условие предпочтительности позиции АЭ для квазиинтеллектуального агента 0 можно записать в следующем виде.
Утверждение 2. Существует область значений параметров а, в, Y, П, qоае =Qaae х?0™ х?"е х?0ae, в которой роль АЭ предпочтительнее для
квазиинтеллектуального агента с номером ноль. Область
?0ae = ?0аае х Q0bae х ?0ае х ?0ae задается следующим образом:
(72)a ? ?Г = \(1 + 7 2(1 - b)bC +1 - 4(1 - b)b)(2 - C)M];
11
(73) b?Q7 = Ьт(1 Wi-TC)];
22
(74)g ? ?ж = [2(1 + h + h ,1];
(75)h ??," = (0,2(73 -1)].
1 + h + h2
Здесь используется замена с =-'.
ЗГ
Доказательство. Из леммы 5 следует, что с 1- Также очевидно, что С 0.
Решив (67) как квадратичное неравенство относительно а, получим, что а е (-?, а~ ] u [а+, ?), где
а* = (1 ±42(1 - Р)РС +1 - 4(1 - b)b)(2 - с)-1 -
Покажем, что а 1/2. Очевидно, что данное утверждение эквивалентно неравенству (76К/2(1 - Р)Рх +1 -4(1 -b)b С.
Неравенство (76) выполнено для се (8(1 - b)b- 2,2). Учитывая (62) получаем, что данное неравенство выполнено всегда.
Т.е а 1/2 для любых параметров модели. Следовательно, с учетом (62), (67) выполнено
для а е ?Г = [(1 + 42(1 - b)bc +1 - 4(1 - b)b)(2 - С)- ,1].
Для того, что бы множество ?0аае было не пусто, необходимо, что бы
(77К/2(1 - Р)РХ +1 - 4(1 - b)b ? 1 - С.
Неравенство (77) можно переписать следующим образом (78) с2 - 2с(1 + (1 - b)b) + 4(1 - b)b 0.
Решив данное неравенство относительно в, получаем
b е 4(1 ~41 - 2с );1(1 + 41 - 2Х)] и Х ?1
учетом
Очевидно, что 1 (1 -1 - 2с) ? . Следовательно, с
ограничений на х и (62), получаем Ье?Ь* = [2;1-(1 + ^ 1 - 2с)],
Ге?0ае = [2(1 + h + h ),1]. Множество ?0ае не пусто при
Пе?п а = (0,|(?3 -1)].
На качественном уровне - если информированность обоих агентов достаточно плоха, а качество типов агентов достаточно высоко, то квазиинтеллектуальный агент 0 может добровольно согласиться на роль АЭ.
Утверждение 3. (a, P,g,h) ?? роль АЭ не выгодна для
квазиинтеллектуального первого агента.
Доказательство. Утверждение трактуется следующим образом - для (a, b, Y,h) Е ? неравенство (68) не выполнено.
Введем следующие замены
(і9)е = 1 - b + b;
81 h - 768--)
(80) L = (108^3 +12
Решив (68) как кубическое неравенство относительно у, получим, что
L e
6 La2
Очевидно, что у* 0. Следовательно, с учетом (61), получаем, что для
ge[g*, ?), где у* =- + 8
L e
у е?1ав = [+ 8-2,1] неравенство (68) выполняется. Множество ?1ж не
6 L a пусто, если у * 1.
Минимальное значение е, для в, удовлетворяющих (62) достигается
b 1 1 при b = 2 - е = 4.
Следовательно у * L + .
6L
L2
Очевидно, что I 1 при любых неотрицательных L. Поэтому 6L
множество ? 'уае пусто для любых а, в, ц, удовлетворяющих (61) и (62). Т.е.
не существует таких а, в, Y, П, удовлетворяющих (61) и (62), для которых выполняется неравенство (68). ¦
Итак, было доказано, что для агента 1 всегда предпочтительнее позиция Центра, в то время, как для агента 0 существует область значений параметров а, в, у, п, - ?0ae = ?0аае х?0™ х?0ае х 0ж, в которой для него предпочтительнее позиция АЭ. Т.е в обменной схеме возможны следующие варианты распределения позиций агентов: Ц-Ц и АЭ-Ц.
Ситуация, когда оба элемента претендуют на роль центра - является конфликтной. Рассматривается метод разрешения данного конфликта, основанный на компенсации за роль АЭ - элемент, претендующий на роль центра, предлагает своему оппоненту некоторую компенсацию за то, что тот откажется от роли центра. Очевидно, что размер компенсации, которую необходимо выплатить агенту определяется абсолютным значением функций F0(a, bf,h) для агента 0 и F1(a, bf,h) для агента 1. А определить агента, который займет позицию центра можно исходя из разницы данных функций:
1 5b2 а2
(81) F (a,b,g,h) = g[- - + 4b- - (1 - а)а] (1 + h + h + h - f).
6 3 6
Если данное выражение отрицательно, то позиция центра доступна агенту 0, если положительна, то агенту 1. Выше было показано, что позиция центра всегда предпочтительнее позиции АЭ для агента 1. Поэтому нас будет интересовать - возможно ли ситуация, когда агент 0 в состоянии компенсировать агенту 1 отказ от позиции центра.
Теорема 3. (a, b, f,h) ?? только агент 1 может выступать в роли центра. Т.е (а,b, f,h) ?? F(a,b,g,h) 0.
Доказательство. Произведем анализ функции F(a,b,g,h). Для
этого будет достаточно исследовать частные производные данной функции по параметрам а и в: (82) (а^ЛЛ) = г(2а-1) -- (1 + h + h2 + h - f);
(83) = f(4-ъ ). dF
Можно показать, что при выполнении (61) производная (a,p,g,h)
да
всегда положительна , т.е с улучшением типа агента 0 его шансы стать центром уменьшаются. Неотрицательность (82) легко показать, приняв во внимание результаты утверждения 3 - агенту 0 не выгодно быть АЭ, если
g
dF а а
(a,P,g,h) g(1 - -) + - -да 2 3
2(1 + h + h2)
dF_

dp

(a, p,r,h)
Также не трудно показать, что производная
положительна, т.е с улучшением информированности агента 1 шансы
агента 0 стать центром уменьшаются. Из (62) следует, что
dF p . 2 можно показать, что значение функции F (a,p,g,h)
если g
С учетом результатов утверждения 3 - агенту 0 не выгодно быть АЭ, 2(1 + h + h2)
при а = p = 2 положительно: f (,,g,h) = g(1 + h + h + h - g3) - g + 0. для g,h, удовлетворяющих (61). Следовательно, в рамках
рассматриваемой модели функция F (a,p,g,h) всегда положительна. ¦
Теорема 3 может быть проинтерпретирована следующим образом. Агент 1 всегда может назначить такую компенсацию агенту 0, при которой тот согласится выбрать позицию АЭ.
Агент 0 не имеет возможности компенсировать агенту 1 отказ от позиции центра. Можно в явном виде записать прибыль каждого из агентов в данной обменной схеме. Агент 0 выступает в роли АЭ:
Г О
+ r min)]
f0(r0,r\Q1) = max[r'((rl - r)r - (rl - r)r0),-^(rU + r^r'min
6r max
Агент 1 выступает в роли Ц, его ожидаемая прибыль :
rmax r__+ ^ 02)
2
0 2 max
2 r
Ef1(Q0, r0, r1) = 3 r 1( г 4
(85)
max[0?6^(r 'max + r 'max r 'min + r - r '((rl - r )r - (rl - r ")]
6r max
Следует отметить, что у предложенного выше метода анализа агентами выгодности позиций центра и активного агента есть недостаток -агенты не производят анализ предлагаемого оппонентом механизма и не пытаются восстановить истинные тип оппонента. Поэтому данный метод может быть назван методом для квазиинтеллектуальных.
Метод анализа выгодности позиций Ц и АЭ для интеллектуальных агентов может основываться на сравнении прибыли агента в роли АЭ с прибылью в роли центра, куда подставляется тип оппонента, восстановленный из предлагаемого им механизма обмена. Проиллюстрируем данное предположение. Агент 0 предлагает агенту 1 некий план обмена:
(86) x2(r') = Ar '2, r1 eQ1 ;
(87) x1(r') = Br13 - C, r1 eQ1 .
Предполагая, что данный план обмена должен являться механизмом ОУ, и зная вид функции прибыли агента 0 от обмена (17), агент 1 может решить следующую систему уравнений, получив тип агента 0 r0:
r0 = Ar1
Причем, если данная система совместна, то агент 0 действительно предлагает механизм обмена ОУ. Полученное значение типа агента 0 позволяет посчитать уже не ожидаемую прибыль агента 1 в роли центра, а фактическую:
(89) fC (r0, r') = r\r02 - (r(
(2r0 r0 )2 f
- r0)r0 _ (r 2 max) ), r0 eQ0 = [r0,rV],
r1 e Q1 ;
fC(r0,r1) = 0, r0 eQ7Qof, r1 eQ1 .
Аналогичная ситуация и для агента 0 - для него показателем использования агентом 1 механизма обмена ОУ служит совместность следующей системы
max
(90) ^
(r"max _ r)Я0
Константы M,N,O,P определяются из предлагаемым агентом 1 механизма обмена:
(91) x2(r0) = Mr0 _ N, r0 e Q0 = [r0,rmax]; x2(r0) = 0, r0 eQ0/Q0f;
(92) x (r0) = Or02 _ P, r0 e Q^ = [r0, r V ]; x,(r0) = 0, r0 eQ0/Q0f.
Полученное значение типа агента 1 может быть использовано для вычисления фактической прибыли агента 0 в роли центра:
12 - 13 i3 .
2 r 4r r f
6r l2
max
(93) f0C(r0,r1) = r2(----r^-), r0 eQ0, r1 eQ1;
Используя введенную ранее замену переменных - r0 = arm0ax, r0 = /b0ax, r1 = gix, Гпт = , перепишем фактические прибыли обоих агентов в
удобном для анализа виде:
a
(94) f0с(I,a,g,h) = I^-(6g2 - 4g3 +h3);
6
(95) /с(I,a,b,g) = Ig(2 - (1 - a)2 - (1 - P)P).
Для того, что бы интеллектуальный агент 0 предпочел роль АЭ роли центра необходимо выполнение следующего неравенства
a2
(96) Lo(a,b,g,h) = g[(1 - b)b- (1 - a)a] - (6g - 4g + h) 0.
6
Для того, что бы интеллектуальный агент 1 предпочел роль АЭ роли центра, необходимо, что бы
a2 1
(97) L (a,b, g,h) = a^(g3 - h) - g(2 - (1 - a)2 - (1 - b)b) 0.
6 2
Утверждение 4. Существует область значений параметров а, в, Y, П, ?0Iae = ?Г х Q0Jae х ?0Iae x QhIae в которой позиция АЭ предпочтительнее для интеллектуального агента с нулевым номером. Область ?0Iae = ?- х Q0Jae х QgIae x ?0ае имеет следующий вид:
(98) a е ?г = [(3 + 4 9 - 6(6 - m)(1 - b)b)(6 - m)-,1];
(99) b е?0Т = 4; 2(1 + 6^9 - 6m)];
2 2 6
(100) g е ?0'a* = [h,?j(43 -1)];
(101) heQIae = (0,i(32g3 - 48g2 + 12g)1/3].
_ 6g2 - 4g3 + h
Здесь используется замена m = ---.
g
Доказательство. Очевидно, что m 0.
Решив (96) как квадратичное неравенство относительно а, получим, что а е (-?,a~ ] u [а+, ?), где а± = (3 ± д/9 - 6(6 - m)(1 - Р)Р)(6 - m)-1, при условии, что m 6.
Покажем, что а' 1/2. Очевидно, что данное утверждение эквивалентно неравенству (102К/9 - 6(6 - m)(i - Р)Р m.
Неравенство (102) выполнено для me (-6(1 - 2Р)2,6). Учитывая (62) получаем, что данное неравенство выполнено всегда.
Если m 6, то а е [а~,а+], где
а* = (3 + 4 9 - 6(6 - m)(1 - Р)Р )(6 - m)-1.
Легко показать, что при m 6, а+ 1.
Следовательно, с учетом (62), (102) выполнено для
а е ?Г = [(3 + 4 9 - 6(6 - m)(1 - Р)Р)(6 - m) Ч].
Для того, что бы множество ?0^ было не пусто, необходимо, что бы
(103К/9 - 6(6 - m)(1 - Р)Р ? 3 - m.
Неравенство (103) можно переписать следующим образом
(104) m2 - 6m(1 + (1 - Р)Р) + 36(1 - рр 0.
в, получаем
Решив данное неравенство относительно
3
Р e [1(1 - - 6m);^(1 + - 6m)] и m?
Очевидно, что ^(1 - ^д/9 - 6m) ? 1 Следовательно, с учетом
2 6 2
ограничений на ц и (62), получаем Ре?ра = [2; 2(1 + 6 л/9 - 6m)],
0Iae = (0,2(32g3 - 48g2 + 12g)1/3]. Множество ?0ІЖ не пусто при
Ге?І= [hJ4-(-Jb -1)].^
На качественном уровне - интеллектуальный агента 0 добровольно согласится на роль АЭ, если качество его типа будет достаточно высоким, качество типа оппонента достаточно низким, и оба агента будут плохо информированы.
Утверждение 5. ?0ae п ?0Iae =0.
(Л -1) 2(1+h+h)
4 3
Очевидно, что для h
Доказательство.
Следовательно Q0ae п QgIae =0.и
Т.е. стратегии интеллектуального и квазиинтеллектуального агентов 0 различны в вопросе выбора роли АЭ.
Утверждение 6. ? / ?0ae п ? / Q0yIae ^ 0.
Доказательство. Рассмотрим h = 0,9.
Очевидно, что h ?0Ж и h ?0Iae. Т.е. для a,b,g, удовлетворяющих (61) и (62) (a, b, g, V) е? / ?^ и (а, р,у,т)) е? / ?^. ¦
Иными словами, возможны ситуации, когда и интеллектуальный и квазиинтеллектуальный агент 0 выберут роль центра.
Проведем аналогичное исследование для интеллектуального агента
1.
Утверждение 7. Существует область значений параметров а, в, Y, П, Iae = ? a/ae x ?'Ь* x ?uga *?^, в которой роль АЭ предпочтительнее для
интеллектуального агента 1. Область ?Ше = ?1^ x ?1^ x ?и7с,е x ?1^е имеет следующий вид:
(105) a е ?аae = [b,(1
1 - (2+(1 - b)b)(1 + X))(1 + X)'];
(106) /Зе;- = [2;2(1 -];
2 2 X
g,h, удовлетворяющие (61) и (62).
3 3
g -h
Здесь используется замена X =
6g
Очевидно, что X? 0 для g,h,
6
Доказательство.
удовлетворяющие (61) и (62). Перепишем (97) с учетом данной замены:
(107) L (a, b,g,X) = g(a-(X +1) - 2a + 2 + (1 - b)b)) ? 0.
Решение (107) как квадратичного неравенства относительно а имеет вид a е (-?,a" ] u [a+, ?), где a* = (1 ± ^ 1 - (2+(1 - b)b)(1+X))/(1 + X).
Легко видеть, что a+ 1 при b,X, для которых выполняются (61) и (62): g - (2 + (1 - b)b)(1 + X) ^ 1 - 3(1 + X) ^ 2 2,
Также, очевидно, что a~ 1 при b,X, для которых выполняются (61) и (62): для X 1 - 44 1 - 2Х.
По аналогии, b
Следовательно, множество ?ира не пусто для g,i, удовлетворяющие (61) и (62). ¦
На качественном уровне - интеллектуальный агента 1 добровольно согласится на роль АЭ, если качество типа оппонента достаточно низкое и информированность самого агента достаточно плохая.
Следует отметить некоторую схожесть множеств ?0Іае и ?1Іае - оба интеллектуальных агента предпочитают позицию АЭ, если их информированность невелика, а тип оппонента достаточно плохой. В тоже время, очевидны и различия данных множеств - агент 1 может предпочесть позицию АЭ для любого значения собственного типа и любой информированности оппонента, в то время как агенту 0 для этого потребуется плохая информированность оппонента и хороший свой тип.
Проанализируем, какие из ситуаций возможны в игре
интеллектуальных агентов.
Утверждение 8. В игре интеллектуальных агентов ситуация, когда оба элемента предпочтут роль АЭ, невозможна.
Доказательство. Очевидно, что оба агента выберут позиции АЭ, если множества ?0Іае и ?иа пересекаются.
Если же данные множества не пересекаются хотя бы по одной из переменных, то данной ситуации не возникнет. Можно показать, что Q0Jae п ?иаае = 0. Из (98) и (105) видно, что пересечение пусто если следующая функция положительна
1 -j 1 - (2 + (1 - b)b)(1 + X)
1+X
3 + 7 9 - 6(6 - m)(1 - b)b 6 - m
(109) t (b,mX)
для b e ?Г п ?Ьае, g e ?Іае п ?1^, ?^е ?Іае п ?'1ае. Здесь
g -h 6g -4g3 +1
сохраняются замены X =-, m =-.
6g g
Можно установить связь между ц и X- m = 6g - 3g2 - 6X.
Учитывая, что для b е QJae n 0ubae ge 0gIae n 0gIae, h е n 0^
дт (b,m,X) б б
производная -- положительна, достаточно будет потребовать
дЬ
выполнения следующего неравенства:
з + Лт 1 - Уі - 3Х
[3~
1 - ?2' 2
т (-, m,X) = -2 6 - m
Данное неравенство можно представить иначе:

(по)?Г-зХ + J 3 т-1 о.

Неравенство (110) выполнено для g е 0gIae n0gae, h е QhIae n 0lhIae.
Следовательно, функция (109) положительна. ¦
Из доказанного выше утверждения следует, что при взаимодействии интеллектуальных агентов возможна конфликтная ситуация, когда оба агента настаивают на позиции центра. Предполагается, что разрешение данной ситуации также основывается на компенсациях за отказ от позиции центра, которые агенты могут предлагать друг другу.
Определить, кто из агентов может стать центром, можно, проанализировав разность выражений (96) и (97): (111)L(a,b,g,h) = g(a - 2) - ag(1 - g).
Если функция L(a,b,g,h) 0, то позиция центра доступна интеллектуальному агент 1. Если функция L(a, b,g,h) 0, то интеллектуальному агент 0. Случай L(a, b,g,h) = 0 можно назвать критическим, т.к. возможности обоих агентов равны.
Достаточно очевидно, что функция L(a,b,g,h) 0, если
dL dL
Доказательство. Очевидно, что (a,b,g,h) = 0 и (a,b,g,h) = 0.^
dfi dh
Функция L(a, b,y,h) 0, если ae (1,). С учетом ограничений
2 - g g
(112)a
(61) и (62) получаем, что центром станет агент 0, если 1
2-g
Можно записать данное условие в терминах абсолютных значений типов агентов:
(113)r0 ^
0 r r1
0 ^ max max 2r - rr
max
Можно записать прибыль агента 0 в роли центра:
C 2 r1 4r1 r1
/0C (r , r') = r 2(----2^ )¦
' 1 /- 12
r max 6 r max
Г A 1 / 02 /0 ^V0 (2r r max) \ 02/r r mm 4-1
max[0, r (r (r max r )r --) r (-2-)]
(114)
6r 12
max
Соответственно прибыль агента 1 в роли АЭ:
6r 12
max
(115)fae(r0,r0 = max[r(r2 (r0max r0)r0 (2r J ),r2(^-^)].
. , 1 0 r0 r1
Агент 1 станет центром, если a--, т.е. r max max1 . Его
2r1 r1
max
2g
прибыль:
(2r0 r max) 2
fC (r 0, r 0 = r 4r 02 (r 0max r 0)r 0
)
(116)
12 - 13 13
max[0, r o2( ---r-rmn-) r '((r^ r 0)r0 (rl r 0)r0)]
r max 6r max
Прибыль агента 0 в роли АЭ:
12 . 13 13
(117) /0ae (r0, r') = max[r 2( ---Г--^ ), r '((rl r 0)r0 (rl r 0)r0)].
r max 6r max
о r0 r1
Ги _ max max
в данной работе не
Ситуация
или
2r1 - r1
рассматривается.
На качественном уровне, полученные выше результаты для игры интеллектуальных агентов можно трактовать следующим образом: в обменной схеме, состоящей из двух равноправных агентов, роль центра возьмет на себя тот агент, чей тип является достаточно плохим, в то время, как тип оппонента является достаточно хорошим. Соотношение типов определяется выражениями (112) или (113).
Следует отметить, что в игре интеллектуальных агентов не рассматривалась возможность искажения предлагаемых планов. Т.е. агент предлагал оппоненту план (механизм обмена ОУ), соответствующий его истинному типу.
Возможность искажения собственного плана можно расценивать как следующий уровень интеллектуальности агентов.
Еще одним направлением дальнейших исследований можно считать изучение обменных схем, агенты которых обладают различным уровнем интеллекта.
Результаты раздела 2.3 представлены в таблице 2. Используется
обозначение a (g) _ 1.
2 - g
Зависимость распределения ролей между агентами от параметров ОСо второй главе были получены следующие результаты. В разделе
2.1 показана эквивалентность задачи обмена и задачи стимулирования в условиях неполной информированности центра.
В разделе 2.2 построены эффективные неманипулируемые механизмы обмена для двухэлементных иерархических обменных схем с неполной информированностью центра;
В разделе 2.3 построены эффективные неманипулируемые механизмы обмена для двухэлементной обменной схемы без иерархии в условиях неполной информированности участников



НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Данная глава работы посвящена исследованию механизмов ОУ в ОС с конечным числом элементов.
В раздел 3.1 рассматривается ОС с веерной структурой взаимодействия элементов и одним уровнем иерархии. Т.е ОС состоит из одного центра и конечного числа АЭ.
Для многоэлементных ОС, соответствующих многоэлементной задачи стимулирования строится эффективный механизм обмена ОУ.
В разделе 3.2 рассматриваются ОС со структурой взаимодействия элементов типа цепочка и одним уровнем иерархии. Предлагаются три метода построения неманипулируемых механизмов обмена для случая, когда общий метод неприменим.
Первый метод - метод консолидации АЭ - центр рассматривает всех АЭ как единый АЭ и решает задачу нахождения механизма обмена ОУ для полученной двухэлементной ОС. Второй метод - метод разбиения схемы - центр взаимодействует с каждым АЭ по отдельности.
Третий метод - метод доносчика - центр делегирует права промежуточного центра тому АЭ, который сообщит наилучшую оценку типов всех АЭ. Также приводится ОС со структурой взаимодействия элементов типа цепочка и одним уровнем иерархии, для которой возможно применение общего метода построения неманипулируемого механизма обмена.
В последнем разделе третьей главы обсуждается применение полученных автором теоретических результатов при решении прикладных задач.
Полученные автором результаты, содержащиеся в этой главе были опубликованы в работах [32,35,38,42]
3.1. Неманипулируемые механизмы обмена для обменных схем с веерной структурой взаимодействия агентов
Рассматриваемая нами обменная схема будет представлять многоэлементный вариант обменной схемы, рассмотренной в разделе 1.1 (см. рисунок 10).
НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Рис. 10. Многоэлементная ОС с веерным типом взаимодействияагентов
бменная схема состоит из n +1 агентов - одного Центра и n АЭ. В системе имеется два типа ресурсов. Ограничения на ресурс примем
стандартными - A = y'j = Y}; j = 1,2}. Центр может обмениваться с
i=0
каждым из АЭ, АЭ не могут обмениваться между собой. Функции предпочтения имеют следующий вид:
(118) j( У:0, у) = y0 + H (у 2);
граничения индивидуальной рациональности достаточно просты -
IR(y0) = (i = .n j(Уі) j(Уі0)}.
Начальное распределение ресурсов задано следующим образом - весь ресурс первого типа сосредоточен у Ц, весь ресурс второго типа - у АЭ:
Y о
о у10
, Z у20 = Y2.

уи

i =1
Значения Y1 и Y2 выбираются таким образом, что бы рассматриваемая модель могла соответствовать определению обменной.
Запишем функции прибыли от обмена для центра:
(120) fo (x0, x2) = j (Y - x0, X) - j(Y ,0) = H (x20) - x0;
для АЭ:
(121) f (x1, x2) = ji(x1, у2 0 - x2) - ji(0, у2 0) = x1- e(x2, r)-Причем очевидно, что x = ^ xj, j = 1,2.
i=1
Следует отметить, что заданные ограничения ИР можно достаточно просто выразить через функции прибыли агентов от обмена:
IR={ fi (xt) 0; i = 0,n }.
Постановка задачи - найти механизм обмена ОУ p(s), максимизирующий ожидаемую прибыль центра от обмена -Ef (p(s)) ^max, при условии, что ему известны Q = [rmin,rmax] и вероятностное распределении типов АЭ - p(r), одинаковое для всех агентов.
Утверждение 10. Если функция предпочтения центра линейная, то неманипулируемый механизм обмена иметь следующий вид:
де
(ri) = e(xi2(ri),Г) - j (x2(t),T)dT, i = Yn;
J dr
x1
'min i
Z Y'. (r-i) = Yj, j = 1,2.
i =1
Доказательство. При выполненных условиях теоремы 1 для каждого АЭ можно записать его прибыль v(r,s_i) = J (xt(t,s_t),t)dT, i = 1,n.
r ¦ dri
'min '
Учитывая вид функций полезности АЭ, получаем, что
x1 (ri, s_i) =c(x2 (ri, s_i X r) _ J ^(x2 (t s_i ),t)dt, i =1 nr . dr
Очевидно, что функция предпочтения центра линейна, если H(y2) = ay2. Поэтому, функция полезности центра при использовании
неманипулируемого механизма обмена p(r) = (xf(r),x2(r),...,x(r),x2n(r)) будет иметь следующий вид:
Vo(r) = /с (Z 1(r X Z 2(r)) = Z V (r).
i =1 i =1 i =1
ri Qc
Где КО(r ) = a2(r ) _c( x2 (r, r_i), r) + J o-(x2(t, r_i),t)dt.
'min i
J dr
Следовательно, задачу максимизации ожидаемой прибыли центра можно представить виде задачи динамического программирования:
dc
x2(r,r_i) = argma J J [ox; _ c(x2,r) + J (x2,t)dt]P(r )p\r-l )dridr-i, i = Xn;
2 Q q^1
x2 (r, r_i) ? Y2 _ Z x2 (rj, r_,), xl (ri, r_i) ? Yi _ Z 1 (rj, r_,), i = X n ¦
n / i
Очевидно, что для i = 1, n функции x2 (r, r_t) имеют одинаковый вид. Причем их можно представить в следующем виде - x2 (r, r_) = x2 (r), где x2 (r) является решением задачи динамического программирования:
x,
i* i* I* dc
(r ) = argmax J J [ax2 _ c(x2 , r ) + J (x2 ,t)dt]P(ri )p'(r_i )drdr_i , i = 1
QQ
x~ J J / dr
x2(^ ) ? Y2 _Z 2(r, ) = Y2 (r_i ), i (ri ) ? Y1_Z i (r, ) = Y1(r_i ), i = 1 n¦
n/i
n/i
При этом Z Ylj (r_t) = Yj, j = 1,2. ¦
i =1
Иными словами, для рассматриваемой модели ОС с веерным типом взаимодействия агентов задача построения неманипулируемого механизма обмена эквивалентна задачи для ОС с одним АЭ. Задача построения эффективного и неманипулируемого механизма обмена разбивается на две задачи - задача построения эффективного и неманипулируемого механизма обмена для ОС с одним АЭ и задача оптимального распределения ресурсных ограничений между АЭ.
Поясним вышесказанное. Эффективный и неманипулируемый механизм обмена имеет следующий вид - p(r) = (p(~),...,Р(~)). p(r) = (xx(r),x2(r)) -эффективный и неманипулируемый механизм обмена для ОС с одним АЭ:
Функция полезности Ц - f0( хг, х2) = H (х2) - хг;
Функция полезности АЭ - f (xt, x2 ) = xt - c(x2, r);
dc
Хі(Г ) = C( x2(r X r ) -
(x2(r),t)dt,
dr
X2(r) = argmax Efofxjfx^x^r).
x2
r - назначаемый тип і-ого АЭ, задается следующим образом: ~ = min[r, r ]. Критические типы r определяются выполнением
ресурсных ограничений: ^ хх (r) = Y или ^ х2 (r) = Y2. Задача
і=1 і=1
оптимального распределения ресурсных ограничений между АЭ: ?о(Г)-®max, r = (r,...,r ).
r
Метод построения эффективных и неманипулируемых механизмов обмена для ОС с веерным типом взаимодействия агентов может быть проиллюстрирована на примере следующей задачи.
Задача 5. Построить эффективный неманипулируемый механизм обмена для ОС состоящей из центра и двух АЭ. Функции полезности от
і2
2
обмена центра - f0 (хх, х 2) = х 2
2r
і
r eQ = [rmin,rmax], i = 1,2. Ограничения x2 Y2. Центру известно, что
r - r.
max mm
распределение типов АЭ равномерно - F (r)
Механизм ОУ p(r) = (x 1i(r1), x 12(r1), x 2i(r2), x 22(r2)) имеет следующий вид -
p(r) =(p (~),p (~2)); r, r. e Q', r . e Q
г ’ г ? -г
maX[^ ,(rmax Y2 - r-i 2)1/2], r eW / Q r-i eW' , . = l2;
r ={
i max 2 -i
r , r. e Q / Q', r. e Q/ Q'
i -i
r Y
Q' = [rm.n, r], r = (-^r.
л 2 . /V 3 3
„ r. 4r. r .
2
max
6r
Здесь p(r) = (x1(r),x2(r)): x.2(r) =-^-, x. 1 (r.) = г min
Утверждение 11. Механизм p(r) = (p (~),p (r2)) является
неманипулируемым и оптимальным.
Доказательство. Очевидно, что неманипулируемый механизм обмена p (r) = (x1 (r), x2 (r)) является оптимальным для ОС с одним АЭ.
Задача оптимального распределения ресурсных ограничений имеет следующий вид:
2(ri3 + r23) - r
22
r + r
1 2 = Y
J- 0 .
3
min
?о(Гі, r2) = Y2
® max,
3r
2
max
1 '2
Yr
r = (^Г2.
Не трудно видеть, что r1
Задача оптимального распределения ресурсных ограничений является частным случаем задачи распределения ресурсов, для которой доказана оптимальность неманипулируемых механизмов планирования (см. теорема 5.3 [52]).
Используя метод множеств диктаторства [53] можно показать неманипулируемость предложенного метода определения назначаемых типов ~ и r2. На рисунке 11 решение задачи обмена представлено в графическом виде.
НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Рис. 11. Множества диктаторства
ОбластьD12: p(r) = (P(r1 ),P(r2)) - обоим АЭ назначаются планы в соответсвии с их заявками. Область D1: p(r) = (p(r),P(~)) - АЭ 1 является диктатором - назначаемые планы зависят только от его заявки. Область D2: p(r) = (P(~),P(r2)) - АЭ 2 является диктатором - назначаемые планы зависят только от его заявки.
Область D : p(r) = (Р(r),P(r)) - планы обоих АЭ не зависят от их заявок. Поэтому, в соответствии с теоремой
2.1.1 [53] предложенный метод определения назначаемых типов
неманипулируем. Следовательно, неманипулируем и весь предложенный механизм обмена. ¦ -
Полученные в данном разделе результаты, вероятно, могут быть перенесены на более общий вид модели ОС с веерной структурой взаимодействия агентов. Но это является предметом дальнейших исследований. Перейдем к рассмотрению ОС со структурой взаимодействия агентов типа цепочка
3.2. Неманипулируемые механизмы обмена для обменных схем со структурой взаимодействия агентов типа цепочка
Пример подобной ОС изображен на рисунке 12.
НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Рис. 12. Многоэлементная ОС со структурой взаимодействия агентов типа цепочка
С состоит из центра и двух АЭ. В системе имеются ресурсы трех типов. В обмен на получаемый от центра ресурс типа 1, АЭ1 передает АЭ2 ресурс типа 2. В свою очередь, АЭ2 в обмен на полученный от АЭ1 ресурс типа 2 передает центру ресурс типа 3.
Вид функций полезности от обмена:
(122) f0(x1,x3) = x3 - cx1 для Ц,
(123) /,(x15x2,r) = rx, - x2 для АЭ1,
(124) /1(x2, x3, r2) = r2x2 - x3 для АЭ2.
Ресурсные ограничения в терминах трансфертов имеют следующий вид А={xt е [0,1^],x2 0,x3 0}. Центру известны диапазоны возможных значений типов АЭ r eQi = [rt,r]. Задача центра - построить механизм обмена ОУ, максимизирующий его гарантированную относительную
®max, s = (у,s2) - вектор сообщений АЭ
прибыль от обмена min
/0(p(s))
/оЙе‘(^) оценок своих типов.
Лемма 6. Максимальный доход выражается:
(125) /0det(ri,r2) = (ГГ -c)^.
Доказательство. Действительно, руководствуясь принципом индивидуальной рациональности для активного элемента, получаем из (123) и (124), что r1x1 x2 и r2x2 x3. Поэтому /0,det (r;, r2) (r1r2 - c)x1 и
достигает максимума при x; = Y1. ¦
Рассмотрим различные методы построения неманипулируемого механизма обмена для предложенной ОС.
Метод консолидации АЭ.
Центр рассматривает всех АЭ как единый АЭ и решает задачу нахождения механизма обмена ОУ для полученной базовой ОС (см. рисунок 13.).

Рис. 13. Метод консолидации АЭ
Фактически мы рассмотрим взаимодействие центра с коалицией, состоящей из двух активных элементов. Пока мы ничего не предполагаем относительно того, как будут взаимодействовать АЭ между собой (т.е какой будет дележ). Но очевидно, что для любого положительного выигрыша данной коалиции найдется такой дележ, когда выигрыши обоих АЭ будут неотрицательны. Поэтому предположим, что для при любом плане обмена, предложенном центром, выигрыш коалиции от которого не отрицательный, оба АЭ не откажутся от участия в обмене. Устанавливать дележ между собой АЭ могут путем определения количества ресурса типа у, который АЭ1 передает АЭ2.
Таким образом трансферты в цепочке остаются прежними.
Лемма 7. Целевая функция коалиции записывается следующим образом:
(126) fn = Г1Г2Х1 - Х3.
Доказательство. Рассмотрим некий план (x1vx3), предложенный центром.
Предположим, что АЭ сообщили и или знают истинные значения обменных коэффициентов друг друга. Из (123) и (124) получим следующее выражения:
Х2 = Гі Xi -fi.
Следовательно
f2 = k2 (ki X -fi) - Z.
Следовательно
(127) f2 + kfi= k2 ki x - z.
В левой части выражения (127) стоит суммарный выигрыш обоих АЭ в размерности ресурса типа z, т.е. суммарный выигрыш коалиции, а правая часть совпадает с правой частью выражения (126).
Рассмотрим аналогичным способом ситуацию, когда оба АЭ взаимодействуют между собой на основании некоторых произвольных заявок 5,1=[rj,r1] и s2=[r2,г2]. Иными словами АЭ искажают информацию о своих обменных коэффициентах (очевидно с целью получения дополнительной прибыли). Тогда по аналогии с (127)
/2'+ sfi'= S2 Si Xi - X3,
гдеfi'иf2' "заявленная" прибыль АЭ. Но из (123) и (124)
X2 = ri Xi -f 1;
X3 = Г2 X2 -fi.
Где fi и f2 - полная прибыль каждого из АЭ. Следовательно выражение
(127) будет выполняться для истинных значений прибыли участников коалиции:
f2 + rfi= Г2 Гі Xi - X3.
Тем самым мы доказали, что целевая функция коалиции записывается выражением (126). ¦
Т. е. мы получили обменную схему состоящую из центра с функцией полезности (122) и одного АЭ с целевой функцией (126). Центр знает диапазон возможных значений обменного коэффициента АЭ W=[ r 1 r 2, rlr2\.
Используя построенный в главе 1 неманипулируемый механизм обмена для задачи 4, построим механизм открытого управления [xi(s),xs(sj\., где S=S!S2.
(128) *i( s) = Yi;
m( s)
Ж;
(129) x3(s) = m(rir2)(s-c(1
m( s)
где (130) m(s) = [i + in s c \-1.
r 1 r 2 - c
Функция полезности центра при использовании данного механизма записывается как
(131) /оА s2) = m(r1r2)(s1s2 - C)Y1-
Утверждение 12. Оптимальные заявки для коалиции будет s*=rlr2.
Доказательство. Из (126), (128), (129) и (130) следует, что
а/12 = m(r-r2)s-(r1 r2 - s1sY1, І = 1,2-
ds
d2 /1
s1s 2 - c
s- (rr2 - c)
= -m(r1r2)-Y'
12
dyds2 s1 s2 - c
Таким образом, видно, что максимум / достигается при sls2=rlr2 , так
5/12-П „ 5 2/12
12
ds1ds2
0 при si=rlr2/ s-i.u
0, а
как для si
ds.
Следовательно, построенный механизм обмена (128) - (130) можно назвать механизмом открытого управления для коалиции. Но данный механизм нельзя назвать полным, т. к. он не определяет размер трансферта ресурса типа 2. Предполагается, что коалиция АЭ сама сумеет поделить полученный ею выигрыш от обмена.
Рассмотрим, каким образом можно ввести в механизм обмена (128) -(130) зависимость размера трансферта ресурса типа 2 от заявок игроков.
Утверждение 13. Не существует такой функции x2(s1,s2), для которой выполнялись бы следующие требования:
Г = argmax/(у, ^);
si
Г2 = argmax /2(si, s2).
s2
Доказательство. Для выполнения приведенных в утверждении требований необходимо, чтобы x2(sj,s2) удовлетворяла следующей паре
fif fif
дифференциальных уравнений: (r1, s2) = 0 и (s1, r2) = 0.
ds1 ds2
С учетом формул (128) - (130) получаем, что
fix s s
(132) -ЧуS2) = m(rlf2)Yl -1-2-;
GS1 S1S2 - C
2
s1
S1S2 - C
fix2
fiS2
(133)
(s1 s2) = m(r1r2)Y1
Из (132)
получаем
-m(r1r2)Y1 (s1s
получаем
fix2
fis1fis2
s1C
(S1 s2) =
C)
Из (133)
5x2 2yc - у s2
2 (s1s2) = -m(r1r2)^-x 1 2
(S1S2 - C)
fiy ф fiy
fis2 fis1
Поэтому не
Следовательно
существует такой удовлетворяющей
ds1ds2 ds2ds1
непрерывно-дифференцируемой функции x2(s1,s2), требованиям утверждения. ¦
Рассмотрим, как может повлиять назначение центром размера трансферта ресурса типа 2 в зависимости от заявок игроков, исходя из предположения, что АЭ поделят выигрыш от обмена поровну:
(134)rf .
( 1 1) ае (--^).
x2
Лемма 8. При дележе выигрыша f2= rf максимум функций полезности каждого АЭ будет достигаться при тех же заявках, при которых достигается максимум выигрыша коалиции, т.е. при s1s2*=r1r2.
fi
Доказательство. Из (127) и (134) следует, что Г r2 Х1 - x3 _ f 12 .
2r
2r
f = rir2X1 - X3 _ fn
1 2 2 ‘
В соответствии с утверждением 12, максимум значений целевых функций АЭ будет достигаться при s1s2=r1r2.rn
Трансферт ресурса типа 2, соответствующий дележу (134) можно записать следующим образом:
(135) r2)
r1r2 Х1 + Х3
2r2
Но центру не известны истинные значения r2 и r2. Поэтому для центра выражение (135) записывается следующим образом:
S 2 Х1( S) + Х2( S)
2S 2
(136) Х2( S = S1 S2)
К сожалению, механизм обмена, определяемый (128), (129) и (136) не является механизмом обмена открытого управления, так как для каждого АЭ в отдельности сообщение истинного значения своего обменного коэффициента не является доминантной стратегией. Более того, верно следующее:
ds.
г
’ ds .
0, i = 1,2.
Хотя утверждение 12 выполняется и для данного механизма.
В качестве решения данной проблемы, можно предложитьследующую модификацию механизма обмена (128), (129) и (136),основанную на механизмах Маскина [66] и МакКельви [83] - каждый АЭсообщает центру оценки как своего обменного коэффициента, так икоэффициента другого АЭ - {s^s.^-}. В случае совпадения заявок от обоихАЭ, центр назначает им план по (128), (129) и (136) в соответствии с 102 сообщенными ему заявками.
В случае не соответствия заявок - s1j^s1,2 или s2j^s2'2, центр выбирает некоторый произвольный план, основанный на представленных заявках, например у = max[sii,у_г ], i = 1,2. Т.е.
выбираются максимальные из сообщенных заявок. Необходимо заметить, что и для такой модификации механизма обмена (128), (129) и (136) утверждение 12 верно.
Для механизмов Маскина и МакКельви предполагалось, что АЭ полностью информированы о параметрах всех участников АС. Для нашего механизма можно ввести такое же допущение, либо предположить, что АЭ как-то информируют друг друга о своих параметрах в ходе их коалиционного взаимодействия.
Метод разбиения схемы
НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Рис. 14. Метод разбиения схемы
Для данного способа необходимо разбить первоначальную схему на две подсхемы (см. рисунок 14). В первой подсхеме центра дает АЭ1 некоторое количество ресурса типа 1 , и забирает от него некотрое количество ресурса типа 2. Во второй подсхеме центр дает АЭ2 некоторе количество ресурса типа 2, а получает некоторое количество ресурса типа 3.
Лемма 9. Для обеспечения максимальной эффективности функционирования данной схемы центру необходимо передать АЭ2 все количество ресурса типа 2, которое он получил от АЭ1.
Доказательство. Из (122) следует, что прибыль центра не увеличивается с ростом наличия у центра ресурса типа 2, в то время, чем меньше ресурса этого типа Ц передаст АЭ2 тем меньше он сумеет получить ресурса типа 3. Следовательно центру, для повышения эффективности обмена, необходимо передавать АЭ2 весь ресурс типа 2. ¦
С учетом вышесказанного запишем целевые функции всех участников обмена следующим образом. Для первой подсхемы:
(137) foi = ax2 - cxi;
fl = Г1 Xi - X2.
Для второй подсхемы:
(138) fo2 = X3 - 0X2;
f2 = Г2 X2 - X3,
где a - произвольным образом введенный обменный коэффициент для центра по ресурсу типа 2. Легко видеть что для ?а(137) и (138) в сумме дают (122).
Но для правильного построения механизмов открытого управления для каждой из подсхем необходимо ввести следующие ограничение на о :
c
(139) ае (, r 2).
r 1
Множество возможных значений о не пусто при выполнении условий
Г1 r 2 c.
Теперь перейдем к построению механизмов обмена для обоих подсхем.
Для первой схемы все достаточно просто - это простая задача классического обмена, рассмотренная в разделе 1.2. При рассмотрении второй схемы мы сталкиваемся с большими трудностями - центру необходимо отдать АЭ2 весь ресурс типа и сохранить неманипулируемость механизма обмена.
Введем следующую зависимость плана обмена для первого АЭ от заявки второго:
mir) m2(r2) Y.
m(si) m2(s2) 15
(140) у( у, у)

C (1__L_) m2(r2) Y

a mCO m2(s2) 1
(141) Х2(У S2) = Ml(ri)(S1
где
, 4 r„ , s. - c/a_
(142) m (sx) =[1 + In -] ;
r j - c/a
S2 ~ a ]_1 r 2 _ a '
(143) ju2(s2) = [1 + ln
Формулы (140) и (141) представляют механизм обмена ОУ для задачи
тЖ)
классического обмена, помноженные на
*2 У 2 -
тЖ2)
Обозначим
c1
(144) Y2(у) = ml(rl)(sl - -(1--))Y1.
a MW
Тогда (141) можно переписать следующим образом:
(145) x2(s„ s2) = У) Y2( s,).
m( s2)
Выражение (145) аналогично выражению, определяющему первую компоненту плана обмена в механизме обмена ОУ для задачи классического обмена. Отсюда следует, что вторую компоненту плана обмена для АЭ2 можно будет записать следующим образом:
(146) хз(У s2) = тЖ2Ж2 _ a(1--^)Y2(s1).
m2(s 2)
Выражения (140), (141) и (146) являются механизмом обмена между центром и двумя АЭ, полученным методом разбиения схемы, так как полностью определяют трансферты всех ресурсов в системе.
Утверждение 14. Механизм обмена, определяемый выражениями (140), (141) и (146), является механизмом открытого управления.
Нам необходимо показать, что максимум целевых функций обоих АЭ будет достигаться при сообщении ими истинных значений своих обменных коэффициентов. Из (123), (140), (141) и (146) следует, что
S s,, ,2) = йЩ m(r-) JL-5_;
оу m(s2) s - c /_
d2 f, X m2(r2) ,_4 T - c/_
(s2) = -^^-
(S1 - c / _)
ds
OS1- (S1, S2) = Y2 (S1 )й2 (Г2 ) T-2^ ; ds1 s2 - _
0 ^ (S1 , S2) = -Y2 (S1 )й2 (T2 kl _
ds; 4 ^ * ^2 -_)
Следовательно, с учетом ограничений модели и (139), получаем, что максимум функции полезности АЭ1 достигается при s1=r1 , для АЭ2 - при
S2=r2-rn
Сравним эффективности механизмов, построенных в данной и предыдущей главах - (128), (129) и (140), (141), (146). Эффективность неманипулируемого механизма обмена, полученного первым методом записывается:
K1 = m(T1T2);
Полученного вторым методом -
m1(T1)m2(T2)
(Г1Г2 - С)
(147) K 2
(T1
))(Т2 - _(1

))

й2(Т2)
Проанализируем полученные выше выражения.
Лемма 10. ?т15 т2, удовлетворяющим ограничениям модели, верноследующее - 1. mte) m(r1 X mte) m(r2 ^ 2. mte) ^ m (r (T2).
Доказательство. С учетом ограничений на параметр а получаем следующие неравенства:
T - c/_ t r2 - c - c(r2 /_ -1) t r2 - c TjT2 - c r1 - c/_ ri T2 - c - c(r2/_- 1) r1 r2 - c ri T2 - c ’
r2 - a rj r2 - c - (ra - c) rj r2 - c rj r2 - c
Из полученных выше неравенств очевидным образом следует, что m(kjk2)m(K) и m(kjk2)М2(к2)-
Для доказательства второго утверждения рассмотрим следующую функцию
м (rj r2) = m(rj r2)/ mj(rj)m2(r2)-
Очевидно, что M (r j r 2) = 1. Кроме того,
om m( ч2)
(rir2) = 12
or
mj(rj) rm( r1r2)
Ml( ri)M2(r2)
12
r - c/a rr - c
m(rir2)2 c(r2/a- j)
dM
dr
(rir2)
0;
mj(ri)m2(r2)(ri- c/aXrir2- c)
m2(r2) riM(rir2)
ом( ) mte)
(rir2) =-
dr2
Мі(Г1)М2(Г2)
m(rir2)2 (ria - c)
r2 - a rir2 - c
dM
(rir2)
0.
Or2^ Ml (ri )М2 (r2 )(r2 - a)(ri r2 - c)
Следовательно Ju(r1 r2) jU1(r1)m2(r2), так как функция M(r1r2)-возрастающая. ¦
Далее, можно показать, что
c 1 1 c
(r - - (1--))(r2 - a(1--))----
a M1(r1) M2(r2) M1(r1)M2(r2) = rr + c(1--1---1) - ra(1
(148) M1(r1) M2(r2)
1 N c 1 S ^ 1 ,
) - r1(1--) - r2 (1--~)
r1r2 + c(1 -
MM M2(r2)
M2(r2)
mM'
r1r2 - c
Утверждение 15. Консолидированный неманипулируемый механизм обмена обладает большей эффективностью, чем неманипулируемый механизм обмена, полученный методом разбиения схемы.
Доказательство. Из неравенства (148) следует, чтоK2 jul{rl)m2{r2). А из Лемма 10 - K2 ? m(r1r2) = ?)- ¦
Но механизм (140), (141), (146) однозначно задает трансферты ресурсов всех типов в обменной схеме и побуждает АЭ сообщать центру истинные значения обменных коэффициентов, а не результирующего обменного коэффициента, как в механизме (128), (129) (или в его модификации (128), (129) и (136)), что может быть актуальным в отдельно взятых обменных схемах.
Метод доносчика
НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Рис. 15. Метод доносчика
Данный способ подразумевает, что центр каким-то образом присваивает одному из АЭ роль промежуточного центра (или посредника) и назначает ему некий план обмена. Посредник, в свою очередь, назначает некий план обмена между собой и оставшимся АЭ (см рисунок 15).
Не трудно показать, что в случае полной информированности обоих АЭ и отсутствия возможности их кооперации данный способ позволяет устранить неполную информированность центра и свести задачу обмена к детерминированной. Данный механизм обмена выглядит следующим образом:
Центр просит каждого из АЭ сообщить свою оценку их общего обменного коэффициента r2 r1. Затем центр выбирает АЭ, сообщившего наибольшую оценку, и назначает ему следующий план обмена
(149) Xi=Yi; X3=Si Yi,
где i - номер АЭ, которого центр назначил посредником. Так как посредник обладает полной информированностью относительно параметров другого АЭ, то он решает детерминированную задачу обмена:
(150) X2=s1/r2Y1; хз= sjYj, если посредник - АЭ1 и
(151) Xi=Yi; X2=riYi, если АЭ2.
Очевидно, что всю прибыль от обмена между элементами получает посредник. Следовательно, каждый из АЭ будет стремится сообщить максимально возможную заявку.



НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В ДВУХЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

В данной главе производится анализ базовых обменных схем -схемы, состоящих из двух агентов (рисунок 5).
НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В ДВУХЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Рис. 5. Базовая обменная схема
Относительная простота задач, сформулированных на основе данных ОС, наглядность их решения, возможность представления немалого числа фундаментальных задач из области математической экономики виде подобных ОС - все это делает изучение простейших обменных схем крайне актуальным. В разделе 2.1 строится модель ОС, соответствующая модели АС для задача стимулирования.
Доказывается эквивалентность решений детерминированных задач стимулирования и обмена для соответствующей ОС. Осуществляется переход от детерминированной ОС к ОС с внутренней неполной информированностью центра - вводится тип АЭ, не известный центру.
Формулируются условия на зависимость функции предпочтения АЭ от типа, при выполнении которых возможно применение общего метода построения неманипулируемого механизма обмена.
Раздел 2.2 посвящен построению механизмов ОУ в двухэлементных ОС с внутренней неполной информированностью. Рассматриваются дискретный и непрерывный методы построения механизмов ОУ.
Дискретный метод построения неманипулируемых механизмов обмена основан на графическом анализе функций предпочтения агентов. Непрерывный метод является частным случаем предложенного в разделе 1.5 общего метода построения неманипулируемых механизмов обмена.
Доказана эквивалентность двух предложенных методов.
Раздел 2.3 посвящен решению двухэлементных задач обмена без иерархии. Предлагается метод решения подобных задач, основанный на механизмах ОУ для аналогичных двухэлементных иерархических ОС.
Агенты самостоятельно распределяют между собой роли Ц и АЭ. Определяется распределение ролей в зависимости от параметров ОС для квазиинтеллектуальных (не производящих анализ сообщений оппонента) и интеллектуальных (анализирующих сообщения оппонента) агентов.
Полученные автором результаты, содержащиеся в данной главе, были опубликованы в работах [33,34,36,39,41].
2.1. Представление задачи стимулирования в виде задачи обмена
Рассматривается задача стимулирования в АС, состоящей из центра (Ц) и одного активного элемента (АЭ) [18,45,53]. Целевая функция центра Ф((г, у) представляет собой разность между его доходом H(y) и стимулированием s(у) АЭ. Целевая функция АЭ f(s, у) - разность между стимулированием, получаемым от центра, и затратами с(у):
(10) F(s, у) = H(y) -s(у);
(11) As, у) = s(у) - с(у)¦
у е Y - действие АЭ.
Относительно параметров АС принимаем стандартные предположения [18,45,53]:
А.1. 1) функция с(-) непрерывна по действию АЭ; 2) у е Y с' (у) 0;
3) у е Y, с (у) 0; 4) с(0) = 0.
А.2. Функции стимулирования кусочно-непрерывны и принимают неотрицательные значения.
А.3. Функция дохода центра непрерывна по всем переменным и достигает максимума при ненулевых действиях АЭ.
Задача синтеза оптимальной функции стимулирования заключается в поиске допустимой системы стимулирования s*, имеющей максимальную гарантированную эффективность K(s) = min Ф(, у), определяемую как
уеР (s)
гарантированное значение целевой функции центра на множестве решений игры Р(7) = argmax /( ,у): (12) dr * = argmax K(cr),
saM
где М - множество систем стимулирования, удовлетворяющих предположению А.2.
В [45,52] доказано, что решение задачи стимулирования в рассматриваемой модели имеет вид
(13) s (у)

с(у ), у = у

0, у * у * где

(14) у* = arg max (Я(у) - с (у)}.
yaY
Для рассмотрения действия АЭ как некоего ресурса, область его возможных значений Y можно задать как отрезок [0,Y2]. Сформулируем описанную задачу как задачу обмена. Схема состоит из двух участников (центр и АЭ), один из которых - организатор обмена (центр) обладает полной информированностью о параметрах обменной схемы.
В схеме имеются ресурсы двух типов - деньги и действие. Наложены ресурсные ограничения A = {у 0і + у \ = Yy у 02 + у^ = Y2}
Функция предпочтения центра записывается следующим образом:
(15) j( У і, У 2) = у 0і + H (у 02).
Функция предпочтения АЭ:
(16) j(УЬ У12) = У1! - c(Y2 - У12).
Ограничения индивидуальной рациональности достаточно просты -Щу0) = {?і = 0,1 j(у.) j(у.0)}.
Ограничений на возможность взаимодействия между Ц и АЭ также нет - они могут осуществлять между собой трансферты ресурсов всех типов, присутствующих в модели.
Начальное распределение ресурсов задано следующим образом - весь ресурс первого типа сосредоточен у центра, весь ресурс второго типа - у
АЭ: у0
Значения У, и У2 выбираются таким образом, что бы рассматриваемая модель могла соответствовать определению обменной схемы.
Запишем функции прибыли от обмена для центра:
(17) /о(*15Х2) = jо (У1 - У,Х2) - jo (У1 ,0) = H(х2) - xi;
для АЭ:
(18) /1( Х1, Х2) = jl(X1 У2 - Х2) - jl(0,Y2) = X1 - С(Х2)-
Следует отметить, что заданные ограничения ИР можно достаточно просто выразить через функции прибыли агентов от обмена: IR={ /о( х) 0; /1( х) 0}.
Из чего следует, что множество возможных вариантов обмена задается следующими условиями:
(19)Х=
{ х = (*1, х2): х е [0, YJ n [с(х2), H(х2)]; х2 е [0, У2 ] n arg{H(х2) - с(х2) 0}}
Стандартный порядок функционирования в задаче стимулирования [52] в терминах обменных схем можно сформулировать следующим образом: центр предлагает АЭ некоторый набор вариантов обмена, из которых АЭ выбирает наиболее выгодный с его точки зрения.
Предположим, что целью центра является максимизация его функции полезности от обмена. Также примем, что в данной ОС выполнена гипотеза благожелательности относительно поведения АЭ, заключающаяся в том, что АЭ выбирает из множества решений игры альтернативу, наиболее предпочтительную с точки зрения центра [18,45,52].
Утверждение 1. Решение задачи обмена в рассматриваемой ОС эквивалентно решению задачи стимулирования.
До к а з а т е л ъ с т во. Найдем точку x* = (x1*,x2*), в которой достигается max f0 (x).
В соответствии с принципом индивидуальной рациональности для АЭ имеем:
(20) xi Ф2).
Поэтому можно записать, что
(21) /о (xi, x2) H(xl) - c(x2)-
Следовательно для центра оптимальным будет обмен в точке x = (x1 , x 2 ), где
(22) x2* = arg ІШХ{Я(x2) - c(x2 )} ,
*2е\0.^\
что эквивалентно (14), а x1*= c(x2*), что эквивалентно (13).^
Итак, предположим, что целью центра является максимизация его функции полезности от обмена. Также примем, что в данной ОС выполнена гипотеза благожелательности относительно поведения АЭ, заключающаяся в том, что АЭ выбирает из множества решений игры альтернативу, наиболее предпочтительную с точки зрения центра
\18,45,52\.
Предположим, что целью центра является максимизация его функции полезности от обмена. Также примем, что в данной ОС выполнена гипотеза благожелательности относительно поведения АЭ, заключающаяся в том, что АЭ выбирает из множества решений игры альтернативу, наиболее предпочтительную с точки зрения центра
\18,45,52\.
Утверждение 1 устанавливает эквивалентность задачи стимулирования задаче обмена в детерминированных АС при некоторых требованиях к множествам возможных значений трансфертов ресурсов.
Приведенное выше решение детерминированной задачи обмена можно изобразить графически, используя ящик Эджворта. На левой части рисунка 6 он изображен в классическом виде - в координатах ресурсов с изображением линий равных предпочтений для каждого из агентов.
На правой части рисунка 6 он изображен в преобразованном виде - в координатах трансфертов, с изображением линий равной полезности для каждого агентов.
НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В ДВУХЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В ДВУХЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Рис. 6. Задача стимулирования как задача обмена
На обоих рисунках кривые f0 (x) = 0 (или j0 (y) = j0(y0)) и f (x) = 0 (или j(y) = j(y0)) характеризуют ограничения ИР для центра и АЭ соответственно. Затемненная область показывает множество возможных вариантов обмена. Точка x *= (xj*, x2 *) (или у*), являющаяся решением рассматриваемой выше задачи, лежит на кривой f (x) = 0, показывая, что
прибыль АЭ от обмена нулевая. АЭ соглашается на данный обмен только благодаря введенной гипотезе благожелательности.
Введем неопределенность в рассматриваемую модель ОС, следующим образом. Пусть функция затрат АЭ зависит от параметра r*, который может принимать значения из интервала Q = [rmin,rmax]. Точное значение данного параметра известно АЭ, а центр знает лишь диапазон возможных его значений (с некоторого момента далее мы будем считать, что центр также знает вероятностное распределение параметра на данном отрезке).
Задачей центра является поиск вариантов обмена, максимизирующих некий критерий эффективности - критерий эффективности обмена K(xj,x2).
Это полностью соответствует постановке задачи построения механизма ОУ для ОС, введенной в предыдущей главе.
Для решения поставленной задачи необходимо уточнить вид функции полезности от обмена для АЭ. Для этого введем следующие предположение относительно функции c(y,r):
А.4. Ге Q, Х2 е Х
1) c(x2,r) непрерывна по г;
2) dc(*2-r) 0;
dr
3) d2c(*2,r) 0. dx2 dr
4) c(x2,r) удовлетворяет А.1.
Содержательно, данное условие прежде всего показывает, что, чем больше значение типа АЭ, тем меньше его затраты на выполнение одного и того же действия.
Лемма 2. Условие А.4. обеспечивает выполнение условия F1 и F2 для функции прибыли от обмена АЭ f1 (x1, x2, r).
Доказательство. Т.к f1(x1,x2,r) = x1 - c(x2,r), то, с учетом А.4.
dc(.x2, r) 0 dr
dfi( x!, x2,r)
dr
re Q,
т.е. выполнено F1. Также, из А.4. следует
d'c(x2, r) 0 dx2 dr
dfi( xi, x2, r )
dx2dr
re Q,
что соответствует F2a. Также очевидно,
Ге Q,
df1(X1, x2? r) = 0 dx1dr
что соответствует F2b.^
Следовательно, для построения механизма ОУ для данной обменной схемы можно использовать общий метод построения неманипулируемых механизмов обмена, полученные в главе 1.
2.2. Построение эффективных и неманипулируемых механизмов обмена для двухэлементных иерархических обменных схем
Дискретный подход. Рассмотрим случай, когда параметр r (тип АЭ) может принимать только два "граничных" значения, т.е.
АЭ может быть двух типов - с функцией затрат c(y,ro) или с c(y,r1), где го = rmin, п = rmax.
Рисунок 7 иллюстрирует "графический" метод построения неманипулируемого механизма обмена. На рисунке изображен преобразованный ящика Эджворта в координатах трансфертов.
Линия f0(х) = 0 задает ограничения ИР для центра, линии f (x,r0) = 0 и f (x, у) = 0 для АЭ соответствующих типов. Для каждого из возможных типов АЭ выбирается точка на множестве Х - r ® х1 = (х/, х2г).
НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В ДВУХЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Рис. 7. Графический метод
Точка для наихудшего типа АЭ (в нашем случае наименьшего) выбирается на кривой f (х,r0) = 0, точка для наилучшего типа АЭ
выбирается на кривой f (х,rx) = Q, так чтобы f (х0,rx) = Q. Учитывая вид функции полезности АЭ, получим
(23) хі0 = Ф2,го);
(24) хі1 = с(х2 ,r і) + Ci;
(25) Сі= с(х^ ,rо) - с(х2,rі).
52
Значения величин x20 и x21 определяются из решения задачи нелинейного программирования:
(26) x2 = argmaxK(x1(x2),x2,ri), 0 x2 Y2, 0 x1 Yi, /'=0,1,
x2
где K(^) - критерий эффективности, т.е. действие АЭ x2l должно быть оптимальным (с точки зрения центра) при условии, что в обмене участвует АЭ типа rl. На критерий эффективности необходимо наложить следующие требования:
А.5 В детерминированной ОС, соответствующей рассматриваемой ОС с неопределенностью, решение задачи обмена с критерием K(\) эквивалентно решению детерминированной задачи, т.е. при r0 = r1 (26) и (20) дают одинаковое значение x2.
Данное требование всего лишь обеспечивает возможность анализа задач с неопределенностью путем экстраполяции их к детерминированным задачам. Например, если целью центра является максимизация ожидаемой прибыли от обмена (критерием эффективности является ожидаемая полезность центра Ef0), и он имеет некоторую информацию о
вероятностном распределении типов АЭ - ph / = 0,1, p0 + p1 = 1, то можно записать:
x2 = arg max {(H(x2) - c(x20,ro)) Po + (H(x21) - c(x21,ri) - Ci) pi}, / = 0,1.
x2
Собственно сам механизм таков - АЭ сообщает центру оценку s=rt своего типа, центр назначает АЭ обмен xl = (x1l, x2l)
Для предложенного графического метода справедлива следующая лемма.
Лемма 3. Для сообщения АЭ истинной оценки своего типа необходимы следующие ограничения: (27) x; 0 x; \ j = 1,2.
Доказательство. Принцип построения механизма, который выражен в (23) - (25) требует, что бы
НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В ДВУХЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Из (23) - (25) также следует /(x , О =[c(,0 - c(^, О]- [c(V, О - c(V, ro)]
Из условия А.4 (точнее, его трактовки в дискретном случае) следует,
чт0 С( х2 , ro) - c( x20 , r0) ^ С( ^ , Г ) - С( x20 , r1 ) ПРИ ? ^ -
Также, из (23) - (25) и А.4 получаем, что .у0 = у1 при у = у1, у у1 при .2 .2 , .1 .1 при .2 .2 -
Получается, что f1(у1, у1, r0) 0 при у0 у\ j = 1,2, и f1(у1, у1, r0) 0 при у0 у1, j = 1,2 соответственно. С учетом гипотезы благожелательности получаем, что при выполнении (27) АЭ будет сообщать истинную оценку своего типа
Из (23) - (25) видно, что, если = у1, то л/0 = л/. Т.е. для АЭ разных типов назначается одинаковый план. Данная ситуация не противоречит принципу открытого управления, так как, с учетом гипотезы благожелательности, АЭ будет сообщать свой истинный тип, что следует из леммы 3.
Итак, (23) - (25) с учетом требования (27) дают решение поставленной нами задачи при условии, что возможны только два типа АЭ. При увеличении количества возможных значений типов АЭ принцип построения механизма обмена не меняется.
Запишем множество возможных типов АЭ: Q = (r0,r1,^,rn), r0 = rmin, rn = rmo^x. Тогда для пары .i = (уг, .2), i = 0, n по аналогии с (23) - (26) можно выписать следующие условия: (28) .1 = c(.2 ,ri) + Ci, i = 0,n;
(29) Сі=^(ф2lj\r}_1) - c.1 -1у.Д Co=0, i = 0,n:
j=1
(30) .2 = argmaxK^r), 0 .2 Y2, 0 .1 Y1, i = 0,n.
.2
При сообщении АЭ заявки s = у центр назначает ему план обмена .і = (, .2i). Также сохраняется требования (27):
(27а) i = 1, n, xj, j = 1,2.
Также, очевидно, что если совпадение одной из компонентов плана для разных типов АЭ означают, что планы для данных типов АЭ эквивалентны (можно сказать, что с точки зрения центра данные типы АЭ эквивалентны)
Теорема 2. Если выполнена гипотеза благожелательности, то доминантной стратегией АЭ в предложенном механизме обмена будет сообщение истинной оценки своего типа. Т.е. s = r*.
Доказательство. Запишем прибыль АЭ типа i (r* = ri) - f1(x1,x2,r) при выполнении им плана, предлагаемого для типа j (s = r), используя (28) и (29):
(31) fi(xi\x2 j , r ) = C( x2 j , rj ) + Cj - C(x2 , r ) .
Из (31) получаем, чтоf1(x1i,x2i, ri) = Ci. Также из (31) и (29) следует, что f1(x/-1, x2i-1, r) = c(x2 i-1, r.-j) + C. - c(x21, r) =f\(x\'l,x2l, ri)= Ci. Для случая j
= i + 1 (31) с учетом (29) (выразив Ci+1 через C) можно записать: (32) f (x1i+1 , x2i+1 , r ) = Cr + C(x2i+1 , r+1 ) - c(x2i , r+1 ) + c(x2i , ri ) - C(x2i+1 , r )-
Из условия А.4, с учетом (27а), очевидно, что
C(x2i+1 , r ) - C(x2i , r ) ^ C(x2i +1 , r+1 ) - C(x2i , r+1 ) -
Следовательно, f1( x1i+1, x21+1, r) f1( x1i, x21, r).
Аналогично, можно показать, что j = i + 1,n
f1( x11 , x2 ' , r ) f1( x1 , x2i , ri )-
Для случая j = i - 2 (31) с учетом (29) (выразив Ci-2 через Ci) можно записать:
i-1
i-1
(33) f1(xrz, xrz, r) = Ci +c( xrz, r-1) - c( x^2, r) +c( x^‘, r) - c( x^‘, r--1) -
Из условия А.4, с учетом (27а), очевидно, что
c( x2i -1, r-1) - c( x21-2, r-1) ^c( x2i-1, r) - c (x2i - 2, r)-
Следовательно, f (x/-2, x2i-2, r) /( x/ , x2i, r).
По аналогии с (П.4) можно показать, что j = 0, i - 2
/(xA x2, r)? r )-
Из приведенных выше рассуждений следует, что АЭ типа ri получает максимальную прибыль от обмена при сообщениях s = ri и s = ri-1. Учитывая гипотезу благожелательности, получаем, что АЭ типа r сообщит s = Гі, потому что из двух эквивалентных планов он выберет лучший для центра, т.е. (x1, x2).rn
Т.е. построенный механизм обмена p(s) = (x1(s),x2(s)), определяемый (28) - (30), является механизмом открытого управления. Учитывая, что для двухэлементных задач поиск механизмов планирования можно ограничить классом механизмов ОУ [52], получаем, что дискретный метод позволяет найти механизм обмена максимальной эффективности.
Задача 1. Построить эффективный и неманипулируемый механизм обмена для ОС, рассмотренной в разделе 2.1. Функция полезности центра
2r
от обмена f0(x1,x2) = x2 - x1. Функция полезности АЭ - f1(x1, x2) = x1 -
p( s )
Критерий эффективности центра - максимизация ожидаемой полезности от обмена Ef (p( s)) ^ max. Множество возможных значений типа АЭ -
n+1 точек на отрезке [rOTI,w|, ro = rmim0, rn = rmax. Функция затрат АЭ имеет следующий вид
c( x, r) = .
2r
Данная функция удовлетворяет требованиям А.4. re Q, х 0 1) x2
1) непрерывна по r и по х;
2r dr
2r2
2) v = - 0;
3) d 2 c( x,r) = -x_ 0. 4) dc(^ = x 0;
dx r 5) -= r 1 0.
dx2
Следовательно, можно построить механизм ОУ p(i) = (х/, х2г). Из (28) и (29) получаем.
г-і х 12 1 1 _
С=І-^(---), i=1, n, Co=0;
i=0 2 1
i _ X2
+ Ci, i = 0, n.
Xi
2r
Механизм должен максимизировать ожидаемую прибыль центра при
ограничениях 0 x2 Y2, 0 х/ Y1, i = 0,n. Т.е. необходимо решить задачу нелинейного программирования:
^ (X,',!') 0; II (X.; ,1) 0; ^ (х/Д-)х/ = 0; ^ (х2\Г)Г= 0; дх2 дЛ дх2 дЛ
х2* 0,Л 0.
Здесь
х2 = (X20,- - - , х2 П ), Л = (Л0 v**? Л2п+1 ) , L = E/0 + S[12i (Y2 " х2 ) + Л2і +1 (Y " хі' )]-
i=0
Учитывая, что
e/c(W) = S Pi(х2 -х1) = S
Ріх2 ~^Г( + (---) S Pi
2 . r.,, i=i+1
+ +( -*2
2r
х2\Pi + , 1 1
i i i+1
Y2), i=0, n - 1, х2п = min(n ,x2,Y2);
1/2
i-1 r r 1 2
х2 =
2Y - S (- )х
1 =0 r1 r1 +1
1 1 +1
, i=0, n;
i2 1 2
. і- х/ , 1 К .
-4 i х2 х2 / 1 1 ч . 1 0 х2
(35) х =-^~ + S^(---), i=1,n, х1 = 2
2 i=0 2 .+.
i 1 1 +1
2r
Точки i=0, n - значение трансферта типа 2 при выходе наограничение х/ Y1. Очевидно, что если для некого типа АЭ данноеограничение вступает в силу (x2L=x2 ), то для всех j=l +1, n x2J= ~2J=~21 .Т.е. планы для всех типов АЭ, начиная j и лучше, совпадают.
При этом планы для типов АЭ, хуже j остаются неизменными.
то (34)
Если распределение типа АЭ взять равномерным - pt = можно переписать следующим образом:
1
х2 г = min(
,~2i,Y2), i=0,n - 1, X2n = min(r,~2n,^2).^
i+1 J
Задача 2. Построить эффективный и неманипулируемый механизм обмена для ОС с линейными функциями полезности Ц и АЭ: (36) /о( X1 X2) = х2 - ^ (37) f1(Xn X2) = rX1 - Х2 .
Данный вид функций полезности используется чаще всего при описании процессов обмена между крупными промышленными предприятиями. Задача центра - максимизация гарантированной
fo(p( s))
max /odet( s)
относительной прибыли от обмена
min
® max. Множество
p
возможных значений типа АЭ - n+1 точек на отрезке [rmin,rmax], r0 = rmin0,
rn rmax.
Распределение ресурса в схеме такое же, как в рассмотренном выше примере - весь ресурс первого типа Y1 сосредоточен у центра, весь ресурс второго типа Y 2 - у АЭ. Причем существенным будем считать ограничение на ресурс первого типа.
i 1 i mn
Механизм имеет следующий вид: х2г = junYl(rl - c(1-)), х/ =-Y1,
рi m
rn - r0
-)-1, i=0, n .-
m = (1 + _
n J=1 rJ - c
Получив механизм ОУ для задачи обмена в схеме из двух участников с внутренней неопределенностью в случае дискретного распределения
возможных типов АЭ, перейдем к рассмотрению непрерывного случая распределения.
Непрерывный подход к построению эффективного и неманипулируемого механизма обмена для базовых ОС основан на методе, изложенном в разделе 1.5.
В непрерывном случае область возможного значения типа АЭ будет задаваться как отрезок - Q = [rmin,rmax\. Получаем, что механизм ОУ p(s) = (x1(s),x2(s)) должен удовлетворять следующим требованиям:
dx1
dr
x(x2(r xr) Х~(г )=0;
dx dr
(r)
Xx(x2(r ^ r) IT*) 0'
ox or dr
dx1 dx2
-Т-(s ) 0,-^(s ) 0.
ds ds
Обе компоненты плана являются неубывающими функциями своего аргумента s eQ
Так как наихудшим из возможных типов АЭ является тип rmin, то, с учетом условий ИР n1 (rmn) = 0. Выражение (9) для рассматриваемого случая запишется следующим образом:
де
dr(X2(t),t)dt .
Учитывая, чтоni(r ) = X1(r) - e(x2(r), r^ можно сделать замену переменныхr де
(39) X1(r) = C(X2(rX r) - { (X2(t),t)dt,
/ dr
которая позволяет свести задачу построения механизма ОУ к решению следующей задачи.
(40) X2(r) = argmaxK(x1,x2,r), 0 X2(r) Y2, 0 xi(r) Yb
x2
Произведем проверку эквивалентности дискретного и непрерывного решений рассматриваемой задачи. Переменная n отражает мелкость
x]:
разбиения множества Q = [rm
r0 = r . , r
0 min 5 г
¦ * - ;- Л r - r.
r0 + гД, г = l...n, Д =
0n
Справедлива следующая лемма
Лемма 4. n(r) = lim Сг, где Сг определяется из (29), n(r*) - из (38).
П®?
Доказательство. Выражение (29) можно переписать следующим образом:
С= ^(ф1 гя) - Ф21-1 ,r--1 + A)), Co=0, i = 0...n
j =0
Очевидно, что
H®n(c(x2- c(x21-1 ,r.-i +A))=-|r(x21-1,ri-i)^r.
Учитывая, что x2 г соответствует r, т.е x2 г = x2(r), получаем, что
3c
3r
lim С = lim С = f
n®? г Д®0 г J
(x2(r),r)dr.B
r.
min
Как следствие леммы 4, получаем, что при n ® ?, выражения (28) и (39) эквивалентны. Т.е. решение задачи в дискретном случае соответствует решению задачи в непрерывном случае.
Проиллюстрируем полученное решение на примере.
Задача 3. Построить эффективный и неманипулируемый механизмобмена для ОС, рассмотренной в разделе 2.1. Функция полезности центра
2
2r
Множество
от обмена f0(x1,x2) = x2 - x1. Функция полезности АЭ - f1(x1, x2) = x Критерий эффективности центра Ef0(p(s))^max.
p( s )
возможных значений типа АЭ -отрезок [rmin,rmax], rmin0.
Функция затрат АЭ имеет следующий вид
c( x, r) = ¦ 2r
Как было показано в примере 3, данная функция затрат удовлетворяет требованиям А.4. В соответствии с (39) получаем
х(г У + fx2(t)’dr.
X1(r)=
2r / 2r2
'min
Задача динамического программирования, которую необходимо решить для построения механизма ОУ:
(41ШП) = 'J[X2(r)- Xx2L _ j xtф(г)dr®max,
2r2
(42) 0 X2(r) Y2, 0 xjfr) Y1.
Предположим, что ограничения (42) выполнены для r eQ, т.е. множество вариантов обмена , составляющих механизм ОУ, лежит внутри множества возможных вариантов обмена. В таком случае решение (41)
= 0. Т.е.
сведется к решению уравнения
Ео
dx.
1 - ^ ^ 1ТМ = о, где F (r) = j r s )ds.
r r p(r) L
(43) X2(r) =
Получаем, что механизм ОУ будет иметь следующий вид r 2p(r)
rp(r) +1 - F (r)
X2 (r)2 I fX2(t)
(44) x1(r) =
-dt, r eQ.
2r
2r2
m.n
, r- r . F (r) = min
Для равномерного распределения типов АЭ -механизма ОУ можно упростить:
, вид
r - r.
max min
r
(45) x2 (r) =-, r eQ;
4r3 - r3.
6r
(46) x1 (r) = _ 2 min , r eQ.
Оценим ожидаемую прибыль центра от обмена при применении механизма (45), (46)
+ r r ¦ + r ¦ ) .
max max min mm /
Б/0(П) = -^(r, 6r
Сравним полученный результат с ожидаемой полезностью, получаемой при решении эквивалентной задачи стимулирования путем построения механизма без сообщения информации АЭ центру [48]: rr
Ef (П) = maxpjjS-y-].
Сравнение ожидаемой полезности для двух механизмов показывает, что при условии на Q:
^ (1W3) .
r ¦
min
механизм открытого управления с сообщением информации эффективнее механизма, описанного в [48], при равномерном вероятностном распределении типа АЭ на множестве возможных типов. Преимуществом механизма открытого управления является тот факт, что обмен совершается с АЭ любого типа, в то время как в механизме без сообщения
r
информации АЭ типа хуже, чем , вынужден отказываться от обмена.
Вернемся к рассмотрению поставленной задачи в случае, когда ограничения (42) существенны. Выражение (43) можно трактовать, как фазовую траекторию, соответствующую оптимальному управлению. В соответствии с принципом оптимальности Беллмана [28] - отдельный участок оптимальной траектории является также оптимальной траекторией.
Т.е решение задачи (41) сохранит свой вид в области r eW = [Гшп,~], где ~ = min(arg{xx(r) = Yl},arg{x2(r) = YJ}. Для r е Q / Q' = (r; rmax] p(r) = p(~). Для равномерного распределения типов



ОБЩИЕ ПРИНЦИПЫ ПОСТРОЕНИЯ НЕМАНИПУЛИРУЕМЫХ МЕХАНИЗМОВ ОБМЕНА В АКТИВНЫХ СИСТЕМАХ

В данной главе формулируется математическая модель ОС, ставится задача обмена. Проводится сравнительный анализ оснований для классификации АС и ОС, в результате которого обосновывается актуальность рассмотрения задач ТАС как задач обмена. Приводится обзор основных известных моделей и методов, которые могут быть использованы для построения неманипулируемых механизмов обмена для ОС. Формулируется общая постановка задачи построения неманипулируемых механизмов обмена для АС с неполной информированностью центра.
Предложен общий метод решения этой задачи. Выводятся необходимые и достаточные условия неманипулируемости механизма обмена, сформулированные в терминах функций предпочтения агентов.
Полученные автором результаты, содержащиеся в первой главе, были опубликованы в работах [33,37,40,43].
1.1. Модель обменной схемы
Понятие обмена можно понимать в буквальном смысле - считая обменными бартерные схемы. Можно попытаться расширить рамки понятия процесса обмена, рассматривая его, как процесс взаимодействия между членами социально-экономической системы с целью улучшения своего благосостояния.
Для этого необходимо построить модель обменной схемы, которая не противоречит проводимым ранее исследованиям бартерных схем [1,5,6,7,9,15,24,26,31,44] и позволяет рассмотреть другие задачи функционирования социально-экономической системы (активной системы в терминах ТАС) как задачи обмена.
Рассмотрим АС, состоящую из n+1 агентов и т видов ресурсов. Множество всех агентов обозначим I = {0,...,n}.
Множество всех ресурсов обозначим J = {1,...,m}. Набор всех имеющихся у агента i ресурсов обозначим yi = (,...,угт).
Здесь yj обозначает наличие у i-ого агента ресурса типа j. Соответственно распределение ресурсов по всем агентам можно записать в виде матрицы: у = (y0,.., yn)T.
Нумерация агентов от 0 до n оправдана тем, что большинство ОС, рассматриваемых в данной работе будут представлять из себя АС, состоящие из одного руководящего агента и n подчиненных ему агентов. Функции и возможности руководящего и подчиненных агентов будут рассмотрены ниже, при описании структуры подчиненности агентов.
Предпочтения каждого агента опишем произвольной функцией (функция предпочтения): j (у1): Rm ® R; i = 0,n +1.
Агенты обладают возможностью взаимодействовать между собой путем взаимного обмена ресурсами.
Определение 1. Обмен - перераспределение ресурсов из множества Jмежду элементами из множества I: у ^у .
Здесь у0 - матрица начального распределения ресурса (или существующего распределения), уе - соответственно конечного.
Определение 1 и само описание набора агентов и ресурсов выглядят пока достаточно абстрактно, но именно данный подход позволяет дать наиболее общее определение обменной схемы и самого процесса обмена. Рассмотрим качественно, какие ограничения (требования) могут быть наложены на описанную выше модель и приведем примеры данных ограничений.
Данные ограничения могут трактоваться как основания для классификации ОС.
Ограничения по ресурсам. Ограничения данного класса определяют множества всевозможных значений матрицы распределения ресурсов у: уеA.
Примером подобных ограничений являются ограничения на общееколичество ресурса ^ у1. = Y , и ограничения на количество ресурсаi=o(ресурсов) у отдельного агента, например уг} Yj.
Ограничения по возможности взаимодействия между агентами.
Ограничения данного класса фактически превращают некий произвольный набор агентов в сетевую структуру - указывают, с какими агентами данный конкретный агент может обмениваться какими ресурсами. На рисунке 1 приведен пример ограничений данного класса -линии, связывающие агенты указывают на возможность взаимодействия (обмена) между ними, подписи к линиям - указывают на типы ресурсов, которыми данные агенты могут обмениваться. Ограничения данного класса обозначим QS.
Запись y^ye е Qs обозначает, что обмен /-/ возможен в рамках определенной структуры.

Рис. 1. Структура взаимодействия агентов
Ограничения на вид функций предпочтения агентов. Этодостаточно широкий класс ограничений.
Например, функции всех агентов принадлежат к классу вогнутых однопиковых непрерывных функций. Или вид функций предпочтения может быть указан явным образом, например:
m i
j =z Bi(yi -a) Pi.
i=i
Ограничения данного класса обозначим Q9.
Ограничения индивидуальной рациональности IR(p).
Ограничения данного класса определяют требования, налагаемые на
значения функций предпочтения агентов. Например i е I j(уег) j(y).
Множество распределений ресурсов, индивидуально рациональных по отношению к начальному распределению ресурса, обозначим IR(y). Очевидно, что IR(y) с A.
Накладывая на рассматриваемую схему ограничения приведенных выше четырех классов в различных комбинациях, можно получить достаточно большое количество моделей взаимодействия агентов.
Пример 1. Схема "Распределение ресурсов" (см. рисунок 2)
ОБЩИЕ ПРИНЦИПЫ ПОСТРОЕНИЯ НЕМАНИПУЛИРУЕМЫХ МЕХАНИЗМОВ ОБМЕНА В АКТИВНЫХ СИСТЕМАХ

Рис. 2. ОС Распределение ресурсов
Опишем модель АС, используемую в задаче распределения ресурсов [4,16,18,25,29,52,57] в терминах обменных схем:
1. Кол-во агентов - n+1 (Центр - агент с номером 0)
2. Кол-во видов ресурсов - 1
3. Ограничения на ресурс A: ^y = Y1i=o
4. Ограничения QS: агенты с номерами i = 1, n могут взаимодействовать только с агентом номер 0 (центр).
5. Ограничения Q9: функции благосостояния для агентов с номерами i = 1, n - однопиковые, максимум функции благосостояния k-ого достигается при наличии у него ресурса в кол-ве rk.
6. Ограничения ИР зависят от начального распределения ресурса и записываются следующим образом = П У е Л j (yt) ^ j (y-0)
7. Начальное распределение ресурса: у0 = (Yn0,...,0)T
Рассмотренная схема позволяет трактовать задачи распределения ресурсов [4,16,18,25,29,52,57] как задачи обмена?
После введения четырех классов ограничений можно записать ряд ключевых определений.
Определение 2. Множество возможных вариантов обмена (МВО) У(У): Y(y0) е IR(A y е Y(y0), y^y е Qs .
Т.е множество возможных вариантов обмена - совокупность всех индивидуально рациональных распределений ресурсов, переход к которым от начального распределения ресурсов возможен в рамках заданной структуры.
Определение 3. Обменная схема (ОС) - кортеж {I, J, A, y0, Qs, Qq,, IR(y0)}, для которой МВО не пусто.
Для обменных схем можно вести следующие замены:
Определение 4. Трансферт ресурса типа j для элемента i в процессе обмена y^y : xj = yj - yj0.
Соответственно можно определить xi = (-1,..., Xm) - вектор трансфертов всех ресурсов у элемента i; матрица трансфертов в ОС -x =(-V-X) T.
Данная замена актуальна тем, что любой из возможных обменов в ОС однозначно определяется матрицей х. В то время как различным вариантам обмена может соответствовать одинаковое конечное распределение ресурса между агентами.
Определение 5. Множество возможных вариантов обмена в терминах трансфертов Х: хеX $y е Y(y0) : х = y -y.
Множество Х зависит от y0, но, учитывая, что в определении обменной схемы мы рассматриваем единственное начальное распределение ресурсов, аргумент y0 опускается.
Определение 6. Функция полезности i-го агента от обмена:/г (Хг ) = j (Хг + Уі ) - j (Уі ).
По аналогии с множеством Х, аргумент у в записи функции полезности опускается. Очевидно, что свойства функции полезности абсолютно идентичны свойствам функции предпочтения.
Фактически, функции полезности от обмена - это и есть функции предпочтения, но рассматриваемые в новой системе координат (трансфертах), полученной путем сдвига из стартовой системы координат (ресурсы).
Пример 2. Пусть предпочтения агента описываются функцией j(у1,у2) = у2 - (у1 - У1)2. Тогда, в соответствии с определением 6, множество Х зависит от у0, но, учитывая, что в определении обменной схемы мы рассматриваем единственное начальное распределение ресурсов, аргумент у0 опускается.
Таким образом, целевая функция в обменной схеме для данного агента будет иметь следующий вид:
f (Xl, x2 ) = Х2 - Х12 + 2Xj (Уі - Y).
При начальном наборе ресурсов у данного агента {Y^O}, его целевая функция переписывается следующим образом
f (Xj , x2) = Х2 - Х12.^
Также, важными понятиями в рассмотрении обменных схем, являются понятие структуры подчиненности и понятие информационного состояния схемы.
Структура подчиненности определяет иерархию в обменных схемах -т.е. кто определяет правила и последовательность обмена и предлагает возможные варианты обмена для всей схемы. Отметим, что структура подчиненности может не иметь ничего общего со структурой схемы, определяемой ограничениями QS. Одним экстремумом множества возможных структур подчиненности является равноправная структура -когда все агенты оказывают сравнимое влияние на выбор вариант обмена или правила обмена.
В противоположность данной структуре можно поставить иерархическую структуру с двумя уровнями иерархии - из множества всех агентов выделяется один, в подчинение которого находятся все остальные агенты схемы. Используя терминологию ТАС [52], главенствующего агента можно назвать центром (Ц), находящихся у него в подчинении агентов - активными элементами (АЭ).
Для рассмотрения более сложных структур подчиненности можно для /-ого агента ОС ввести следующую характеристику - (lf;lf). if - множество агентов ОС, которым данный агент подчиняется непосредственно. if -множество агентов ОС, находящихся в непосредственном подчинении у данного агента.
Информационное состояние ОС определяет информированность агентов о параметрах ОС. В данной работе сохраняется классификация, принятая в [14,18,19,52]. В соответствии с данной классификацией, основное внимание в данной работе уделяется ОС с неполной и ассиметричной информированностью агентов. Агент считается не полностью информированными, если ему не известны точные значения всех параметры ОС.
Информационное состояние системы считается ассиметричным, если агенты обладают разными уровнями информированности о параметрах ОС.
Введя базовые определения, необходимые для рассмотрения обменных схем, перейдем к формулировке задачи обмена.
1.2. Общая постановка задачи обмена в активной системе
Самая общая постановка задачи обмена может быть сформулирована как стандартная задача управления [18,52]. Реализация любого из вариантов обмена зависит от управляющего воздействия u е U: x =G(u).
Пусть на множестве U*X задан функционал Ф(и, x), определяющий эффективность обмена с точки зрения управляющего органа (например центра самого верхнего уровня, или совокупности всех элементов для равноправной ОС). Величина K(u) = Ф(и, G(u)) называетсяэффективностью управления u е U. Задача управляющего органа заключается в выборе максимально эффективного допустимого управления:
u * е Argmax K(u) = { u е U | V v е UK(u) K(v)}.
ueU
1.3. Рассмотрение задач теории активных систем как задач обмена
Прежде чем обосновать смысл рассмотрения задач ТАС как задач обмена, произведем сравнительный анализ классификации ТАС и классификации ОС, предложенной в данной работе.
Базовая модель АС задается следующим набором параметров [16, 52], который также служит основанием для классификации задач ТАС.
Состав АС - совокупность субьектов, являющихся агентами системы (участниками АС).
Структура АС - совокупность информационных, управляющих и других связей между участниками АС, включая отношения подчиненности и распределения прав принятия решений.
Порядок функционирования - последовательность получения информации и выбора стратегий участниками АС.
Число периодов функционирования - отражает наличие или отсутствие динамики в рассматриваемой АС.
Предпочтения участников АС - определяют совместно с принципами рационального поведения зависимость состояния системы от управляющих воздействий и критерий эффективности системы.
Допустимые множества состояний (стратегий) участников АС -отражают индивидуальные и общие ограничения на выбор состояний, накладываемые окружающей средой, используемой технологией и т.д.
Информированность участников - та информация, которой обладают участники.
Из данного набора параметров часть сохранена и в описании модели обменной схемы. Это состав системы, порядок функционирования, число периодов функционирования и информированность участников, которая в данной работе формулируется как структура информированности агентов ОС.
Затемненные области в приведенной выше таблице указывают на пересечение критериев классификации модели АС и ОС по смыслу. Поясним эти пересечения.
Структура системы распадается на два параметра - структура подчиненности, и структуру взаимодействия, задаваемую ограничениями на возможность взаимодействия между агентами. Причем последний параметр больше принадлежит к группе допустимые множества из классификации ТАС, так как является именно ограничением в модели.
Разделение параметра предпочтения участников системы - всего лишь углубление классификации, позволяющее более четко прояснить структуры модели ОС. Параметр допустимые множества преобразуется прежде всего ограничения на ресурс, но возможность обмена агентов между собой в соответствии с некой структурой также можно расценивать как ограничения на выбор состояний участниками АС.
Таким образом, ОС - это АС, при исследовании которых акцент делается на возможности взаимодействия агентов между собой (обмена ресурсами).
Совершенно очевидно, что многие (если не все) задачи ТАС, могут быть рассмотрены как задачи обмена.
Задачи стимулирования [2,8,12-14,16-22,45-52,55,58] - центрвзаимодействует с активными элементами, требуя от них каких то
действий и назначая стимулирование за эти действия. Взаимодействие между центром и АЭ может быть представлено в виде обмена - центр обменивает свой ресурс (например деньги) на ресурс АЭ - их работу, товар, т.д.
Поэтому очевидно, что задачи стимулирования могут рассматриваться как задачи обмена. В разделе 2.1 приводится строгое доказательство эквивалентности задач стимулирования и обмена.
Задачи распределения ресурса [4,16,18,25,29,52,57] - центр неким образом распределяет имеющийся у себя в наличии ресурс между АЭ. В примере 1 рассмотрена ОС, где возможен только односторонний обмен - один агент может распределить имеющийся у него в наличии ресурс между остальными. Иными словами задачи распределения ресурсов можно представить как частный случай задач обмена.
Представляется перспективным перенос результатов ТАС, полученных для задач распределения ресурсов.
Задачи определения внутренних цен [2,7,13,14,16,17,19-22,25,26,55,58] также могут быть рассмотрены как задачи обмена, где ресурсами к обмену являются деньги и товары.
На рисунке 3 представлена структура рассматриваемых в работе обменных схем. В главе 2 будут рассмотрены двухэлементные ОС, для которых задачи обмена могут быть классифицированы как эквивалентные задачам стимулирования, эквивалентные обратным задачам стимулирования (центр стал АЭ, а АЭ - центром) и как классический обмен - функции предпочтения агентов линейно зависят от количества имеющихся у агентов ресурсов.
ОБЩИЕ ПРИНЦИПЫ ПОСТРОЕНИЯ НЕМАНИПУЛИРУЕМЫХ МЕХАНИЗМОВ ОБМЕНА В АКТИВНЫХ СИСТЕМАХ

Рис. 3. Рассматриваемые обменные схемы
1.4. Математические модели и методы, используемые для построения неманипулируемых механизмов обмена в активных системах
В данном разделе приведем основные результаты ТАС и микроэкономической теории, применимые для построения неманипулируемых механизмов обмена в активных системах
Условия совершенного согласования. В отечественных работах авторы сосредоточили внимание на способах организации деятельности отдельных элементов системы. В [10-14,16-22,52,53,55,58,62,63] исследуются механизмы функционирования систем, в которых альтернатива представляет собой вектор Евклидова пространства, причем в функции полезности каждого активного элемента явно участвует только одна компонента этого вектора, обычно содержательно интерпретируемая как план, назначаемый данному элементу.
Такие системы в зарубежных работах получили название экономик с частными товарами (Economies with private goods) [45,61,72,53,55,].
Рассмотрим систему, состоящую из центра и n активных элементов. Интересы элементов и центра выражаются их целевыми функциями
fi (xi, yi, ri), i = 1, n и Ф(x, y) где ri e Wi - параметр, параметризующий класс допустимых целевых функций i - го элемента, x = (x^ ..., xn) - вектор планов, назначаемых элементам, а у = (уь ..., yn) - вектор действий, выбираемых элементами. Порядок функционирования системы следующий:
1. Этап сбора информации. Элементы сообщают центру оценки (sb ..., sn) параметров (гь ..., rn);
2. Этап планирования. На основе полученных оценок центр, используя процедуру планирования p : S ® X, где S = nj, X = п хі -ieI ieIмножество допустимых планов, назначает планы xi = pi (s) элементам, i = 1, n.
3. Этап выбора состояния. Получив плановые задания, элементы выбирают свои состояния yi eAi, где A, i = 1, n - множества допустимых состояний.
В предположении рационального поведения элементов, при фиксированных планах выбираемые действия у* будут максимизировать соответствующие целевые функции, то есть:
У* е Pi (xi, ri) = Argmax f (Xj, yj, r).
y^Ai
Как и ранее, при сообщении оценок на этапе 2, будет иметь место эффект манипулирования информацией. Задачей центра является выбор такой процедуры планирования, чтобы в точке равновесия значение его целевой функции было максимально. Введем эффективность механизма S = (S, p)
K(S) = min Y(p(s*), r),
reS
где Y(x, r) = F(x, у * (x, r)).
При заданных значениях параметра ri eW i и плане xi e Xi элементвыбирает действие у* (xi, ri) e Pi (xi, ri) = Argmax fi (xi, yi, ri). ТакимyieAiобразом, можно говорить о функции предпочтения (полезности) элемента

ji(xi, ri) = fi(xi, y*(xi, ri X ri).

Зададим для каждого активного элемента множества Хг(s_г) с Хг и рассмотрим следующую процедуру планирования:
xeX
(5.1) fY (x, s) ® imx j(X, S) = 1^!ax)j(Z S).
zeXi (s_i)(5.2)
Условие (5.2) обеспечивает назначение элементу плана, максимизирующего его функцию предпочтения (в которую в качестве истинного значения типа АЭ подставляется сообщенная им оценка) и называется условием совершенного согласования (УСС). Условие (5.1) в неявном виде задает процедуру планирования, максимизирующуюцелевую функцию центра.
Механизм, удовлетворяющий (5.1)-(5.2), называется механизмом открытого управления (ОУ).
Теорема 5.1.2 [52] (Принцип открытого управления). Необходимым и достаточным условием сообщения достоверной информации как доминантной стратегии при любых r е W является существование множеств X.(s _г), для которых выполнено условие совершенного согласования. ¦
Таким образом, принцип открытого управления является критерием неманипулируемости механизма планирования в АС с сообщением информации. Помимо манипулируемости, основным свойством любого механизма является его эффективность.
Возникает вопрос, в каких случаях существует оптимальный неманипулируемый механизм (другими словами - в каких АС при поиске оптимального механизма можно ограничиться классом неманипулируемых механизмов). Частичный ответ на этот вопрос дает теорема 5.2.
Теорема 5.2. [52] В активной системе с одним активным элементом для любого механизма планирования существует механизм открытого управления не меньшей эффективности. ¦
Итак, теорема 5.2 утверждает, что механизм ОУ оптимален в одноэлементной АС (другими словами, для любого механизма планирования в одноэлементной активной системе существует эквивалентный прямой механизм. Естественное желание обобщить этот результат на случай многоэлементных АС наталкивается на ряд проблем, основная из которых - зависимость равновесного сообщения s*(r) каждого АЭ i е I от типов других АЭ [13].
Поэтому в общем случае в многоэлементных АС механизмы открытого управления (неманипулируемые) не оптимальны. В то же время, для широкого класса практически важных частных случаев механизмов планирования в многоэлементных АС доказаны результаты об оптимальности механизмов ОУ. Некоторые из этих механизмов рассматриваются в работах
2 В разделе 1.4 нумерация определений, лемм, теорем, формул и т.д. соответствует их нумерации вв источниках. 22
[8,13,19,48,52,55]. В данной работе УСС будут использованы в общем методе построения неманипулируемых механизмов обмена, а теорема 5.2 обосновывает оптимальность неманипулируемых механизмов обмена, которые будут построены в главе 1.
Оптимальность неманипулируемых механизмов распределения ресурсов [4,13,14,16-22,46,47,52,53,55,63]. Рассмотрим систему, состоящую из центра и n активных элементов.
Центр владеет R0 единицами ресурса. Ценность ресурса для i -го элемента определяется его функцией полезности j (xi, r), где xi - получаемое им количество ресурса, а г. - тип АЭ, параметризующий класс допустимых функций полезности. Функция полезности может определять, например, прибыль АЭ от использования ресурса в количестве xi .
Предположим, что о функции полезности АЭ центр не имеет информации, за исключением той, что она принадлежит некоторому классу однопиковых функций с точкой пика r eQ. и однозначно определяется значением этого параметра, то есть получение ресурса в количестве x. = r доставляет максимум функции полезности i-го АЭ.
Задачей центра является распределение ресурса с целью, например,максимизации суммарной полезности всех элементов ^ (р. (хг, г) ® maxieI х"
при ресурсном (балансовом, бюджетном) ограничении: ^ хг R0.
Распределение ресурса осуществляется следующим образом. Каждый активный элемент сообщает центру оценку у eQ i, i e I, своего типа
(параметра своей функции полезности) рг (xt, r) и получает ресурс в количестве xt = p (s), где p(s) = (p(s), p2(s),..., nn (s)) называется процедурой (механизмом) распределения ресурса.
Будем полагать, что множество возможных значений типов i-го АЭ Q.
- является отрезком действительной оси: Q. = [0, D] с R\ i e I, 0 D +?. В качестве ограничения D можно выбрать, например, имеющееся в распоряжении центра количество ресурса R0.
На процедуру распределения ресурса наложим следующие ограничения:
1. Функция p (я) непрерывна по всем переменным и строго монотонна по у. для всех я е [0, D]п, і е I.
2. Будем считать, что ^ r R0 (гипотеза дефицитности) и весь ресурсраспределяется полностью, то есть: ^ х = R0.
3. Каждая группа активных элементов может получить любое количество ресурса, меньшее того, что она уже получила:
у е W, W с I x p (у), і е W 3 sw eW ж : xw = nw (sw, w),
где Ww = nW j-Іе-W
4. Если количество ресурса, распределяемого между АЭ из некоторого подмножества W с I, увеличивается, то каждый АЭ получает количество ресурса, не меньшее прежнего.
В качестве модели поведения примем равновесие Нэша. Вектор сообщений у * (г) называется равновесием Нэша при данном r еО, если і е I, уг е Wг выполняется следующее соотношение:
j (pi (у * ), Гг ) j (pi (Уі , у-г ), Г ).
Лемма 5.1. [52] Пусть у * (г) - равновесие Нэша при данном r, тогда оно удовлетворяет следующим условиям:
1) если х* r, то у * = D;
2) если у * е [0, D), то x* = r .¦
Распределение ресурса в равновесии определяется следующим алгоритмом.
Алгоритм 5.1. [52] На нулевом шаге полагаем уг0 = D для всех і е I и вычисляем распределение ресурса x = p(D, ..., D). Множество Q на нулевом шаге полагаем пустым Q0 = 0.
На шаге j 1 множество Q1 определяем следующим образом:Q1 = {і Е11 (x1-1) i r }.
Для АЭ из множества Q1 по условию 2 определяем sQj е W Qj такие, чтоp , (s ., sJ-1.) = r . .QjK Qj ’ I\QJ J QJ
В конце j -го шага получим s1 = (sqJ , sJQJ) и x1 = p(S).
Если на некотором шаге k окажется, что Qk = Qk-1, то алгоритм останавливается, и полагаем: s* = sk, x* = xk, Q = Qk. -
Результаты применения данного алгоритма, заканчивающегося не более чем за n шагов, имеют следующие свойства:
Лемма 5.2. [52] 1) Если і € Qk, то на любом шаге 1 j k, x1 x1 -1 и x x .
2) s* - равновесие Нэша при данном r. ¦
Определим соответствующий исходному механизму распределения ресурса прямой механизм h(r) = p(s * (~)), ~ eW . Таким образом, в механизме h(~) і-ый элемент сообщает ~ е W., при этом r может быть не равным ~.
Теорема 5.3. [52] Прямой механизм распределения ресурса h(~), определяемый алгоритмом 5.1, является механизмом открытого управления. ¦



Рассмотрим прямой механизм

Из теоремы 5.3 следует, что для любого механизма распределения ресурса, удовлетворяющего введенным предположениям, существует эквивалентный прямой механизм, то есть неманипулируемый механизм не меньшей эффективности. Этот результат будет использован в доказательстве оптимальности неманипулируемого механизма обмена в ОС с веерной структурой взаимодействия агентов.
Неманипулируемость прямых механизмов и диктаторства [53,55,63].множества
Рассмотрим прямой механизм h : Rn ® Rn. Пусть для некоторогосообщения r е Rn выбирается вектор планов х = h(r). Так как полезность каждого АЭ определяется однопиковой функцией полезности, то каждый АЭ может находиться в одном и только одном из трех возможных состояний: (а) либо hi (r) и тогда АЭ будет получать план, строго больший желаемого, (б) либо hi (r) = и АЭ будет назначаться оптимальный для него план, (в) либо hi(г) ~ и план будет недостаточным. Для каждого активного элемента i е I введем индекс состояния, принимающий значения из набора {a, c, m}=p, где a соответствует состоянию (а), с - состоянию (б), а m - (в), и обозначим его через r (символы индекса являются первыми буквами фр. слов manque -нехватка, contentement - удовлетворенность, abondance - избыток).
Вектор индексов состояния всех АЭ обозначим через ре рп.
Введем соответствия M:pn®21, C:pn®21, Л:рп®21, значениями которых для каждого вектора состояний ре рп будет подмножество АЭ из I, таких, что индексы состояний этих элементов равны, соответственно, m, c и a: M(p)={jeI: p=m}, C(p)={jeI: p=c}, A(p)={jeI: p=a}, pepn. Очевидно, для каждого p подмножества C(p), Л(р), M(p) в совокупности являются разбиением множества всех элементов I .
Определение 2.1.1. [53] Разбиением D пространства Rn назовем совокупность множеств DpzRn, таких, что
ri если i е C(р)
{r е Rn hi (r) ~ если i е M(р), hi (r)
и hi (r) ri, если i е Л(р)}, р ерп. Сокращенно неравенства h(г) r, при iеM(p) будем записывать
hM(р)(~) ~M(р), а неравенства hi(r) Гі, при іеЛ(р) как hл(p)(r) ~Л(р).
Как видно из определения, для каждого множества Dp разбиения D заданомножество элементов C (р), называемых диктаторами, которые получаютоптимальные планы, остальные элементы при этом получают некоторые 26неоптимальные для себя планы. Разбиение в назовем разбиением на множества диктаторства, а сами множества Dр - множествамидиктаторства.
Далее будем предполагать, что в каждом из множеств Dp разбиения D планы, назначаемые всем активным элементам зависят только от сообщений диктаторов C (p) в этом множестве и не зависит от сообщений остальных элементов, если вектор сообщений ~ находится в этом множестве. То есть, существует функция xp(~c(p)), определенная на для всех ~с(p) е Projc(p) Dp, такая, что для всех ~ е Dp выполняется
h(~) = x p (~с (p)) и выполнено предположение
А.2.1.1. [53] Для всех pe рп существует функция
xp : Projc(p)Dp ® Rn, такая, что V~ e Dp выполнено h(r) = xp (~Cp).
Содержательно предположение А.2.1.1 означает, что планы, назначаемые для всех векторов сообщений из одного и того же множества диктаторства, не зависят от сообщений АЭ, не являющихся диктаторами. Определение 2.1.2. [53] Определим совокупность множествDp={reRn:. rM(p)xM(p)(rC(p)), гс(p) = Proj C(p) Dp rA(p)xA(p)(rC(p))},pepn.
Из определения 2.1.2 очевидно, что для любого pepn выполнено включение Dp с D(p. Также очевидно, что если для любого вектора сообщений ~ е D(p выполняется h(~) = xp(~C(p)), то для любого вектора истинных точек пика r е D(p сообщение достоверной информации являетсянаилучшим сообщением из D(p для всех АЭ.
Теорема 2.1.1. [53] Пусть I - множество активных элементов, функции полезности которых обобщенно однопиковые. Пусть механизмh : Rn ® Rn удолетворяет А.2.1.1 и D=D0 , тогда он неманипулируем.^ Теорема 2.1.1. - это достаточные условия неманипулируемости прямых механизмов планирования, которые будут использованы в разделе
3.1 для доказательства неманипулируемости механизма обмена в ОС с веерной структурой взаимодействия агентов.
Стандартная модель теории контрактов [59,64,65,67-70,73-77,7982,85-89,91,95].
Рассматривается система из центра (principal) и одного АЭ (agent). Центр продает агенту некий товар в количестве q по цене t. Функция полезности центра p0(t, q) = t - C (q).
Функция C(q) - стоимость производства товара для центра - дважды дифференцируемая выпуклая функция, C'(0)=0, С'(ю)=х. Функция полезности АЭ p1 (t,q,0) = и(?,q) -1.
?е? = [?,?] - положительный параметр, тип АЭ, характеризующий его вкус. Функция является монотонно возрастающей функцией своих аргументов.
Центру известно множество Q и вероятностное распределение типа АЭ на этом множестве F(?).
Задача центра - максимизировать свою полезность.
На основании принципа выявления (revelation principle) строится неманипулируемый механизм - меню контрактов {q(.), t (.)}, зависящий от сообщаемой АЭ оценки своего типа.механизма имеют
Необходимые условия неманипулируемости следующий вид:
(С (С)
??е?,
d- (?)=F (?(?),?) dL (?)
а? о? а?
(q(?),?)(?) 0 dqd? сІ?
При выполнении условий Спенса-Мирлиса [91] -
О2 и
Vq, ??,-(q,F) 0, доказано, что функция q(O) является неубывающейфункцией своего аргумента.
Предполагается, что q, ?, (q,q) 0. Вводится функция прибылиагента при использовании оптимального неманипулируемого механизма в зависимости от его типа - ?(?) = и(д(?),?) -1(?). Причем, при выполненииусловия IC1, ?е?, (?) = (q(?),?) 0. Поэтому, выполнениеусловий индивидуальной рациональности агента (? е?,?(?) 0) может быть обеспечено следующим образом - п(?) = 0, из чего следует, что ? ди
п(?) = )д?и ? д?
? ди
t(q) = u(q(q),q) -\(q(r),T)dT.
? д?
Задача центра (построение механизма, максимизирующего его прибыль) сводится к решению следующего уравнения:
^(q*(?),?) = 0 при условии dq-(?) 0. Здесь H(q(q),q) = j(q(q),t(?)). дq dq
Данный принцип построения неманипулируемых механизмов для решения задач теории контрактов является частным случаем общего принципа построения неманипулируемых механизмов обмена, который будет введен в разделе 1.5.
Обменная экономика Эджворта. [81,85,94,95] Данная модель экономики известна также как экономика чистого обмена (pure exchange economy). Рассматривается система из двух агентов.
В системе имеются товары (ресурсы) двух типов в ограниченном количестве, распределенные между агентами. Используя терминологию, введенную в разделе 1.1,и ресурсные У1 =(Уь У ^2),заданы начальное распределение ресурсов yи У 2 + У 2 = Y,
ограничения Yj и Y2 (у і + y і = Y1 У2 = (У 21, У 22)).
Каждый из агентов обладает собственными отношениями предпочтения на множестве возможных распределений товаров, заданными неприрывными функциями предпочтения j(У1) и j2(У2), которые также строго монотонны и квазивыпуклы (множество значений у для которых j(у) j(х) выпукло для х) [28,56,60,81,85,95].
Кроме того, задана рыночная стоимость каждого вида товаров p = (p1,p2), в соответствии с которой определяется рыночная ценность набора товаров каждого из агентов - p - уг, i = 1,2.
Агенты могут перераспределять между собой ресурс с целью увеличит рыночную стоимость своего набора товаров (с учетом своих предпочтений). Задача заключается в определении оптимальных по Парето распределений ресурсов (распределение ресурсов Парето оптимально, если не существует другого распределения ресурсов, которое не менее предпочтительное для каждого из агентов и более предпочтительное для одного из них) с учетом заданных рыночных цен.
Для исследования описанной выше модели применяется ящик Эджворта - графическое отображение на множестве возможныхраспределений ресурсов
Длины сторон ящика равны общему количеству каждого из видов ресурсов в системе (Y и У2). Левый нижний угол - агент 1, верхний правый
- агент 2. Точка y0 - начальное распределение ресурсов в системе, (учитывая, что y1: + y2і = Y и /2 + у22 = У2, берется y = y = (y1:,y12)). Кривые Р: и Р2 - кривые равных предпочтений агентов(Vy Е P j (y.) = j (y0), / = 1,2).
Заштрихованная область между ними -множество распределенй ресурсов, предпочтительных с точки зрения каждого из агентов. Линия Bl - бюджетная линия - множество распределений ресурсов, чьи рыночные стоимости эквивалентны (Vy е BL p - y = p - y0). Кривая Ps - множество оптимальных по Парето распределений ресурсов между агентами. Кривая Сс - контактная кривая (contact curve) - часть кривой Ps, принадлежащая области предпочтительных распределений ресурсов с точки зрения каждого из агентов. Точка y* - точка пересечения кривой Сс и линии Bl - точка равновесного по Вальрасу перераспределения ресурсов между агентами, которая и является искомым рыночным равновесием.
Само же равновесие по Вальрасу определяется равновесными ценами p* и равновесным перераспределением ресурсов y*.
Ящик Эджворта может быть широко использован для рассмотрения задач обмена в активных системах, состоящих из двух агентов, и в которых имеется два вида ресурсов. Подобные ОС будут рассмотрены в главе 2 данной работы, а данный графический метод будет использован в дискретном подходе к построению неманипулируемых механизмов обмена.
Механизмы Маскина и МакКельви. Данные механизмы известны, как механизмы, реализующие заданное соответствие группового выбора (СГВ).
Теория реализуемости представляет собой раздел теории управления социально-экономическими системами с сообщением информации. Наиболее полный обзор существующих результатов теории реализуемости можно найти в [27,53,60,83,84,92,93].
В теории реализуемости исследуется реализуемость соответствий группового выбора, свойства реализующих механизмов [78,80,83,92], модели поведения АЭ в детерминированном случае, и в случае наличия вероятностной неопределенности [87,88] и их влияние на реализуемость СГВ.
Приведем известные условия реализуемости соответствий группового выбора [66,83,90].
Говорят, что механизм G (полностью) реализует СГВ f [66], если для всех R е ^:
1) Eg (R) не пусто;
2) g(Eg (R)) с (=) f (R).
Другими словами, при всех R е ^ равновесие существует и в любом из возможных при данном R равновесии s * (R) е Eg (R) принимаемое решение g (s * (R)) лежит в f (R) .
Говорят, что прямой механизм H = (^, h) реализует СГВ f : ^ ® A достоверно, если VR е ^ выполнены:
1) R е Ed(R);
2) h(R) е f(R) .
Достоверная реализуемость означает, что сообщение достоверной информации в механизме H является доминантной стратегией, и при сообщении достоверной информации выбирается допустимая для центра альтернатива.
Рассмотрим некоторые свойства соответствий группового выбора, необходимые для исследования реализуемости СГВ.
Рассмотрим бинарное отношение R A над множеством A и
некоторую альтернативу а е A. Нижним срезом L(a, Ra ) отношения Ra по а называется множество X с A, определяемое следующим образом: X = {b е A : aRAb}. Верхним срезом H(a, Ra ) отношения Ra по а называется множество X с A, определяемое следующим образом: X = {b е A : bRAa}.
Говорят, что СГВ f : ^ ® A удовлетворяет условию монотонности Маскина (ММ) если V{R, R'} с a е f (R) таких, что a е f (R) иVi е I, L(a, Rj) с L(a, Rj) выполняется a е f (R').
Содержательно, ММ означает, что, если при некотором профиле предпочтений R е ^ одной из альтернатив, выбираемых по СГВ будет альтернатива a е f (R), и профиль предпочтений элементов изменятся на R' е Ш таким образом, что в новом профиле позиция альтернативы а по отношению к другим альтернативам для всех элементов не ухудшается, т. е. i е I, L(a, Ri) с L(a, Rj), то альтернатива а будет выбираться и при новом профиле предпочтений а е f (R').
Для однозначных соответствий группового выбора (ОСГВ), то есть таких, что R е Ш ® | f (R)| = 1, определяется следующее свойство
ОСГВ f : Ш ® A удовлетворяет независимой слабой монотонности (НСМ) тогда и только тогда, когда i е I, R е Ш
f (R) е n H(f (R, R-i), Ri ).
R'еШ
Содержательно, НСМ означает, что при сообщении достоверной информации, для всех элементов назначается наилучшая альтернатива, что является аналогом УСС.
Говорят, что СГВ удовлетворяет свойству отсутствия права вето (ОПВ), если а е A, i е I, $R еШ : i ф j, b е A, aRjb выполнено
а е f (R). То есть, если есть альтернатива a наилучшая с точки зрения всех активных элементов кроме некоторого j, то а е f (R).
СГВ f : R ® A называется диктаторской, если $i е I такой, что R еШ, а е A, а е f (R) тогда и только тогда, когда b е A, aRjb. Это означает, что среди элементов I найдется элемент j такой, что альтернатива а выбирается по СГВ тогда и только тогда, когда для j - го элемента нет никакой другой альтернативы, строго лучшей её.
СГВ f: Ш ® A называется Парето - оптимальной, если R е Ш, {a, b} с Aесли i е I, aPib, то b € f (R). Парето - оптимальность означает, что если какая - то альтернатива b для всех элементов строго хуже альтернативы a , то альтернатива b не может быть выбрана по этой СГВ.
Еще одним важным свойством СГВ является существенная монотонность [66].
Альтернатива a е X с A называется существенной для активного элемента i е I во множестве X если существует профиль предпочтений R е Ш такой, что а е f (R) и L(a, Ri) с X.
Множество всех существенных для элемента i е I во множестве X с A обозначим Ess (i, X).
СГВ f: Ш ® A называется существенно монотонным если VR, R 'еШ и а е f (R) таких, что Vi е I выполняется Ess (i, L(x, Ri)) с L(x, R'j) ® а е f (R
Приведем далее результаты, дающие необходимые и достаточные условия реализуемости СГВ при использовании понятий равновесия Нэша и равновесия в доминантных стратегиях. Теоремы 1.3.1-1.3.4 представляют условия реализуемости при использовании определения равновесия в доминантных стратегиях, теоремы 1.3.5-1.3.7 являются условиями реализуемости при использовании определения равновесия Нэша.
Теорема 1.3.1. [53,66]. Для того, чтобы ОСГВ f: Ш® A было достоверно реализуемо в доминантных стратегиях, необходимо и достаточно, чтобы оно удовлетворяло НСМ.
Теорема 1.3.2 [53,66]. СГВ f: Ш® A достоверно реализуема в доминантных стратегиях тогда и только тогда, когда существует ОСГВ f *, удовлетворяющая НСМ, такая, что для всех R еШ, f * (R) с f (R).
Теорема 1.3.3 [53,66]. Пусть Ш содержит только строгие порядки, СГВ f : Ш ® A достоверно реализуема в доминантных стратегиях тогда и только тогда, когда f является ОСГВ и удовлетворяет НСМ.
Теорема 1.3.4. [53,66]. Предположим, что Ш включает все возможные строгие предпочтения над A. Тогда не существует ОСГВ f, множество значений которой содержит не менее трех различных альтернатив, которая достоверно реализуема в доминантных стратегиях.
Вместе с теоремой 1.3.2, последний результат утверждает, что ни одно достаточно сложное СГВ не может быть реализовано в доминантных стратегиях, если на множество возможных профилей предпочтений не наложены дополнительные ограничения.
Гораздо более обширен класс СГВ, реализуемых по Нэшу. Необходимое условие реализуемости СГВ по Нэшу устанавливает следующая
Теорема 1.3.5. [53,66]. Если СГВ f: Ш® A реализуема по Нэшу, то она удовлетворяет монотонности Маскина.
Для получения достаточных условий реализуемости используют следующий подход. Для исследуемой СГВ определяют в явном виде механизм и доказывают, что он реализует данную СГВ, поэтому одни и те же условия будут фигурировать в различных теоремах, доказывающих реализуемость различными механизмами.
Следующий механизм, реализующий СГВ, удовлетворяющую условиям ММ и ОПВ, был получен Е. Маскиным (E.Maskin). Пусть I -множество активных элементов, профили предпочтений которых принимают значения из множества Ш. Задано СГВ f : Ш ® A. Каждый активный элемент сообщает в центр профиль предпочтений всех элементов из Ш, альтернативу из A и натуральное число. Таким образом для каждого элемента Sj = AхШхN и множество возможных сообщений
S = П Sj . Назовем множеством согласованных сообщений множество
іеі
Sa = {s е S| $j е I, $R* е Ш, $a* е f (R*): Vi * j, s, = (a*, R*, 0)}.
Множество несогласованных сообщений определим как дополнение к множеству Sa :
Sd = {s e S| s * Sa }.
Таким образом определенные множества Sa и Sd являются разбиением S .
Процедура принятия решения g: S ® A определяется двумя правилами.
Правило 1.3.1. Если s е Sa, то по определению существуют
j е I, R * еШ, a * е f (R *) такие, что Vi * j, sj = (a *, R *, 0). Пусть j - ый активный элемент сообщает альтернативу a j . В этом случае выбираемая альтернатива
* 7~v * *
a , при ajPj-a ; **
aj, при a Rjaj.
Правило 1.3.2. Если s e Sj, то g(s) = ak(s), где
k(s) = max{i e l| zi zj, j e I}.
Введенный таким образом механизм назовем механизмом Маскина. Первое правило определяет действие механизма в случае, когда все активные элементы, кроме быть может одного, сообщают одинаковые
профили предпочтений R *, одинаковые альтернативы a *e f (R *) и не желают принять участие в лотерее, то есть i ф j, zt = 0. В этом случае считается, что все кроме j-го элемента сообщают достоверный профиль предпочтений R*, соответствующий действительному профилю предпочтений всех элементов, и большинство голосует за альтернативу
a *. При этом из согласованных сообщений остальных АЭ делается однозначное предположение R* о предпочтениях j -го элемента и выбирается альтернатива, наихудшая для j -го АЭ. Второе правило определяет так называемую целочисленную игру.
Если сообщения элементов не согласованны, то любой элемент выбором соответствующего натурального числа может добиться выбора наилучшей для себя альтернативы. Имеет место следующая
Теорема 1.3.6 [53,66]. Если |і| 3 и f: A монотонная по
Маскину СГВ, удовлетворяющая ОПВ, то механизм Маскина реализует эту СГВ по Нэшу.
Как видно из определения, в механизме Маскина каждый активный элемент сообщает профиль предпочтений всех элементов, точное знание которого не всегда возможно. Множество возможных сообщений было значительно сужено в работах Сайжо (Saijo) [90] и МакКельви (McCelvey) [83].
Перейдем к описанию введенного ими механизма.
Определим механизм МакКельви следующим образом. Обозначим множество элементов через I = {1, ..., n}.
Будем считать, что элементы нумеруются по mod n, то есть номер k e Z соответствует элементу с номером к (mod n). Каждый элемент i е I = {1, n} посылает в центр сообщение следующей структуры:
si = (ai, Ai, Bi, ni), где ai е A, и $R ей такое, что либо Ai = L(a Ri) и Bi = L(a, Ri+1), либо At = L(a, R) и Bi = 0. Таким образом
Si = A x 2A x 2A x G и S = П Si -
іеі
Для любых s е S и j е I, обстановка s_ j называется f -
согласованной, если $a е A и 3R* е й такие, что 1) a* е f (R*);
2) ai = a*, i е I \ {j};
3) i * j , Ai = L(a*, R*) и В- = L(a*, R*^).
Процедура принятия решения механизма МакКельви определяется следующими правилами.
Правило 1.3.3. Пусть число элементов |і| 3, тогда для любого s е S если $j е I такой, что a j * a j _i и обстановка s_ j является f -согласованной, то
aj, aj E Bj_i;
aj_i, aj € Bj_i.
Правило 1.3.4.
В противном случае, g (s) = ak (s), где
k (s) = Z ni (mod n)
іеі
Как оказалось, для любой СГВ с количеством активных элементов больше трех верна следующая
Лемма 1.3.1. [53,83]. Пусть |і| 3, тогда для любой СГВ f : й ® A и определенного для неё механизма МакКельви верно R ей, f (R) с g (EG (R)).
Таким образом, любая СГВ, удовлетворяющая условиям леммы
1.3.1, может оказаться нереализуемой лишь в том случае, когда имеются
дополнительные равновесия s* такие, что g(s*) € f (R).
Теорема 1.3.7. [53,83]. Пусть / 3 и пусть f : ^ ® A монотонное по Маскину СГВ, удовлетворяющее ОПВ, тогда механизм МакКельви реализует по Нэшу СГВ f.
Принципы построения механизмов Маскина и МакКельви, используются при простроении консолидированных механизмы обмена для ОС типа цепочка, рассматриваемых в разделе 3.2.
Завершив обзор основных результатов ТАС и микроэкономической теории, применимых для построения неманипулируемых механизмов обмена в активных системах, перейдем к формулировке общего метода построения неманипулируемых механизмов обмена для ОС
1.5. Общий метод построения неманипулируемых механизмов обмена
в активных системах
Обменная схема состоит из n+1 агентов (Центр и n активных элементов) и m видов ресурсов. Заданы функции полезности АЭ, зависящие от вектора трансфертов ресурсов f(x,r): Rm+l ® R, r eQг, i = 1,..., n. Параметр rt - тип элемента, характеризующий некоторым образом его функцию полезности.
Агенты ОС информированы ассиметрично - центр знает все параметры схемы, кроме значений типов АЭ - ему известны лишь множества возможных значений и, быть может, вероятностное
распределение типа на множестве возможных значений. Информированность АЭ не существенна для общего метода построения неманипулируемых механизмов обмена.
Данный прием является стандартным для введения внутренней неопределенности в систему [10-12,18,22,29,45,53,57,59,64,65,81,82,86,91], и достаточно легко трактуется на качественном уровне - в большинстве задач ТАС тип активного элемента отражает его ценность с точки зрения центра - чем выше тип, тем лучше этот элемент для центра (тем большую полезность центр может получить от взаимодействия с таким элементом).
Задача центра - построить механизм обмена x=p( s), максимизирующий некий функционал (целевую функцию центра) Ф( s ,x) : K(s) = minФ(s,p(s)) ® max,
s gQ p( s)
где s = (sl,...,sn) - вектор заявок АЭ. АЭ сообщают центру оценки своих
типов, то st gQг,i = 1,n - т.е ищется прямой механизм обмена.
Порядок функционирования механизма обмена стандартен для механизмов планирования:
Центр объявляет механизм обмена p( s);
АЭ сообщают центру свои заявки s* = (у sn *);
Центр назначает обмен x = p( s*).
Механизм обмена ищется в классе прямых неманипулируемых механизмов - т.е. механизмов, для которых доминантной стратегией
каждого АЭ будет сообщение истинной заявки - s* = (r,..., rn).
Введем ограничения, необходимые для общего решения поставленной задачи. Прежде всего это ограничения на вид функции полезности АЭ.
Нам необходима непрерывность функции полезности, существование и непрерывность ее частных производных вплоть до второго порядка по всем переменным. Кроме того частная производная функции полезности по типу АЭ должна быть монотонна, например
(FI) f (xi, ті) 0, i = l, n r gQ i. or
Кроме того, решение поставленной задачи сильно упрощается, если мы используем условия Спенса-Мирлиса - постоянство знака смешанной производной 02 ft / dxjOr [91], например такое: i, $l(i), такое, что
- 02 f -
(F2^ r eQ.,x, ог0-(xi,Г)^
ox,or
l 1
и
02 f. -
(F2b) y j ф l(i), r eQi , xj, Or(xi, ri)
dxldr
li
Также, необходимо записать условия индивидуальной рациональности (ИР) для всех АЭ. Без потери общности, можно предложить простейшие условия - прибыль любого АЭ (значение функции полезности) должна быть неотрицательна.
Ограничения на ресурсы и возможность взаимодействия между агентами схемы не уточняются, хотя они безусловно отразятся на конечном решении задачи для конкретных моделей. Кроме того, множество возможных вариантов обмена непусто (это следует из постановки задачи - мы сразу рассматриваем обменную схему).
Прямой неманипулируемый механизм должен отвечать условию совершенного согласования (УСС)[52]: f (X, si) = -mах f (z, s)
zeX i ( s- )
Хг (s-г) - Множество возможных трансфертов для i-го АЭ при фиксированном векторе сообщений остальных АЭ s...
Введем функцию зависимости прибыли i-го АЭ от значения собственного параметра ту своей заявки Si, и заявки остальных участников обменной схемы sy
Кг (Г , si , s-г ) = f г (Xi (s, , s-г X Г )-
УСС можно проинтерпретировать следующим образом:
д?г ds.
г
д 2К.
(r , r , s-г ) = О
(1) Vr eQ ., Vs-г e Q-г,
2 (Гг , Гг , s-г ) ? 0
ds
Из первого условия (1а) очевидным образом следует, что
m df dx ‘' ,
(2) Z (X i (гг , s-г ), Г ) (ri , s-г ) = 0-
Лемма 1. Условие (1b) Vr e Q. , Vs-t e Q-t эквивалентно неравенству (3) ^д^дГ (Xi (ri , s-г ), ri ) ~T (ri , s-г ) - 0' Доказательство. В развернутом виде, условие (1b) записывается следующим образом: ZEdf (X (r, s-t), r) -s- (r, s-) dL (r, s_i) +
(4)
+ -X(X (r, s_,), r) (r,s-)] 0. Продифференцировав выражение (2) по гь получаем:
d2 f dX dx'
ds dr
EEdTTdT(x' (r , ^ X r )Z^(k, s-, )XL (r,, s) +
j=i 1=1 dx1. dx] (5) + dr (x (r,s-,), r) -s (r, s-t) + + (x (r, s .), r)-- (r, s .)] = 0.
Очевидно, что Вычитая из равенства (5) неравенство (4) получим выражение (3).^
Теорема 1. В рамках введенных предположений следующие условия: 1 Zd^T(x (r, s-l), r) ~rL (r\, s -.) = 0- j. 2. Id-dL- (x,(r,, s-.), r) (r, s-.) 0. З.Все компоненты планов, назначаемых центром каждому АЭ изменяются монотонно в зависимости от заявки данного АЭ:
dx .
z, j, s . gQ ., s . eQ ., x1., j (s ., s .) 0.
. ds
z
достаточны для неманипулируемости механизма обмена. Т.е глобальный максимум любого из f (p(s t, s-.), r) достигается при s. * = r .
Доказательство. Требования 1 и 2 данной теоремы - это необходимые и достаточные условия существования локального максимума функции V (r, у, s_t) при у. * = r .
Рассмотрим следующее выражение: (r., S., s ) = У ду (x, (у, s -,), r) (у, s ).
Учитывая (1), можно записать
dx..
j
ds
д V т
~дГ У, s„ s,) У
ds, .і
df df
J(x,(s,, s -, X Г ) -it- (xt (s,, sX s,)
dx
dx
jj
Знак левой части данного выражения определяется (6) (r, - К )У у(x(r' , s-, ^ r' ) dT(s,, s-,).
где r.* лежит между r. и s. .
Анализируя (6), видно, что при выполненных условиях Спенса-Мирлиса ^2а) и (F2b) и при
dx.
_I
ds
(s, s-.) 0
j,s. gQ. , s . eQ ., x1. . . -. -.
функция V- (r, st, s-.) не
убывает при r. s., и не возрастает при r s.. Т.е глобальный максимум любого из ft (p(st, s-1), r) достигается при st * = r. . ¦
Условия 1 и 2 теоремы 1 можно классифицировать как необходимые условия неманипулируемости механизма обмена. Условие 3 является достаточным для неманипулируемости механизма обмена при выполеных условиях 1 и 2.
При выполнении данных условий, обозначим прибылькаждого АЭ
П (r, s-.) /г (p(r, s-.X r) -
Очевидно, что, с учетом (2):
dvt
dr
(ri,s-i)
(у (ri,s-i X ri) - or
(7)
В соответствии с (F1) выражение (7) положительно. В литературе функция n (r, s_t) называется информационной рентой АЭ [91].
Из (7) видно, что данная рента является возрастающей функцией от типа АЭ. Т.е., чем лучше тип АЭ, тем большую прибыль он получает от неполной информированности центра о своем типе.
Так как в нашей модели условия индивидуальной рациональности (ИР) не зависят от типа АЭ, можно нормализовать минимальную прибыль для каждого АЭ , и записать ИР следующим образом:
(8) ?д r е Wi,s_i eQ_., n(r,s_.) 0.
Механизм ОУ следует создавать таким образом, что бы прибыль любого АЭ, в случае, если его тип окажется наихудшим из возможных для него, была минимальна, т. е. не нарушала требования ИР:
Vi, Vs-. е W_i, v.(rt, s_i) = 0.
Следовательно, с учетом (7):
(9) П (rt, s_t) = }0-(х (т, s_tX т)dt.
r dr
'l 7
Выражение (9), вместе с теоремой 1 являются основными результатами данного раздела. Они позволяют определить семейство механизмов, в которых доминантой стратегией АЭ является сообщение истинных заявок. Данные результаты получены из анализа УСС для АЭ. Задача центра - выбрать из полученного семейства механизмов оптимальный по заданному критерию.
Конечное решение для каждой задачи будет зависеть от вида критерия оптимальности, вида функций полезности агентов, ограничений на ресурсы в системе, ограничений на взаимодействия между агентами и т.д.
Кратко сформулируем результаты первой главы. В разделе 1.1 разработана теоретико-игровая модель обменной схемы, в рамках которой обмен определен как процесс перераспределения ресурсов между участниками активной системы, а обменная схема (множество вариантов
обмена) - как совокупность всех индивидуально рациональных
распределений ресурсов, достижимых в рамках заданных ограничений на ресурс взаимодействие между агентами.
В разделе 1.2 задача обмена сформулирована как задача управления в активной системе. В разделе 1.3 обоснована актуальность рассмотрения задач теории активных систем (ТАС) как задач обмена.
Приведен сравнительный анализ классификации активных система (АС) и классификации ОС. В раздел 1.4 рассмотрены основные математические модели и методоы, которые могут быть использованы для построения неманипулируемых механизмов для ОС.
В разделе 1.5 дана общая постановка задачи построения неманипулируемых механизмов обмена для АС с неполной информированностью центра. Сформулирован общий метод построения неманипулируемых механизмов обмена в активных системах с неполной информированностью центра; получены необходимые и достаточные условия неманипулируемости механизмов обмена.


Выбор метода построения неманипулируемого механизма

Лемма 11. Максимально возможной заявкой для любого из АЭ для описанной выше обменной схемы является r2 r1.
Доказательство. Из (149) и (150) получаем целевую функцию АЭ1, когда он выступает в роли посредника:fi=(ri-Si/r2)Yi.
А из (149) и (151) - Для АЭ2: f2=(ri r2-S2)Y2.
Очевидно, что для i max st = г^.и
Утверждение 16. При отсутствии возможности кооперации между АЭ и наличии полной информированности АЭ о параметрах ОС, метод доносчика обладает максимально возможной эффективностью
Доказательство. Из леммы 11 следует, что любой из АЭ может стать посредником только в том случае, если сообщит в качестве заявки r2 ri - в, где в - бесконечно малая величина. Из (149) получаем значение функции полезности центра:
(152) fo =( r2 ri - в - c)Yi.
Из (125) и (152), что центр получает прибыль, фактически эквивалентную его прибыли в детерминированной обменной схеме, т.е.K ~ 1. ¦
Следует отметить, что данный механизм обмена также является неманипулируемым - АЭ сообщают истинные значения своих типов.
К сожалению, описанный выше механизм обмена теряет всю свою привлекательность, если АЭ могут кооперироваться между собой, так как элементы будут сообщать минимально возможное значение общего обменного коэффициента - i s = r1 r2. Центр в таком случае получает
максимальный гарантированный результат f0 = (r1 Г2 - c)Y1.
Если же полная информированность АЭ о параметрах обменной схемы отсутствует, или (и) элементы могут кооперироваться между собой, то обменная схема, изображенная на рисунке 15 можно преобразовать в обменную схему, изображенную на рисунке 13.
Результаты, полученные для ОС с двумя АЭ, ниже распространяются
на ОС с конечным числом АЭ.
Выбор метода построения неманипулируемого механизма

Рис. 16. Многоэлементная ОС со структурой взаимодействием агентов типа цепочка - конечное число АЭ
Полученные в предыдущих разделах результаты можно перенести на обменные цепочки, состоящие из любого конечного числа АЭ (см рисунок 16). Рассмотрим поочередно каждый из предложенных выше способов.
Постановка задачи обмена останется прежней. Обменный коэффициент каждого АЭ имеет для центра интервальную неопределенность -
ri еПі = [Гг,ri].
Способ 1. Результаты леммы 7 можно распространить на случай ограниченного числа АЭ, применив метод индукции - вначале объединяем первый и второй АЭ, затем к вновь образовавшемуся АЭ присоединяем третий АЭ и т.д. Таким образом вновь получается задача обмена между центром и одним АЭ, чью функцию полезности можно записать следующим образом:
fl..n rx1 xn+1,
где
(153) r = П Г, r ?[r, r ], r = П Г, r =П Г -
i=1 i=1 i=1
Также можно записать, что
(154) f = f +УПr,f, -
}=1 i=}+1
Далее задача обмена решается по алгоритму, описанному в способе 1, позволяющему определить множество планов [x1(s),xn+1(s)] , где s=Пsi :
i =1
(155) x,( s) = ^ ^
m( s)

)Y

(156) xn+1( s) = m(r )(s -c(1
m( s)
где
(157) m( s) = [1 + ln c ]-1.
r - c
Для записанного выше механизма обмена очевидным образом доказывается аналог утверждения 12, из чего следует, что данный механизм является механизмом отрытого управления. Т.е. s*=r.
Утверждение 13 также транслируется на случай обменной цепочки из конечного числа элементов - по индукции.
Для построения механизма обмена, в котором также будут фигурировать планы на все трансферты между АЭ (по аналогии с (128),
(129) и (136)), можно в полной мере применить свойства механизма Маскина [66] , так как в обмене у нас участвует ограниченное число АЭ, более трех. Для начала необходимо определить на основании какого дележа будут задаваться трансферты между АЭ.
Лемма 12. Для равного дележа выигрыша коалиции, т.е. когда
Пrrfj =.= Пrif1, необходимо, что бы трансферт ресурса xt для
i=j+1 i=2
i = 2, n задавался выражением
i(n -1)

П rj - (i - 1)П rn

(158) xi =
П'
j =i+1
j=1
j=1
Доказательство. Доказывается данная лемма путем решения системы уравнений, полученных из записанной выше системы равенств и (154). ¦ Также, для равного дележ выигрыша коалиции верна модификация леммы 8 для обменной цепочки с конечным числом АЭ - при таком дележе максимальное значений целевой функции каждого АЭ достигается при s*=r.
Это очевидным образом следует из системы равенств, определяющей дележ и (154).
Теперь мы можем записать механизм открытого управления для цепочки из конечного числа АЭ, построенного на основании механизма Маскина - каждый АЭ сообщает свой вектор s={ ss"}. Затем, если все элементы, за исключением, быть может одного АЭ/ сообщили один и тот же вектор заявок { s, sn*}, то им назначается план (155), (156), (158) где
s = Пs*, ri=s* для i = 1,n. В случае, если заявки АЭ не совпадают, то центр
i=1
выбирает план (155), (156), (158), основанный на некой произвольной комбинации заявок АЭ, например выбирая максимальные оценки обменных коэффициентов:
Гі = si* = max[s/...s"], i = 1,n,
n
s = П s*.
i=1
Способ 2. В модификации способа 2 для обменной цепочки с ограниченным числом АЭ центр последовательно обменивается ресурсами с каждым из АЭ, начиная с первого. Причем полученный от предыдущего АЭ ресурс он передает следующему. Совершенно очевидно, что лемма 9 верна и для данного случая - для обеспечения максимально эффективного обмена центру необходимо целиком передавать АЭі х., полученное от АЭц . Получаем разбиение общей задачи обмена на n подзадач, для каждой из которых можно записать следующую целевую функцию центра:
(159),4 = a,(xi+, - ax),
a
г
,a, ч . і-г
c, a е (^-L,a.+.), i = 1,n -1, a
’ і V ’ i+1 ’ n
a
где a0
1 - обменные коэффициенты центра
i
при обмене с АЭ.
Назначаемый каждому АЭ план можно будет записать следующим образом:
m (r)
Mi(si)
X1
(160) x.
Mr (r)
(s)
ai-1 (1 1
a
m, (r )(s,
)), j = 2, n

m,(s,)

i=1
xn+1 = Y1П m,(r )(si
i=1
a (1 (-
a mi(si) где
(161)m. (s.) = [1 - in aSi - a-1 ]-1.
г г ari -a-1
Утверждение 17. Механизм обмена (160) - является механизмом открытого управления.
Доказательство. Запишем функцию полезности j-ого АЭ,
участвующего в обмене:
/ (?-Sn ) = rjXj (V- Sn ) - Sn ) .
Подставим в трансферты ресурсов, определяемые (160) и (161):
где
(1 ¦ ( 4
a m(si)
W, (s-, Y
(162) f ) = [r

mM,)

(163) x,(s) = П Пm, (r )(s, - a (1
:))¦
¦ .m(s) i=1 ai Mi (si У
X (s )- функция, зависящая только от заявок остальных АЭ
s,= (s1V„,s s ¦¦,sn)¦ Т.е. функцию полезности любого АЭ можно
представить в виде произведения двух функций, одна из которых зависит только от заявки данного АЭ, вторая - только от заявок остальных АЭ: fi(sb...,sn)=fi(si)Xi(s_i).
Легко показать, что максимумf(s) достигается при si*=ri:
f (s) = X/sJm, (r) r~ s ;
os s -a.Ja.
i i i-1 i
r - a , / a
i_i1 i
(s - a_Jai )2
(s)
Xi(s.jMi (ri) Следовательно, в механизме обмена (160), оптимальной заявкой для каждого АЭ будет истинное значение обменного коэффициента. ¦
Таким образом, нам удалось показать, что механизм обмена (160) является механизмом обмена открытого управления.
В не зависимости от выбранных значений данных параметров, по аналогии с утверждением 15, эффективность механизма (160) будет ниже эффективности механизма (155), (156). Доказывается данное утверждение по индукции.
Способ 3. Отличие в функционировании механизма обмена с разделением ролей для цепочки с ограниченным числом АЭ от цепочки с двумя АЭ заключается лишь в том, что центр выбирает одного бригадира не из двух АЭ, а из всех участников обменной цепочки. Как и в случае с цепочкой из двух АЭ, данный механизм обмена обладает максимально возможной эффективностью (K ~ 1) лишь в случае, когда АЭ полностью информированы о параметрах друг друга и не имеют возможность кооперироваться.
Таблица 3 иллюстрирует принципы выбора метода построения эффективного и неманипулируемого механизма обмена для рассмотренной ОС в зависимости от информированности АЭ и их возможностями по информационно-организационному ИО взаимодействию между собой. Возможность образование коалиции - возможность совместного действия АЭ с целью улучшения общей прибыли АЭ прибыли, в том числе и путем сообщения информации.
Переговоры - возможность передачи информации между АЭ. При этом каждый АЭ преследует собственные цели.
В заключительной главе работы получены следующие результаты. В разделе 3.1 построен эффективный неманипулируемый механизм обмена для многоэлементной ОС с веерным типом взаимодействия агентов.
Исследуемая задача обмена эквивалентна многоэлементной задаче стимулирования в условиях неполной информированности центра.
В разделе 3.2 построены различные неманипулируемые механизмы обмена для многоэлементной ОС с цепочным типом взаимодействия агентов. Определены наиболее эффективные механизмы обмена в
зависимости от возможности информационно-организационного
взаимодействия между АЭ и их информированности.
ЗАКЛЮЧЕНИЕ
В настоящей работе представлена концепция, позволяющая трактовать различные постановки задач управления как задачи обмена. На примере задачи построения неманипулируемых механизмов обмена проиллюстрирована перспективность подобной концепции.
Разработанный общий метод построения неманипулируемых механизмов обмена в активных системах с неполной информированностью центра основан на полученных ранее результатах исследования неманипулируемости механизмов управления, в то время как доказанная эквивалентность задачи обмена и задачи стимулирования позволяет рассматривать построенные в работе неманипулируемые механизмы обмена как механизмы стимулирования.
Основные результаты, полученные в работе, состоят в следующем:
1. Разработана теоретико-игровая модель обменной схемы, в рамках которой обмен определен как процесс перераспределения ресурсов между участниками активной системы. Задача обмена сформулирована как задача управления в активной системе.
2. Разработан общий метод построения неманипулируемых механизмов обмена в активных системах с неполной информированностью центра; получены необходимые и достаточные условия неманипулируе-мости механизмов обмена.
3. Показана эквивалентность задачи обмена и задачи стимулирования в условиях неполной информированности центра, что позволяет использовать результаты исследования задач стимулирования в задачах обмена и наоборот.
4. Построены эффективные неманипулируемые механизмы обмена для:
- двухэлементных иерархических обменных схем с неполной информированностью центра;
- двухэлементной обменной схемы без иерархии в условиях неполной информированности участников
- многоэлементных обменных схем с веерным и цепочным типами взаимодействия агентов.
Перспективными и актуальными представляются следующие направления дальнейшего исследования:
1. Изучение обменных схем со сложными структурами взаимодействия элементов (сетевые структуры).
2. Рассмотрение задач обмена в динамике.
3. Рассмотрение более широкого класса функций полезности участников обменной схемы.
4. Доказательство возможности трактовки большего числа задач управления как задач обмена.
Кроме того, представляется целесообразным расширение области практического применения неманипулируемых механизмов обмена, что, с одной стороны, даст возможность повысить эффективность управления реальными социально-экономическими системами, а, с другой стороны, обогатит теорию новыми постановками задач.
ЛИТЕРАТУРА
1. Ануфриев И.К., Бурков В.Н., Овчинников С.А. Эффективность механизмов обмена в сельскохозяйственной кооперации / Аграрная экономика, политика, история и современность. М. 1996. - 108 с.
2. Ашимов А.А., Бурков В.Н., Джапаров Б.А., Кондратьев В.В. Согласованное управление активными производственными системами. М.: Наука, 1986. - 248 с.
3. Балашов В.Г., Заложнев А.Ю, Новиков Д.А., Задачи назначения центра в линейной активной системе. // Автоматика и Телемеханика 2002 12 с. 92 - 95.
4. Баркалов П.С., Буркова И.В., Глаголев А.В., Колпачев В.Н. Задачи распределения ресурсов в управлении проектами. М.: ИПУ, 2002. -64 с.
5. Багатурова О.С., Кацнельсон М.Б., Красицкая Л.М., Мамиконов А.Г. Управление перераспределением ресурсов путем натурального обмена. М.: ИПУ, 1978. - 80 с.
6. Багатурова О.С., Кацнельсон М.Б., Якубовская Л.Н. Решение задач достройки вариантов обмена неделимых ресурсов / Методы анализа и синтеза автоматизированных систем управления. М.: ИПУ, 1981. -150 с.
7. Бурков В.Н., Багатурова О.С., Иванова С.И., Овчинников С.А., Ануфриев И. К., Маркотенко В. Л. Оптимизация обменных схем в условиях нестабильной экономики. М.: ИПУ, 1996. - 48 с.
8. Бурков В.Н., Данаев Б., Еналеев А.К., Кондратьев В.В., Нанаева Т.Б., Щепкин А.В. Большие системы: моделирование организационных механизмов. М.: Наука, 1989. - 248 с.
9. Бурков В.Н., Зинченко В.Н., Сочнев С.В., Хулап Г.С. Механизмы обмена в экономике переходного периода. М.: ИПУ, 1999. - 72 с.
10. Бурков В.Н., Еналеев А.К. Оптимальность принципа открытого управления.
Автоматика и телемеханика, 1985. 3. C. 73-80.
11. Бурков В.Н., Еналеев А.К., Каленчук В.Ф. Оптимальность принципа открытого управления. Вычислительные процедуры планирования и их свойства // А и Т. 1986.
N 9. С. 81 - 87.
12. Бурков В.Н., Еналиев А.К., Лавров Ю.Г. Синтез оптимальных
механизмов планирования и стимулирования в активных системах. Автоматика и телемеханика, 1992 . 2 10.
С. 113-120.
13. Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы
функционирования социально - экономических систем с сообщением информации. Автоматика и телемеханика, 1996 . 3, с. 3-25.
14. Бурков В.Н., Ириков В.А. Модели и методы управления
организационными системами. М.: Наука, 1994. - 270 с.
15. Бурков В.Н., Канцельсон М.Б., Мамиконов А.Г. Прогрессивные механизмы обмена // АиТ. 1983.
1. с. 140-149.
16. Бурков В.Н., Кондратьев В.В. Механизмы функционирования
организационных систем. М.: Наука, 1981.
17. Бурков В.Н., Кондратьев В.В., Цыганов В.В., Черкашин А.М.
Теория активных систем и совершенствование хозяйственного механизма. М.: Наука, 1984. - 272 с.
18. Бурков В.Н., Новиков Д.А.
Введение в теорию активных систем. М.: ИПУ РАН, 1996.
19. Бурков В.Н., Новиков Д.А.
Как управлять проектами. М.: Синтег, 1997. - 188 с.
20. Бурков В.Н., Новиков Д.А.
Модели и механизмы теории активных систем в управлении качеством подготовки специалистов. М.: ИЦ, 1997. - 158 с.
21. Бурков В.Н., Новиков Д.А.
Теория активных систем: состояние и перспективы. М.: СИНТЕГ, 1999. - 128 с.
22. Бурков В.Н., Новиков Д.А.
Управление организационными системами: механизмы, модели, методы // Приборы и системы управления. 1997.
N 4. С. 55 - 57.
23. Гермейер Ю.Б.
Игры с непротивоположными интересами. М.: Наука, 1976. - 328 с.
24. Гуриев С.М., Икес Б.У.
Бартер в России. М.: Российская экономическая школа, 2000. - 19 с.
25. Заруба В.Я.
Аналитическое проектирование мотивационных процедур планирования. Х: Бизнес Информ, 1998. - 248 с.
26. Зинченко В. И. Модели и методы оптимизации обменных схем. М.: ИПУ, 2001 - 25 с.
27. Данилов В.И., Сотсков А.И.
Механизмы группового выбора. М.: Наука, 1991.
28. Интрилигатор М. Математические методы оптимизации и
экономическая теория. М.: Прогресс, 1975. - 606 с.
29. Каленчук В.Ф.
Разработка и исследование оптимальных процедур планирования в активных системах в условиях неопределенности. М.: ИПУ РАН, 1990. - 22 с.
30. Клейнер Г.Б. Производственные функции: теория, методы,
применение. М.: Финансы и статистика, 1986. - 238 с.
31. Кацнельсон М.Б.
Перераспределение ресурсов. М.: Наука, 1985.
32. Караваев А.П., Коргин Н.А. Оптимальные унифицированные системы стимулирования в задаче управления активными системами./ Материалы международной научной конференции "Современные сложные системы управления".
Старый Оскол: СТИ, 2002. С. 134-137.
33. Коргин Н.А. Механизмы открытого управления в обменных схемах / Труды юбилейной международной научно-практической конференции "Теория активных систем". М.: Синтег, 1999.
С. 118.
34. Коргин Н.А. Механизмы открытого управления в двухэлементных обменных схемах / Сборник трудов молодых ученых ИПУ РАН.
М.: Фонд "Проблемы управления", 2000. С. 54 - 58.
35. Коргин Н.А. Механизмы открытого управления в многоэлементных обменных схемах/ Труды международной научно-практической конференции "Управление большими системами".
Тбилиси: ТГУ, 2000. С. 24 26.
36. Коргин Н.А. Механизмы открытого управления в симметричных
обменных схемах/ Тезисы докладов XLIII научной конференции МФТИ "Современные проблемы фундаментальных наук".
Долгопрудный: МФТИ, 2000. С. 34.
37. Коргин Н.А. Задачи теории активных схем с точки зрения обменных схем / Труды международной научно-практической конференции "Теория активных систем".
М.: ИПУ РАН, 2001. Т. 1. С. 45.
38. Коргин Н.А.
Эффективность применения механизмов открытого управления в многоэтапных обменных схемах / Труды международной конференции "Современные сложные системы управления предприятием". Липецк: ЛГТУ, 2001.
С. 113 - 116.
39. Коргин Н.А. Задача стимулирования и обменные схемы // Автоматика и Телемеханика. 2001. 10.
С. 147 - 153.
40. Коргин Н.А. Механизмы открытого управления как способ
повышения надежности функционирования сложных систем / Труды IX Международной конференции "Проблемы управления
безопасностью сложных систем". М.: ИПУ РАН, 2001.
С. 98.
41. Коргин Н.А.
Информация как обмениваемый ресурс./ Тезисы докладов XLII научной конференции МФТИ "Современные проблемы фундаментальных наук". Долгопрудный: МФТИ, 2001.
С. 25.
42. Коргин Н.А.
Механизмы открытого управления в многоэлементных обменных схемах с одним АЭ на каждом уровне./ Труды пятой ежегодной научной конференции "Сократовские чтения 2002". Москва: "Международный университет", 2002.
С. 51.
43. Коргин Н.А. Общий метод построения механизмов открытого управления для обменных схем / Сборник трудов молодых ученых "Управление большими системами". М.: ИПУ РАН, 2003.
Выпуск 3. С. 48 - -55.
44. Макаров И.И.
Бартер и корпоративное управление в России. М.: Российская экономическая школа 2000 - 37 с.
45. Новиков Д.А.
Механизмы стимулирования в динамических и многоэлементных социально-экономических системах // А и Т. 1997. N 6. С. 3 - 26. 5
46. Новиков Д.А.
Оптимальность правильных механизмов управления активными системами. I. механизмы планирования, II. Механизмы стимулирования.
Автоматика и телемеханика, 1997, 2-3.
47. Новиков Д.А.
Оптимальность правильных механизмов управления активными системами. II.
Механизмы стимулирования // А и Т. 1997. N 3. С. 161 - 167.
48. Новиков Д.А.
Стимулирование в социально-экономических системах / Базовые математические модели. М.: ИПУ, 1998. - 216 с.
49. Новиков Д. А. Механизмы стимулирования в динамических и многоэлементных социально-экономических системах // Автоматика и Телемеханика. 1997.
6. С. 3 - 26.
50. Новиков Д.А.
Сетевые структуры и организационные системы. М.: ИПУ РАН, 2003. - 102 с.
51. Новиков Д.А. Обобщенные решения задач стимулирования в активных системах.
М.: ИПУ РАН, 1998.
52. Новиков Д.А., Петраков С.Н.
Курс теории активных систем. М.: СИНТЕГ, 1999. - 108 с.
53. Петраков С.Н.
Механизмы планирования в активных системах: неманипулируемость и множества диктаторства. М.: ИПУ РАН, 2002. -135 с.
54. Суворов А.Д.
Бартер и долгосрочные отношения. М.: Российская экономическая школа, 1999 - 32 с.
55. Теория активных систем / Труды Юбилейной международной научнопрактической конференции. М.: СИНТЕГ, 1999. - 320 с.
56. Фишберн П. Теория полезности для принятия решений. М.: Наука, 1978. - 352 с.
57. Фокин С.Н.
Разработка, исследование и применение процедур распределения моноресурса в социально-экономических системах в условиях неопределенности с учетом приоритетов потребителей (на примере распределения машинного времени на ВЦ в отраслевых НИИ и КБ) / Диссертация на соискание ученой степени канд. техн. наук. М: ИПУ РАН, 1988. - 166 с.
58. Цыганов В.В.
Адаптивные механизмы в отраслевом управлении. М.: Наука, 1991. - 166 с.
59. Akerlof G. The Market for "Lemons": Qualitative Uncertainty and the Market Mechanism // Quarterly Journal of Economics.
1970. vol. 89. p. 488-500
60. Arrow K.J.
Social choice and individual values. Chicago: Univ. of Chicago, 1951. - 204 p.
61. Arrow K.J., Radner R. Allocation of resources in large teams // Econometrica. 1979.
Vol. 47.
N 2. P.361 - 386.
62. Burkov V.N., Lerner A.Ya. Fairplay in control of active systems / Differential games and related topics.
Amsterdam, London: North-Holland publishing company, 1971. P. 325 - 344.
63. Burkov V.N., Novikov D.A., Petrakov S.N.
Mechanism design in economies with private goods:trthtelling and feasible message sets. XIII Conference on system science, 1998. Vol.3 P.255-262
64. Cramton P. C. Bargaining with Incomplete Information; An Infinite-Horizon Model with Two-Sided Uncertainty // Review of Economic Studies.
1984. vol. 51. p. 579-593
65. Craword V., Sobel J. Strategic information transmission // Econometrica.
1982. vol 50 pp. 1431-1451
66. Dasgupta P., Hammond P., Maskin E. The implementation of social choice rules: some general results on incentive compatibility.
Review of Economic Studies, 1979, The Symposium on Incentive Compatibility.
67. Fudenberg D., Levine D., Tirole J. Infinite-horizon models of bargaining with one-sided incomplete information / Game Theoretic Models of Bargainig. Cambridge University press, 1985. p. 73-98
68. Fudenberg D., Tirole J. Sequental Bargaining with Incomplete Information // Review of Economic Studies. vol.
50. 1983. p. 221-247
69. Gjesdal F. Information and incentives: the agency information problem // Review of Economic Studies. 1982. Vol. 49.
N 2. P. 373 - 390.
70. Green J., Laffont J.-J.
Partially verifiable information and mechanism design // Review of Economic Studies. 1986. Vol.
53. N 4. P. 447 - 456.
71. Guriev S., Kvasov D. Barter in Russia: Role of market power. M.: RECEP 1999 - 22 p.
72. Hammond P.J.
Straightforward individual incentive compatibility in large economics // Review of Economic Studies. 1979.
Vol. 46.
N 2. P. 263 - 282.
73. Harris M., Raviv A. A. Theory of Monopoly Pricing Schemes with Demand Uncertainty // The American Economic Review. vol.
71. N. 3. 1981. p. 347-365
74. Harris M., Townsend R. Resource Allocation under Asymmetric Information // Econometrica. vol.
49. 1981. p. 33-64
75. Hurwicz L. On informationally decentralized systems // Decision and organization.
Amsterdam: North-Holland Press, 1972. P. 297 - 336.
76. Kim S.K.
Efficiency of an information system in an agency model // Econometrica. 1995.
Vol. 63.
N 1. P. 89 - 101.
77. Kreps D., Wilson R. Reputation and Imperfect Information // Journal of Economic Theory. vol.
31. 1982. p. 251-268
78. Laffont J.-J., Maskin E. Nash and dominant strategy implementation in economic environment // J. of Mathematical Economy.
1982. Vol.
10. N 1. P. 17 - 47.
79. Martimort D., Stole L. The Revelation and Delegation Principles in Common Agency Games.// Econometrica 2001. pp 350-380.
80. Mas-Collel A., Vives X., Implementation in economies with a continuum of agents // Review of Economic Studies. 1993.
Vol. 60.
N 3. P. 613 - 629.
81. Mas-Colell A., Whinston M.D., Green J.R.
Microeconomic theory. New-York: Oxford University Press, 1995. - 1000 p.
82. Maskin E., Tirole J., The Principal-Agent relationship with informed principal. // Econometrica, 1992. vol 60. pp 1-42.
83. McCelvey R. D. Game Forms for Nash Implementation of General Social Choice Correspondences. Social Choice and Welfare, 1989.
6. P. 139156.
84. Moore J. Implementation, contracts and renegotiation in environment with complete information / Advances in Economic Theory. Cambridge: Cambridge University Press, 1992. Vol.
1. P. 182 - 281.
85. Myerson R.B.
Game Theory / Analysis of Conflict. Harvard University press, 1991. - p. 568
86. Myerson R.B.
Incentive Compatability and The Bargain Problem // Econometrica. vol. 47. 1979. p. 61-74
87. Myerson R. Optimal coordination mechanisms in generalized principal -agent problems // J. of Mathematical Economy. 1982. Vol. 10.
N 1. P. 67 - 81.
88. Repullo R. The Revelation principle under complete and incomplete information. Economic Organizations as Games.
Oxford: Basil Blackwell,1986. P. 179 - 195.
89. Rubenstein A. A bargaining model with incomplete information // Econometrica. vol.
53. 1985. p. 1151-1172
90. Saijo T. Strategy space reduction in Maskin's Theorem: sufficient conditions for Nash implementation. Econometrica, 56.
P. 693-700.
91. Salanic B. The Economies of Contracts.
1997. 507 p.
92. Sen A. Collective choice and social welfare. London: Holden - Day, 1970. -254 p.
93. Sen A. Social choice theory / Handbook on mathematical economics.
Vol. 3. Amsterdam: North-Holland, 1986.
P. 1073-1181.
94. Shubik M. Game theory in the social sciences: concepts and solutions.
Massachusetts: MIT Press, 1991.
95. Tirole J. The theory of industrial organisation. The MIT Press, 1997. -502 p.





    Учет: Делопроизводство - Автоматизация - Софт