Теория кооперативных игр

Игра, в которой группы игроков могут навязывать кооперативное поведение

В теории игр кооперативная игра (или коалиционная игра ) — это игра с группами игроков , которые формируют связывающие «коалиции» с внешним принуждением к кооперативному поведению (например, через договорное право ). Это отличается от некооперативных игр , в которых либо нет возможности создавать альянсы, либо все соглашения должны быть самоподдерживающимися (например, через реальные угрозы ). [1]

Кооперативные игры анализируются с упором на коалиции, которые могут быть сформированы, а также на совместные действия, которые могут предпринимать группы, и на итоговые коллективные выигрыши. [2] [3]

Математическое определение

Кооперативная игра задается указанием значения для каждой коалиции. Формально коалиционная игра состоит из конечного набора игроков , называемого большой коалицией , и характеристической функции [4] от набора всех возможных коалиций игроков до набора платежей, который удовлетворяет . Функция описывает, какой коллективный выигрыш может получить набор игроков, сформировав коалицию. Н {\displaystyle N} в : 2 Н Р {\displaystyle v:2^{N}\to \mathbb {R} } в ( ) = 0 {\displaystyle v(\emptyset)=0}

Определение теории кооперативных игр

Кооперативная теория игр — это раздел теории игр, который занимается изучением игр, в которых игроки могут формировать коалиции, сотрудничать друг с другом и заключать обязывающие соглашения. Теория предлагает математические методы для анализа сценариев, в которых двум или более игрокам необходимо сделать выбор, который повлияет на благополучие других игроков. [5]

Общие интересы: В кооперативных играх игроки разделяют общий интерес в достижении определенной цели или результата. Игроки должны определить и договориться об общем интересе, чтобы установить основу и обоснование для сотрудничества. Как только игроки четко поймут свой общий интерес, они могут работать вместе, чтобы достичь его. [ необходима цитата ]

Необходимый обмен информацией: Сотрудничество требует общения и обмена информацией между игроками. Игроки должны делиться информацией о своих предпочтениях, ресурсах и ограничениях, чтобы определить возможности для взаимной выгоды. Обмениваясь информацией, игроки могут лучше понять цели друг друга и работать над их достижением вместе. [ необходима цитата ]

Добровольность, равенство и взаимная выгода: в кооперативных играх игроки добровольно объединяются, чтобы сформировать коалиции и заключить соглашения. Игроки должны быть равноправными партнерами в коалиции, и любые соглашения должны быть взаимовыгодными. Сотрудничество является устойчивым только в том случае, если все стороны чувствуют, что получают справедливую долю выгод. [ необходима цитата ]

Обязательный контракт: В кооперативных играх соглашения между игроками являются обязательными и обязательными. Как только игроки согласились на определенный курс действий, у них есть обязательство следовать ему. Игроки должны доверять друг другу, чтобы выполнять свои обязательства, и должны быть механизмы для обеспечения соблюдения соглашений. Делая соглашения обязательными и обязательными, игроки могут гарантировать, что они достигнут своей общей цели. [ необходима цитата ]

Подигры

Пусть будет непустой коалицией игроков. Подыгра на естественно определяется как С Н {\displaystyle S\subsetneq N} в С : 2 С Р {\displaystyle v_{S}:2^{S}\to \mathbb {R} } С {\displaystyle S}

в С ( Т ) = в ( Т ) ,   Т С . {\displaystyle v_{S}(T)=v(T),\forall ~T\subseteq S.}

Другими словами, мы просто ограничиваем наше внимание коалициями, содержащимися в . Подигры полезны, поскольку они позволяют нам применять концепции решений, определенные для большой коалиции, к меньшим коалициям. С {\displaystyle S}

Свойства для характеристики

Супераддитивность

Характерные функции часто предполагаются супераддитивными ( Owen 1995, стр. 213). Это означает, что значение объединения непересекающихся коалиций не меньше суммы отдельных значений коалиций:

в ( С Т ) в ( С ) + в ( Т ) {\displaystyle v(S\cup T)\geq v(S)+v(T)} всякий раз, когда удовлетворяет . С , Т Н {\displaystyle S,T\subseteq N} С Т = {\displaystyle S\cap T=\emptyset }

Монотонность

Более крупные коалиции получают больше:

С Т в ( С ) в ( Т ) {\displaystyle S\subseteq T\Rightarrow v(S)\leq v(T)} .

Это следует из супераддитивности , т.е. если выплаты нормализованы, то коалиции из одного элемента имеют нулевую ценность.

Свойства для простых игр

Коалиционная игра v считается простой, если выигрыши равны 1 или 0, то есть коалиции либо «выигрывают», либо «проигрывают». [6]

Эквивалентно, простая игра может быть определена как набор W коалиций, где члены W называются выигрывающими коалициями, а остальные — проигрывающими коалициями. Иногда предполагается, что простая игра непуста или что она не содержит пустого множества. Однако в других областях математики простые игры также называются гиперграфами или булевыми функциями (логическими функциями).

  • Простая игра W является монотонной, если любая коалиция, содержащая выигрышную коалицию, также выигрывает, то есть если и подразумевают . С Вт {\displaystyle S\in W} С Т {\displaystyle S\subseteq T} Т Вт {\displaystyle T\in W}
  • Простая игра W является правильной, если дополнение (оппозиция) любой выигрывающей коалиции является проигрывающей, то есть если подразумевает . С Вт {\displaystyle S\in W} Н С Вт {\displaystyle N\setminus S\notin W}
  • Простая игра W является сильной , если дополнение любой проигравшей коалиции является выигрывающим, то есть если подразумевает . С Вт {\displaystyle S\notin W} Н С Вт {\displaystyle N\setminus S\in W}
    • Если простая игра W является правильной и сильной, то коалиция выигрывает тогда и только тогда, когда ее дополнение проигрывает, то есть тогда и только тогда . (Если v — коалиционная простая игра, которая является правильной и сильной, для любого S. ) С Вт {\displaystyle S\in W} Н С Вт {\displaystyle N\setminus S\notin W} в ( С ) = 1 в ( Н С ) {\displaystyle v(S)=1-v(N\setminus S)}
  • Игрок с вето (ветоер) в простой игре — это игрок, который принадлежит всем выигрышным коалициям. Предположим, что есть игрок с вето, любая коалиция, не содержащая игрока с вето, проигрывает. Простая игра W является слабой ( коллегиальной ), если в ней есть игрок с вето, то есть если пересечение всех выигрышных коалиций непусто. Вт := С Вт С {\displaystyle \bigcap W:=\bigcap _{S\in W}S}
    • Диктатор в простой игре — это игрок с правом вето, так что любая коалиция, включающая этого игрока, выигрывает. Диктатор не принадлежит ни к одной проигравшей коалиции. ( Игры диктаторов в экспериментальной экономике не имеют к этому отношения.)
  • Носитель простой игры W это множество , такое что для любой коалиции S имеем тогда и только тогда, когда . Когда простая игра имеет носитель, любой игрок, не принадлежащий ему, игнорируется. Простая игра иногда называется конечной , если она имеет конечный носитель (даже если N бесконечно). Т Н {\displaystyle T\subseteq N} С Вт {\displaystyle S\in W} С Т Вт {\displaystyle S\cap T\in W}
  • Число Накамуры простой игры — это минимальное число выигрышных коалиций с пустым пересечением. Согласно теореме Накамуры, число измеряет степень рациональности; это показатель того, в какой степени правило агрегации может давать четко определенные выборы.

Некоторые соотношения между вышеприведенными аксиомами получили широкое признание, например, следующие (например, Пелег, 2002, раздел 2.1 [7] ):

  • Если простая игра слаба, то она правильная.
  • Простая игра является диктаторской тогда и только тогда, когда она сильна и слаба.

В более общем плане было проведено полное исследование связи между четырьмя общепринятыми аксиомами (монотонность, правильность, сила и неслабость), конечностью и алгоритмической вычислимостью [8] (Кумабе и Михара, 2011 [9] ), результаты которого обобщены в таблице «Существование простых игр» ниже.

Существование простых игр [10]
ТипКонечный Некомп.Конечный вычислимыйБесконечный Некомп.Бесконечно вычислимый
1111НетДаДаДа
1110НетДаНетНет
1101НетДаДаДа
1100НетДаДаДа
1011НетДаДаДа
1010НетНетНетНет
1001НетДаДаДа
1000НетНетНетНет
0111НетДаДаДа
0110НетНетНетНет
0101НетДаДаДа
0100НетДаДаДа
0011НетДаДаДа
0010НетНетНетНет
0001НетДаДаДа
0000НетНетНетНет

Ограничения, которые различные аксиомы для простых игр накладывают на их число Накамуры, также были тщательно изучены. [11] В частности, вычислимая простая игра без игрока с правом вето имеет число Накамуры больше 3 только в том случае, если это правильная и не сильная игра.

Связь с некооперативной теорией

Пусть G — стратегическая (некооперативная) игра. Тогда, предполагая, что коалиции имеют возможность обеспечивать координированное поведение, существует несколько кооперативных игр, связанных с G. Эти игры часто называют представлениями G. Два стандартных представления: [12]

  • α-эффективная игра связывает с каждой коалицией сумму выигрышей, которые ее члены могут «гарантировать», объединив усилия. Под «гарантированием» подразумевается, что значение является макс-мин, например, максимальное значение минимума, взятого из стратегий оппозиции.
  • β-эффективная игра связывает с каждой коалицией сумму выигрышей, которые ее члены могут «стратегически гарантировать», объединив силы. Под «стратегически гарантировать» подразумевается, что значение является мин-макс, например, минимальное значение максимума, взятого из стратегий оппозиции.

Концепции решения

Основное предположение в теории кооперативных игр заключается в том, что сформируется большая коалиция. [13] Затем задача состоит в том, чтобы распределить выигрыш между игроками каким-либо образом. (Это предположение не является ограничительным, поскольку даже если игроки разделяются и формируют меньшие коалиции, мы можем применять концепции решения к подиграм, определяемым фактически сформированными коалициями.) Концепция решения — это вектор (или набор векторов), который представляет распределение для каждого игрока. Исследователи предложили различные концепции решения, основанные на различных представлениях о справедливости. Вот некоторые свойства, на которые следует обратить внимание в концепции решения: Н {\displaystyle N} в ( Н ) {\displaystyle v(N)} х Р Н {\displaystyle x\in \mathbb {R} ^{N}}

  • Эффективность: Вектор выигрыша точно делит общую стоимость: . я Н х я = в ( Н ) {\displaystyle \sum _{i\in N}x_{i}=v(N)}
  • Индивидуальная рациональность: Ни один игрок не получает меньше того, что он мог бы получить самостоятельно: . х я в ( { я } ) ,   я Н {\displaystyle x_{i}\geq v(\{i\}),\forall ~i\in N}
  • Существование: Концепция решения существует для любой игры . в {\displaystyle v}
  • Уникальность: Концепция решения уникальна для каждой игры . в {\displaystyle v}
  • Маржинальность: Выигрыш игрока зависит только от предельного вклада этого игрока, т. е. если эти предельные вклады одинаковы в двух разных играх, то выигрыш одинаков: подразумевает, что одинаков в и в . в ( С { я } ) = ж ( С { я } ) ,   С Н { я } {\displaystyle v(S\cup \{i\})=w(S\cup \{i\}),\forall ~S\subseteq N\setminus \{i\}} х я {\displaystyle x_{i}} в {\displaystyle v} ж {\displaystyle w}
  • Монотонность: Выигрыш игрока увеличивается, если предельный вклад этого игрока увеличивается: подразумевает, что слабо больше в , чем в . в ( С { я } ) ж ( С { я } ) ,   С Н { я } {\displaystyle v(S\cup \{i\})\leq w(S\cup \{i\}),\forall ~S\subseteq N\setminus \{i\}} х я {\displaystyle x_{i}} ж {\displaystyle w} в {\displaystyle v}
  • Простота вычислений: концепция решения может быть рассчитана эффективно (т.е. за полиномиальное время по отношению к количеству игроков ). | Н | {\displaystyle |N|}
  • Симметрия: Концепция решения распределяет равные выплаты симметричным игрокам , . Два игрока , являются симметричными , если ; то есть мы можем обменять одного игрока на другого в любой коалиции, содержащей только одного из игроков, и не изменить выигрыш. х {\displaystyle x} х я = х дж {\displaystyle x_{i}=x_{j}} я {\displaystyle я} дж {\displaystyle j} я {\displaystyle я} дж {\displaystyle j} в ( С { я } ) = в ( С { дж } ) ,   С Н { я , дж } {\displaystyle v(S\cup \{i\})=v(S\cup \{j\}),\forall ~S\subseteq N\setminus \{i,j\}}
  • Аддитивность: распределение игрока в сумме двух игр является суммой распределений игрока в каждой отдельной игре. Математически, если и являются играми, игра просто назначает любой коалиции сумму выплат, которые коалиция получила бы в двух отдельных играх. Концепция аддитивного решения назначает каждому игроку сумму того, что он получил бы в и . в {\displaystyle v} ω {\displaystyle \омега} ( в + ω ) {\displaystyle (v+\омега)} ( в + ω ) {\displaystyle (v+\омега)} в {\displaystyle v} ω {\displaystyle \омега}
  • Нулевое распределение для нулевых игроков: распределение для нулевого игрока равно нулю. Нулевой игрок удовлетворяет . С экономической точки зрения предельная ценность нулевого игрока для любой коалиции, которая его не содержит, равна нулю. я {\displaystyle я} в ( С { я } ) = в ( С ) ,   С Н { я } {\displaystyle v(S\cup \{i\})=v(S),\forall ~S\subseteq N\setminus \{i\}}

Эффективный вектор выигрыша называется предварительным вменением , а индивидуально рациональное предварительное вменение называется вменением . Большинство концепций решения являются вменениями.

Стабильный набор

Стабильный набор игры (также известный как решение фон Неймана-Моргенштерна (von Neumann & Morgenstern 1944)) был первым решением, предложенным для игр с более чем 2 игроками. Пусть будет игрой и пусть , будет двумя подстановками . Тогда доминирует , если некоторая коалиция удовлетворяет и . Другими словами, игроки в предпочитают выигрыши от тем из , и они могут угрожать покинуть большую коалицию, если используется , потому что выигрыш, который они получают самостоятельно, по крайней мере так же велик, как распределение, которое они получают при . v {\displaystyle v} x {\displaystyle x} y {\displaystyle y} v {\displaystyle v} x {\displaystyle x} y {\displaystyle y} S {\displaystyle S\neq \emptyset } x i > y i ,   i S {\displaystyle x_{i}>y_{i},\forall ~i\in S} i S x i v ( S ) {\displaystyle \sum _{i\in S}x_{i}\leq v(S)} S {\displaystyle S} x {\displaystyle x} y {\displaystyle y} y {\displaystyle y} x {\displaystyle x}

Стабильный набор — это набор импутаций , удовлетворяющий двум свойствам:

  • Внутренняя устойчивость: ни один вектор выигрыша в устойчивом наборе не доминируется другим вектором в наборе.
  • Внешняя устойчивость: все векторы выигрышей вне набора доминируются по крайней мере одним вектором в наборе.

Фон Нейман и Моргенштерн рассматривали стабильный набор как набор приемлемых поведений в обществе: Ни одно из них не является явно предпочтительным по сравнению с любым другим, но для каждого неприемлемого поведения существует предпочтительная альтернатива. Определение является очень общим, что позволяет использовать концепцию в самых разных игровых форматах. [ необходима цитата ]

Характеристики

  • Стабильный набор может существовать, а может и не существовать (Lucas 1969), а если он существует, то он, как правило, не является уникальным (Lucas 1992). Стабильные наборы обычно трудно найти. Эта и другие трудности привели к разработке многих других концепций решений.
  • Положительная доля кооперативных игр имеет уникальные стабильные наборы, состоящие из ядра (Оуэн, 1995, стр. 240).
  • Положительная доля кооперативных игр имеет стабильные наборы, которые дискриминируют игроков. В таких наборах по крайней мере дискриминируемые игроки исключаются (Owen 1995, стр. 240). n 2 {\displaystyle n-2} n 3 {\displaystyle n-3}

Ядро

Пусть будет игра. Ядром является набор векторов выигрышей v {\displaystyle v} v {\displaystyle v}

C ( v ) = { x R N : i N x i = v ( N ) ; i S x i v ( S ) ,   S N } . {\displaystyle C(v)=\left\{x\in \mathbb {R} ^{N}:\sum _{i\in N}x_{i}=v(N);\quad \sum _{i\in S}x_{i}\geq v(S),\forall ~S\subseteq N\right\}.}

На словах ядро ​​— это набор импутаций , при которых ни одна коалиция не имеет значения, превышающего сумму выплат ее членов. Таким образом, ни одна коалиция не имеет стимула покинуть большую коалицию и получить большую выплату.

Характеристики

  • Ядро игры может быть пустым (см. теорему Бондаревой–Шепли ). Игры с непустыми ядрами называются сбалансированными .
  • Если он непустой, ядро ​​не обязательно содержит уникальный вектор.
  • Ядро содержится в любом стабильном множестве, и если ядро ​​стабильно, то оно является единственным стабильным множеством; доказательство см. в (Driessen 1988) .

Суть простой игры с учетом предпочтений

Для простых игр существует другое понятие ядра, когда предполагается, что каждый игрок имеет предпочтения по набору альтернатив. Профиль — это список индивидуальных предпочтений по . Здесь означает, что индивид предпочитает альтернативу по профилю . При наличии простой игры и профиля отношение доминирования определяется по , если и только если существует выигрывающая коалиция (т. е. ), удовлетворяющая всем . Ядром простой игры по отношению к профилю предпочтений является набор альтернатив, не доминируемых (набор максимальных элементов по отношению к ): X {\displaystyle X} p = ( i p ) i N {\displaystyle p=(\succ _{i}^{p})_{i\in N}} i p {\displaystyle \succ _{i}^{p}} X {\displaystyle X} x i p y {\displaystyle x\succ _{i}^{p}y} i {\displaystyle i} x {\displaystyle x} y {\displaystyle y} p {\displaystyle p} v {\displaystyle v} p {\displaystyle p} v p {\displaystyle \succ _{v}^{p}} X {\displaystyle X} x v p y {\displaystyle x\succ _{v}^{p}y} S {\displaystyle S} v ( S ) = 1 {\displaystyle v(S)=1} x i p y {\displaystyle x\succ _{i}^{p}y} i S {\displaystyle i\in S} C ( v , p ) {\displaystyle C(v,p)} v {\displaystyle v} p {\displaystyle p} v p {\displaystyle \succ _{v}^{p}} X {\displaystyle X} v p {\displaystyle \succ _{v}^{p}}

x C ( v , p ) {\displaystyle x\in C(v,p)} тогда и только тогда, когда не существует такого, что . y X {\displaystyle y\in X} y v p x {\displaystyle y\succ _{v}^{p}x}

Число Накамуры простой игры — это минимальное число выигрышных коалиций с пустым пересечением. Теорема Накамуры утверждает, что ядро ​​непусто для всех профилей ациклических (альтернативно, транзитивных ) предпочтений тогда и только тогда, когда конечно и кардинальное число (число элементов) меньше числа Накамуры . Вариант Кумабэ и Михары утверждает, что ядро ​​непусто для всех профилей предпочтений , имеющих максимальный элемент , тогда и только тогда, когда кардинальное число меньше числа Накамуры . (Подробнее см. число Накамуры .) C ( v , p ) {\displaystyle C(v,p)} p {\displaystyle p} X {\displaystyle X} X {\displaystyle X} v {\displaystyle v} C ( v , p ) {\displaystyle C(v,p)} p {\displaystyle p} X {\displaystyle X} v {\displaystyle v}

Сильное эпсилон-ядро

Поскольку ядро ​​может быть пустым, в (Shapley & Shubik 1966) было введено обобщение. Сильное ядро ε {\displaystyle \varepsilon } ​​для некоторого числа — это набор векторов выплат ε R {\displaystyle \varepsilon \in \mathbb {R} }

C ε ( v ) = { x R N : i N x i = v ( N ) ; i S x i v ( S ) ε ,   S N } . {\displaystyle C_{\varepsilon }(v)=\left\{x\in \mathbb {R} ^{N}:\sum _{i\in N}x_{i}=v(N);\quad \sum _{i\in S}x_{i}\geq v(S)-\varepsilon ,\forall ~S\subseteq N\right\}.}

В экономических терминах сильное -ядро - это набор предварительных вменений, где ни одна коалиция не может улучшить свой выигрыш, покинув большую коалицию, если она должна заплатить штраф за выход. может быть отрицательным, в этом случае оно представляет собой бонус за выход из большой коалиции. Очевидно, что независимо от того, пусто ли ядро , сильное -ядро будет непустым для достаточно большого значения и пустым для достаточно малого (возможно, отрицательного) значения . Следуя этой линии рассуждений, наименьшее -ядро , введенное в (Maschler, Peleg & Shapley 1979), является пересечением всех непустых сильных -ядер. Его также можно рассматривать как сильное -ядро для наименьшего значения , которое делает множество непустым (Bilbao 2000). ε {\displaystyle \varepsilon } ε {\displaystyle \varepsilon } ε {\displaystyle \varepsilon } ε {\displaystyle \varepsilon } ε {\displaystyle \varepsilon } ε {\displaystyle \varepsilon } ε {\displaystyle \varepsilon } ε {\displaystyle \varepsilon } ε {\displaystyle \varepsilon }

Значение Шепли

Значение Шепли — это уникальный вектор выигрыша, который эффективен, симметричен и удовлетворяет условию монотонности. [14] Он был введен Ллойдом Шепли (Шепли, 1953), который показал, что это уникальный вектор выигрыша, который эффективен, симметричен, аддитивен и присваивает нулевые выигрыши фиктивным игрокам. Значение Шепли супераддитивной игры индивидуально рационально, но в общем случае это неверно. (Дриссен, 1988)

Ядро

Пусть будет игрой, и пусть будет эффективным вектором выигрыша. Максимальный излишек игрока i над игроком j относительно x равен v : 2 N R {\displaystyle v:2^{N}\to \mathbb {R} } x R N {\displaystyle x\in \mathbb {R} ^{N}}

s i j v ( x ) = max { v ( S ) k S x k : S N { j } , i S } , {\displaystyle s_{ij}^{v}(x)=\max \left\{v(S)-\sum _{k\in S}x_{k}:S\subseteq N\setminus \{j\},i\in S\right\},}

максимальная сумма, которую игрок i может получить без сотрудничества игрока j , выходя из большой коалиции N при векторе выплат x , предполагая, что другие игроки в выходящей коалиции i удовлетворены своими выплатами при x . Максимальный излишек — это способ измерить переговорную силу одного игрока над другим. Ядро это набор подстановок x , которые удовлетворяют v {\displaystyle v}

  • ( s i j v ( x ) s j i v ( x ) ) × ( x j v ( j ) ) 0 {\displaystyle (s_{ij}^{v}(x)-s_{ji}^{v}(x))\times (x_{j}-v(j))\leq 0} , и
  • ( s j i v ( x ) s i j v ( x ) ) × ( x i v ( i ) ) 0 {\displaystyle (s_{ji}^{v}(x)-s_{ij}^{v}(x))\times (x_{i}-v(i))\leq 0}

для каждой пары игроков i и j . Интуитивно, игрок i имеет большую переговорную силу, чем игрок j относительно вменения x , если , но игрок j невосприимчив к угрозам игрока i , если , потому что он может получить этот выигрыш самостоятельно. Ядро содержит все вменения , где ни один игрок не имеет этой переговорной силы над другим. Эта концепция решения была впервые введена в (Davis & Maschler 1965). s i j v ( x ) > s j i v ( x ) {\displaystyle s_{ij}^{v}(x)>s_{ji}^{v}(x)} x j = v ( j ) {\displaystyle x_{j}=v(j)}

Дивиденды Харсани

Дивиденд Харсани (названный в честь Джона Харсани , который использовал его для обобщения значения Шепли в 1963 году [15] ) определяет излишек, который создается коалицией игроков в кооперативной игре. Чтобы определить этот излишек, ценность этой коалиции корректируется излишком, который уже создан подкоалициями. С этой целью дивиденд коалиции в игре рекурсивно определяется d v ( S ) {\displaystyle d_{v}(S)} S {\displaystyle S} v {\displaystyle v}

d v ( { i } ) = v ( { i } ) d v ( { i , j } ) = v ( { i , j } ) d v ( { i } ) d v ( { j } ) d v ( { i , j , k } ) = v ( { i , j , k } ) d v ( { i , j } ) d v ( { i , k } ) d v ( { j , k } ) d v ( { i } ) d v ( { j } ) d v ( { k } ) d v ( S ) = v ( S ) T S d v ( T ) {\displaystyle {\begin{aligned}d_{v}(\{i\})&=v(\{i\})\\d_{v}(\{i,j\})&=v(\{i,j\})-d_{v}(\{i\})-d_{v}(\{j\})\\d_{v}(\{i,j,k\})&=v(\{i,j,k\})-d_{v}(\{i,j\})-d_{v}(\{i,k\})-d_{v}(\{j,k\})-d_{v}(\{i\})-d_{v}(\{j\})-d_{v}(\{k\})\\&\vdots \\d_{v}(S)&=v(S)-\sum _{T\subsetneq S}d_{v}(T)\end{aligned}}}

Явная формула для дивиденда задается как . Функция также известна как обратная функция Мёбиуса . [16] Действительно, мы можем восстановить из с помощью формулы . d v ( S ) = T S ( 1 ) | S T | v ( T ) {\textstyle d_{v}(S)=\sum _{T\subseteq S}(-1)^{|S\setminus T|}v(T)} d v : 2 N R {\displaystyle d_{v}:2^{N}\to \mathbb {R} } v : 2 N R {\displaystyle v:2^{N}\to \mathbb {R} } v {\displaystyle v} d v {\displaystyle d_{v}} v ( S ) = d v ( S ) + T S d v ( T ) {\textstyle v(S)=d_{v}(S)+\sum _{T\subsetneq S}d_{v}(T)}

Дивиденды Харсани полезны для анализа как игр, так и концепций решений, например, вектор Шепли получается путем распределения дивидендов каждой коалиции среди ее членов, т. е. вектор Шепли игрока в игре определяется путем суммирования доли игрока в дивидендах всех коалиций, в которые он входит . ϕ i ( v ) {\displaystyle \phi _{i}(v)} i {\displaystyle i} v {\displaystyle v} ϕ i ( v ) = S N : i S d v ( S ) / | S | {\textstyle \phi _{i}(v)=\sum _{S\subset N:i\in S}{d_{v}(S)}/{|S|}}

Ядрышко

Пусть будет игрой, и пусть будет вектором выигрыша. Избыток для коалиции — это величина ; то есть выигрыш, который игроки в коалиции могут получить, если они выйдут из большой коалиции при выигрыше и вместо этого возьмут выигрыш . Ядрышко — это подстановка , для которой вектор избытков всех коалиций (вектор в ) является наименьшим в лексиминном порядке . Ядрышко было введено в (Schmeidler 1969). v : 2 N R {\displaystyle v:2^{N}\to \mathbb {R} } x R N {\displaystyle x\in \mathbb {R} ^{N}} x {\displaystyle x} S N {\displaystyle S\subseteq N} v ( S ) i S x i {\displaystyle v(S)-\sum _{i\in S}x_{i}} S {\displaystyle S} N {\displaystyle N} x {\displaystyle x} v ( S ) {\displaystyle v(S)} v {\displaystyle v} R 2 N {\displaystyle \mathbb {R} ^{2^{N}}}

(Maschler, Peleg & Shapley 1979) дали более интуитивное описание: Начиная с наименьшего ядра, запишите коалиции, для которых правая часть неравенства в определении не может быть дополнительно уменьшена без того, чтобы сделать множество пустым. Продолжайте уменьшать правую часть для оставшихся коалиций, пока ее нельзя будет уменьшить без того, чтобы сделать множество пустым. Запишите новый набор коалиций, для которых неравенства остаются равными; продолжайте уменьшать правую часть оставшихся коалиций и повторяйте этот процесс столько раз, сколько необходимо, пока все коалиции не будут записаны. Результирующий вектор выигрыша является ядрышком. C ε ( v ) {\displaystyle C_{\varepsilon }(v)}

Характеристики

  • Хотя в определении это явно не указано, ядрышко всегда уникально. (См. раздел II.7 (Driessen 1988) для доказательства.)
  • Если ядро ​​непустое, то ядрышко находится в ядре.
  • Ядрышко всегда находится в ядре, и поскольку ядро ​​содержится в наборе для переговоров, оно всегда находится в наборе для переговоров (подробности см. в (Driessen 1988)).

Выпуклые кооперативные игры

Представленные Шепли в (Shapley 1971), выпуклые кооперативные игры охватывают интуитивное свойство некоторых игр "снежного кома". В частности, игра является выпуклой, если ее характеристическая функция является супермодулярной : v {\displaystyle v}

v ( S T ) + v ( S T ) v ( S ) + v ( T ) ,   S , T N . {\displaystyle v(S\cup T)+v(S\cap T)\geq v(S)+v(T),\forall ~S,T\subseteq N.}

Можно показать (см., например, раздел V.1 (Дриссен, 1988)), что супермодулярность эквивалентна v {\displaystyle v}

v ( S { i } ) v ( S ) v ( T { i } ) v ( T ) ,   S T N { i } ,   i N ; {\displaystyle v(S\cup \{i\})-v(S)\leq v(T\cup \{i\})-v(T),\forall ~S\subseteq T\subseteq N\setminus \{i\},\forall ~i\in N;}

то есть, «стимулы для присоединения к коалиции увеличиваются по мере роста коалиции» (Шепли, 1971), что приводит к вышеупомянутому эффекту снежного кома. Для игр со стоимостью неравенства меняются на противоположные, так что мы говорим, что игра со стоимостью является выпуклой , если характеристическая функция является субмодулярной .

Характеристики

Выпуклые кооперативные игры обладают многими полезными свойствами:

  • Супермодулярность тривиально подразумевает супераддитивность .
  • Выпуклые игры полностью сбалансированы : ядро ​​выпуклой игры непусто, и поскольку любая подыгра выпуклой игры выпукла, ядро ​​любой подыгры также непусто.
  • Выпуклая игра имеет единственное устойчивое множество, совпадающее с ее ядром .
  • Число Шепли выпуклой игры является центром тяжести ее ядра .
  • Экстремальную точку (вершину) ядра можно найти за полиномиальное время с помощью жадного алгоритма : Пусть будет перестановкой игроков, и пусть будет множеством игроков, упорядоченных по в , для любого , с . Тогда выигрыш, определяемый как , является вершиной ядра . Любая вершина ядра может быть построена таким образом, выбрав подходящую перестановку . π : N N {\displaystyle \pi :N\to N} S i = { j N : π ( j ) i } {\displaystyle S_{i}=\{j\in N:\pi (j)\leq i\}} 1 {\displaystyle 1} i {\displaystyle i} π {\displaystyle \pi } i = 0 , , n {\displaystyle i=0,\ldots ,n} S 0 = {\displaystyle S_{0}=\emptyset } x R N {\displaystyle x\in \mathbb {R} ^{N}} x i = v ( S π ( i ) ) v ( S π ( i ) 1 ) ,   i N {\displaystyle x_{i}=v(S_{\pi (i)})-v(S_{\pi (i)-1}),\forall ~i\in N} v {\displaystyle v} π {\displaystyle \pi }

Сходства и различия с комбинаторной оптимизацией

Субмодулярные и супермодулярные функции множеств также изучаются в комбинаторной оптимизации . Многие из результатов в (Shapley 1971) имеют аналоги в (Edmonds 1970), где субмодулярные функции были впервые представлены как обобщения матроидов . В этом контексте ядро ​​выпуклой игры стоимости называется базовым многогранником , поскольку его элементы обобщают базовые свойства матроидов .

Однако сообщество оптимизации обычно рассматривает субмодулярные функции как дискретные аналоги выпуклых функций (Lovász 1983), поскольку минимизация обоих типов функций вычислительно поддается обработке. К сожалению, это напрямую противоречит первоначальному определению Шепли супермодулярных функций как «выпуклых».

Связь между теорией кооперативных игр и фирмой

Корпоративные стратегические решения могут развиваться и создавать ценность посредством кооперативной теории игр. [17] Это означает, что кооперативная теория игр может стать стратегической теорией фирмы, а различные решения CGT могут моделировать различные институты.

Смотрите также

Ссылки

  1. ^ Шор, Майк. «Некооперативная игра — Game Theory .net». www.gametheory.net . Получено 15.09.2016 .
  2. ^ Чандрасекаран, Р. «Теория кооперативных игр» (PDF) .
  3. ^ Бранденбургер, Адам. "Теория кооперативных игр: характеристические функции, распределения, предельный вклад" (PDF) . Архивировано из оригинала (PDF) 2016-05-27.
  4. ^ обозначает множество степеней . 2 N {\displaystyle 2^{N}} N {\displaystyle N}
  5. ^ Хавьер Мурос, Франциско (2019). Кооперативные инструменты теории игр в коалиционных сетях управления (1-е изд.). Springer Cham. стр. 9–11. ISBN 978-3-030-10488-7.
  6. ^ Георгиос Халкиадакис; Эдит Элкинд; Майкл Дж. Вулдридж (25 октября 2011 г.). Вычислительные аспекты кооперативной теории игр. Издательство Morgan & Claypool. ISBN 978-1-60845-652-9.
  7. ^ Пелег, Б. (2002). "Глава 8. Теоретико-игровой анализ голосования в комитетах". Справочник по общественному выбору и благосостоянию , том 1. Том 1. стр. 395–423. doi :10.1016/S1574-0110(02)80012-1. ISBN 9780444829146.
  8. ^ См. раздел для теоремы Райса для определения вычислимой простой игры. В частности, все конечные игры вычислимы.
  9. ^ Kumabe, M.; Mihara, HR (2011). «Вычислимость простых игр: полное исследование шестидесяти четырех возможностей» (PDF) . Журнал математической экономики . 47 (2): 150–158. arXiv : 1102.4037 . Bibcode :2011arXiv1102.4037K. doi :10.1016/j.jmateco.2010.12.003. S2CID  775278.
  10. ^ Изменено из Таблицы 1 в Kumabe and Mihara (2011). Шестнадцать типов определяются четырьмя общепринятыми аксиомами (монотонность, правильность, сила и неслабость). Например, тип 1110 указывает на монотонные (1), правильные (1), сильные (1), слабые (0, потому что не неслабые) игры. Среди игр типа 1110 не существует конечных невычислимых, существуют конечные вычислимые, не существует бесконечных невычислимых и не существует бесконечных вычислимых. Обратите внимание, что за исключением типа 1110 последние три столбца идентичны.
  11. ^ Kumabe, M.; Mihara, HR (2008). «Числа Накамуры для вычислимых простых игр». Social Choice and Welfare . 31 (4): 621. arXiv : 1107.0439 . doi : 10.1007/s00355-008-0300-5. S2CID  8106333.
  12. ^ Ауманн, Роберт Дж. «Ядро кооперативной игры без побочных платежей». Труды Американского математического общества (1961): 539-552.
  13. ^ Петерс, Ханс (2008). Теория игр: многоуровневый подход . Springer. стр. 123. doi :10.1007/978-3-540-69291-1_17. ISBN 978-3-540-69290-4.
  14. ^ Young, HP (1985-06-01). «Монотонные решения кооперативных игр». International Journal of Game Theory . 14 (2): 65–72. doi :10.1007/BF01769885. ISSN  0020-7276. S2CID  122758426.
  15. ^ Харсани, Джон К. (1982). «Упрощенная модель переговоров для кооперативной игры n-человек». Статьи по теории игр . Библиотека теории и принятия решений. Springer, Дордрехт. стр. 44–70. doi :10.1007/978-94-017-2527-9_3. ISBN 9789048183692.
  16. ^ Функции множеств, игры и возможности принятия решений | Мишель Грабиш | Springer. Библиотека теории и принятия решений C. Springer. 2016. ISBN 9783319306889.
  17. ^ Росс, Дэвид Гэддис (01.08.2018). «Использование теории кооперативных игр для содействия исследованию стратегии». Strategic Management Journal . 39 (11): 2859–2876. doi :10.1002/smj.2936. S2CID  169982369.

Дальнейшее чтение

  • Бильбао, Хесус Марио (2000), Кооперативные игры на комбинаторных структурах, Kluwer Academic Publishers, ISBN 9781461543930
  • Дэвис, М.; Машлер, М. (1965), «Ядро кооперативной игры», Naval Research Logistics Quarterly , 12 (3): 223–259, doi :10.1002/nav.3800120303
  • Дриссен, Тео (1988), Кооперативные игры, решения и приложения, Kluwer Academic Publishers, ISBN 9789401577878
  • Эдмондс, Джек (1970), «Субмодулярные функции, матроиды и некоторые многогранники», в Гай, Р.; Ханани, Х.; Зауэр, Н.; Шёнхайм, Дж. (ред.), Комбинаторные структуры и их приложения , Нью-Йорк: Гордон и Брич, стр. 69–87
  • Ловас, Ласло (1983), «Субмодулярные функции и выпуклость», в Bachem, A.; Grötschel, M .; Korte, B. (ред.), Mathematical Programming—The State of the Art , Berlin: Springer, стр. 235–257
  • Лейтон-Браун, Кевин; Шохам, Йоав (2008), Основы теории игр: краткое междисциплинарное введение, Сан-Рафаэль, Калифорния: Morgan & Claypool Publishers, ISBN 978-1-59829-593-1. 88-страничное математическое введение; см. главу 8. Бесплатно онлайн (требуется подписка) Архивировано 15 августа 2000 г. на Wayback Machine во многих университетах.
  • Шмейдлер, Д. (1969), «Ядро характеристической функциональной игры», Журнал SIAM по прикладной математике , 17 (6): 1163–1170, doi :10.1137/0117107.
  • Шепли, Ллойд С. (1953), «Значение для игр с двумя лицами», в книге Кун, Х.; Такер, А. В. (ред.), Вклад в теорию игр II , Принстон, Нью-Джерси: Princeton University Press, стр. 307–317 n {\displaystyle n}
  • Шепли, Ллойд С. (18 марта 1952 г.), «Ценность игр N-человек», Санта-Моника, Калифорния: Корпорация RAND
  • Шепли, Ллойд С. (1971), «Ядра выпуклых игр», Международный журнал теории игр , 1 (1): 11–26, doi :10.1007/BF01753431, S2CID  123385556
  • Шепли, Ллойд С.; Шубик, М. (1966), «Квазиядра в денежной экономике с невыпуклыми предпочтениями», Econometrica , 34 (4): 805–827, doi :10.2307/1910101, JSTOR  1910101
  • Шохам, Йоав; Лейтон-Браун, Кевин (2009), Многоагентные системы: алгоритмические, игровые и логические основы, Нью-Йорк: Cambridge University Press , ISBN 978-0-521-89943-7. Полный справочник с точки зрения вычислений; см. главу 12. Можно бесплатно загрузить онлайн.
  • Yeung, David WK и Leon A. Petrosyan. Кооперативные стохастические дифференциальные игры (серия Springer по исследованию операций и финансовому инжинирингу), Springer, 2006. Мягкая обложка - ISBN 978-1441920942 . 
  • Yeung, David WK и Leon A. Petrosyan. Subgame Consistent Economic Optimization: An Advanced Cooperative Dynamic Game Analysis (Static & Dynamic Game Theory: Foundations & Applications), Birkhäuser Boston; 2012. ISBN 978-0817682613 
Retrieved from "https://en.wikipedia.org/w/index.php?title=Cooperative_game_theory&oldid=1223531109"