Одновременная игра

Камень-ножницы-бумага — пример одновременной игры.

В теории игр одновременная игра или статическая игра [1] — это игра, в которой каждый игрок выбирает свое действие, не зная о действиях, выбранных другими игроками. [2] Одновременные игры контрастируют с последовательными играми , в которые игроки играют по очереди (ходы чередуются между игроками). Другими словами, оба игрока обычно действуют одновременно в одновременной игре. Даже если игроки не действуют одновременно, оба игрока не информированы о ходе друг друга при принятии своих решений. [3] Для одновременных игр обычно используются представления нормальной формы . [4] Учитывая непрерывную игру , игроки будут иметь разные наборы информации , если игра одновременная, чем если бы она была последовательной, потому что у них меньше информации для действий на каждом шаге игры. Например, в непрерывной игре двух игроков, которая является последовательной, второй игрок может действовать в ответ на действие, предпринятое первым игроком. Однако это невозможно в одновременной игре, где оба игрока действуют одновременно.

Характеристики

В последовательных играх игроки наблюдают за тем, что соперники делали в прошлом, и существует определенный порядок игры. [5] Однако в одновременных играх все игроки выбирают стратегии, не наблюдая за выбором своих соперников, и игроки делают выбор в одно и то же время. [5]

Простой пример — «камень-ножницы-бумага», в которой все игроки делают свой выбор в одно и то же время. Однако ход в одно и то же время не всегда воспринимается буквально, вместо этого игроки могут делать ходы, не видя выбора других игроков. [5] Простой пример — выборы, в которых не все избиратели будут голосовать буквально в одно и то же время, но каждый избиратель будет голосовать, не зная, что выбрал кто-то другой.


Учитывая, что лица, принимающие решения, рациональны, то такова же и индивидуальная рациональность. Результат индивидуально рационален, если он обеспечивает каждому игроку по крайней мере его уровень безопасности. [6] Уровень безопасности для Игрока i — это сумма max min Hi (s), которую игрок может гарантировать себе в одностороннем порядке, то есть без учета действий других игроков.

Представление

В одновременной игре игроки делают ходы одновременно, определяют исход игры и получают свои выигрыши.

Наиболее распространенным представлением одновременной игры является нормальная форма (матричная форма). Для игры с двумя игроками один игрок выбирает строку, а другой игрок выбирает столбец в одно и то же время. Традиционно в ячейке первая запись — это выигрыш игрока строки, вторая запись — это выигрыш игрока столбца. Выбранная «ячейка» является результатом игры. [4] Чтобы определить, какая «ячейка» выбрана, необходимо сравнить выигрыши как игрока строки, так и игрока столбца соответственно. Каждому игроку лучше всего там, где его выигрыш выше.

Камень–ножницы–бумага , широко распространенная игра с руками, является примером одновременной игры. Оба игрока принимают решение, не зная решения противника, и раскрывают свои руки одновременно. В этой игре два игрока, и у каждого из них есть три различные стратегии для принятия решения; комбинация профилей стратегий (полный набор возможных стратегий каждого игрока) образует таблицу 3×3. Мы отобразим стратегии Игрока 1 в виде строк, а стратегии Игрока 2 в виде столбцов. В таблице цифры красного цвета представляют собой выигрыш Игрока 1, цифры синего цвета представляют собой выигрыш Игрока 2. Таким образом, выигрыш для игры 2 игроков в камень-ножницы-бумага будет выглядеть следующим образом: [4]

Игрок 2

Игрок 1
КаменьБумагаНожницы
Камень
0
0
1
-1
-1
1
Бумага
-1
1
0
0
1
-1
Ножницы
1
-1
-1
1
0
0

Другим распространенным представлением одновременной игры является развернутая форма ( дерево игры ). Информационные наборы используются для подчеркивания несовершенной информации. Хотя это не просто, для игр с более чем 2 игроками проще использовать деревья игры. [4]

Хотя одновременные игры обычно представляются в нормальной форме, их можно представить и с использованием развернутой формы. Хотя в развернутой форме решение одного игрока должно быть принято раньше, чем другого, по определению такое представление не соответствует реальному времени принятия решений игроками в одновременной игре. Ключом к моделированию одновременных игр в развернутой форме является правильное определение наборов информации. Пунктирная линия между узлами в развернутой форме представления игры представляет собой информационную асимметрию и указывает, что во время игры сторона не может различать узлы [7], поскольку сторона не знает о решении другой стороны (по определению «одновременной игры»).

Одновременная игра «камень-ножницы-бумага», смоделированная в развернутой форме [7]

Некоторые варианты шахмат, которые относятся к этому классу игр, включают синхронные шахматы и паритетные шахматы. [8]

Биматричная игра

В одновременной игре у игроков есть только один ход, и все ходы игроков делаются одновременно. Количество игроков в игре должно быть оговорено, и все возможные ходы для каждого игрока должны быть перечислены. У каждого игрока могут быть разные роли и варианты ходов. [9] Однако у каждого игрока есть конечное количество вариантов, доступных для выбора.

Два игрока

Пример одновременной игры двух игроков:

В городе есть две компании, A и B, которые в настоящее время зарабатывают $8,000,000 каждая, и им нужно определить, следует ли им рекламироваться. В таблице ниже показаны модели выплат; строки — это варианты A, а столбцы — варианты B. Записи — это выплаты для A и B, соответственно, разделенные запятой. [9]

B рекламируетB не рекламирует
А рекламирует2,25,1
А не рекламирует1,58,8

Два игрока (нулевая сумма)

Игра с нулевой суммой — это когда сумма выигрышей равна нулю для любого результата, т.е. проигравшие платят за выигрыши победителей. Для игры с нулевой суммой для двух игроков выигрыш игрока A не обязательно должен отображаться, так как он является отрицательным от выигрыша игрока B. [9]

Пример одновременной игры с нулевой суммой для двух игроков:

В игру «камень-ножницы-бумага» играют два друга, A и B, на 10 долларов. Первая ячейка означает выплату 0 для обоих игроков. Вторая ячейка — выплата 10 для A, которую должен заплатить B, следовательно, выплата -10 для B.

КаменьБумагаНожницы
Камень0−1010
Бумага100−10
Ножницы−10100

Три или более игроков

Пример одновременной игры 3-х игроков:

Проводится голосование в классе по вопросу, следует ли увеличить количество свободного времени. Игрок A выбирает матрицу, игрок B выбирает строку, а игрок C выбирает столбец. [9] Выигрыши следующие:

Голосование за дополнительное свободное время
C голосует за дополнительное свободное времяC голосует против дополнительного свободного времени
B голосует за дополнительное свободное время1,1,11,1,2
B голосует против дополнительного свободного времени1,2,1−1,0,0
Голосование против дополнительного свободного времени
C голосует за дополнительное свободное времяC голосует против дополнительного свободного времени
B голосует за дополнительное свободное время2,1,10,−1,0
B голосует против дополнительного свободного времени0,0,−10,0,0

Симметричные игры

Все вышеприведенные примеры были симметричными. У всех игроков одинаковые возможности, поэтому если игроки меняют ходы, они также меняют свои выигрыши. По замыслу симметричные игры являются честными, в которых каждому игроку предоставляются одинаковые шансы. [9]

Стратегии - Лучший выбор

Теория игр должна давать игрокам советы о том, как найти лучший ход. Они известны как стратегии «лучшего ответа». [10]

Чистая и смешанная стратегия

Чистые стратегии — это те, в которых игроки выбирают только одну стратегию из своего лучшего ответа. Чистая стратегия определяет все ваши возможные ходы в игре, это полный план для игрока в данной игре. Смешанные стратегии — это те, в которых игроки рандомизируют стратегии в своем наборе лучших ответов. Они имеют связанные вероятности с каждым набором стратегий. [10]

В одновременных играх игроки обычно выбирают смешанные стратегии, а очень редко выбирают чистые стратегии. Причина этого в том, что в игре, где игроки не знают, что выберет другой, лучше всего выбрать вариант, который, скорее всего, даст вам наибольшую выгоду при наименьшем риске, учитывая, что другой игрок может выбрать что угодно [10], то есть если вы выберете свой лучший вариант, а другой игрок также выберет свой лучший вариант, кто-то пострадает.

Стратегия доминирования против доминируемого

Доминирующая стратегия обеспечивает игроку максимально возможную выплату за любую стратегию других игроков. В одновременных играх лучший ход, который может сделать игрок, — это следовать своей доминирующей стратегии, если таковая существует. [11]

При анализе сеанса одновременной игры:

Во-первых, определите любые доминирующие стратегии для всех игроков. Если у каждого игрока есть доминирующая стратегия, то игроки будут играть в эту стратегию, однако если есть более одной доминирующей стратегии, то любая из них возможна. [11]

Во-вторых, если нет доминирующих стратегий, определите все стратегии, в которых доминируют другие стратегии. Затем исключите доминируемые стратегии, а оставшиеся стратегии будут стратегиями, в которые будут играть игроки. [11]

Стратегия Максимина

Некоторые люди всегда ожидают худшего и считают, что другие хотят их сбить, когда на самом деле другие хотят максимизировать свои выигрыши. Тем не менее, тем не менее, игрок А сосредоточится на своем наименьшем возможном выигрыше, полагая, что это то, что получит игрок А, он выберет вариант с наивысшей ценностью. Этот вариант является максиминным ходом (стратегией), так как он максимизирует минимально возможный выигрыш. Таким образом, игрок может быть уверен в выигрыше, по крайней мере, в размере максиминного значения, независимо от того, как играют другие. Игрок не должен знать выигрыши других игроков, чтобы выбрать максиминный ход, поэтому игроки могут выбрать максиминную стратегию в одновременной игре независимо от того, что выбирают другие игроки. [10]

Равновесие Нэша

Чистое равновесие Нэша — это когда никто не может получить более высокий выигрыш, отклоняясь от своего хода, при условии, что другие придерживаются своего первоначального выбора. Равновесия Нэша — это самовыполняющиеся контракты, в которых переговоры происходят до начала игры, в которой каждый игрок наилучшим образом придерживается своего согласованного хода. В равновесии Нэша каждый игрок наилучшим образом реагирует на выбор другого игрока. [11]

Дилемма заключенных

Дилемма заключенного

Дилемма заключенного возникла благодаря Мерриллу Флуду и Мелвину Дрешеру и является одной из самых известных игр в теории игр. Обычно игра представляется следующим образом:

Полиция задержала двух членов преступной группировки. Оба сейчас находятся в одиночных камерах. У прокуроров есть доказательства, необходимые для того, чтобы посадить обоих заключенных по менее тяжким обвинениям. Однако у них нет доказательств, необходимых для осуждения заключенных по их основным обвинениям. Поэтому обвинение одновременно предлагает обоим заключенным сделку, по которой они могут выбрать сотрудничество друг с другом, храня молчание, или выбрать предательство, то есть дать показания против своего партнера и получить смягченный приговор. Следует отметить, что заключенные не могут общаться друг с другом. [12] Таким образом, получается следующая матрица выплат:

Заключенный Б
Заключенный А.
Заключенный Б молчит

( Сотрудничество )

Заключенный Б Признается

(Предательство)

Заключенный А молчит

( Сотрудничество )

Каждый служит 1 годЗаключенный А: 3 года

Заключенный Б: 3 месяца

Признание заключенного А

(Предательство)

Заключенный А: 3 месяца

Заключенный Б: 3 года

Каждый служит 2 года

Эта игра приводит к четкой доминирующей стратегии предательства, где единственным сильным равновесием Нэша является признание обоих заключенных. Это потому, что мы предполагаем, что оба заключенных рациональны и не имеют никакой лояльности друг к другу. Следовательно, предательство обеспечивает большую награду для большинства потенциальных результатов. [12] Если B сотрудничает, A должен выбрать предательство, так как отсидеть 3 месяца лучше, чем отсидеть 1 год. Более того, если B выбирает предательство, то A также должен выбрать предательство, так как отсидеть 2 года лучше, чем отсидеть 3 года. Выбор в пользу сотрудничества явно обеспечивает лучший результат для двух заключенных, однако с точки зрения личной заинтересованности этот вариант будет считаться нерациональным. Вышеупомянутый вариант сотрудничества обоих предполагает наименьшее общее время, проведенное в тюрьме, в общей сложности 2 года. Эта сумма значительно меньше, чем общее равновесие Нэша, где оба сотрудничают, равное 4 годам. Однако, учитывая ограничения, что заключенные A и B индивидуально мотивированы, они всегда выберут предательство. Они делают это, выбирая для себя наилучший вариант, учитывая при этом все возможные решения другого заключенного.

Битва полов

В игре «Битва полов » жена и муж независимо друг от друга решают, пойти ли им на футбольный матч или на балет. Каждому из них нравится делать что-то вместе, но муж предпочитает футбол, а жена — балет. Два равновесия Нэша, а значит, и наилучшие ответы для обоих — это выбрать одно и то же занятие для досуга, например (балет, балет) или (футбол, футбол). [11] В таблице ниже показан выигрыш для каждого варианта:

Жена
ФутболБалет
МужФутбол3,21,1
Балет0,02,3

Социально желательные результаты

Вильфредо Парето , итальянский социолог и экономист

Одновременные игры предназначены для информирования о стратегических выборах в конкурентной и некооперативной среде. Однако важно отметить, что равновесия Нэша и многие из вышеупомянутых стратегий, как правило, не приводят к социально желательным результатам.

Оптимальность по Парето

Эффективность по Парето — это понятие, укорененное в теоретической конструкции совершенной конкуренции . Возникнув благодаря итальянскому экономисту Вильфредо Парето, это понятие относится к состоянию, в котором экономика максимизирует эффективность с точки зрения распределения ресурсов. Эффективность по Парето тесно связана с оптимальностью по Парето, которая является идеалом экономики благосостояния и часто подразумевает понятие этических соображений. Например, говорят, что одновременная игра достигает оптимальности по Парето, если нет альтернативного результата, который может улучшить положение хотя бы одного игрока, оставив всех остальных игроков по крайней мере такими же. Поэтому такие результаты называются социально желательными результатами. [13]

Охота на оленя

Охота на оленя

Охота на оленя философа Жан-Жака Руссо — это одновременная игра, в которой участвуют два игрока. Решение, которое необходимо принять, заключается в том, хочет ли каждый игрок охотиться на оленя или зайца. Естественно, охота на оленя принесет большую пользу по сравнению с охотой на зайца. Однако, чтобы охотиться на оленя, оба игрока должны работать вместе. С другой стороны, каждый игрок вполне способен охотиться на зайца в одиночку. В результате возникает дилемма: ни один из игроков не может быть уверен в том, что выберет другой. Таким образом, предоставляется возможность игроку не получить никакого выигрыша, если он будет единственной стороной, решившей охотиться на оленя. [14] Таким образом, в результате получается следующая матрица выигрышей:

Охота на оленя
Оленьзаяц
Олень3,30,1
заяц1,01,1

Игра разработана для иллюстрации четкой оптимальности Парето, где оба игрока сотрудничают, чтобы охотиться на оленя. Однако из-за неотъемлемого риска игры такой результат не всегда достигается. Крайне важно отметить, что оптимальность Парето не является стратегическим решением для одновременных игр. Однако идеал информирует игроков о потенциале более эффективных результатов. Более того, потенциально предоставляя понимание того, как игроки должны учиться играть с течением времени. [15]

Смотрите также

Ссылки

  1. ^ Pepall, Lynne, 1952- (2014-01-28). Промышленная организация: современная теория и эмпирические приложения . Richards, Daniel Jay., Norman, George, 1946- (Пятое изд.). Hoboken, NJ. ISBN 978-1-118-25030-3. OCLC  788246625.{{cite book}}: CS1 maint: местоположение отсутствует издатель ( ссылка ) CS1 maint: несколько имен: список авторов ( ссылка ) CS1 maint: числовые имена: список авторов ( ссылка )
  2. ^ http://www-bcf.usc.edu Путь к равновесию в последовательных и одновременных играх (Брокас, Каррильо, Сачдева; 2016).
  3. ^ Управленческая экономика: 3-е издание . McGraw Hill Education (India) Private Limited. 2018. ISBN 978-93-87067-63-9.
  4. ^ abcd Mailath, George J.; Samuelson, Larry; Swinkels, Jeroen M. (1993). «Рассуждения в расширенной форме в играх в нормальной форме». Econometrica . 61 (2): 273– 302. doi :10.2307/2951552. ISSN  0012-9682. JSTOR  2951552. S2CID  9876487.
  5. ^ abc Sun, C., 2019. Одновременный и последовательный выбор в симметричной игре для двух игроков с выплатами в форме каньона. Japanese Economic Review, [онлайн] Доступно по адресу: <https://www.researchgate.net/publication/332377544_Simultaneous_and_Sequential_Choice_in_a_Symmetric_Two-Player_Game_with_Canyon-Shaped_Payoffs> [Доступ 30 октября 2020 г.].
  6. ^ Верненго, Матиас; Калденти, Эстебан Перес; Россер-младший, Баркли Дж., ред. (2020). Веб-логин UM. дои : 10.1057/978-1-349-95121-5. ISBN 978-1-349-95121-5. S2CID  261084293 . Получено 20.11.2021 . {{cite book}}: |website=проигнорировано ( помощь )
  7. ^ ab Watson, Joel. (2013-05-09). Стратегия: введение в теорию игр (Третье изд.). Нью-Йорк. ISBN 978-0-393-91838-0. OCLC  842323069.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  8. ^ А.В., Мурали (07.10.2014). «Паритетные шахматы». Блогер . Проверено 15 января 2017 г.
  9. ^ abcde Prisner, E., 2014. Game Theory Through Examples. Mathematical Association of America Inc. [онлайн] Швейцария: The Mathematical Association of America, стр. 25-30. Доступно по адресу: <https://www.maa.org/sites/default/files/pdf/ebooks/GTE_sample.pdf> [Доступ 30 октября 2020 г.].
  10. ^ abcd Росс, Д., 2019. Теория игр. Стэнфордская энциклопедия философии, [онлайн] стр. 7-80. Доступно по адресу: <https://plato.stanford.edu/entries/game-theory> [Доступ 30 октября 2020 г.].
  11. ^ abcde Муньос-Гарсия, Ф. и Торо-Гонсалес, Д., 2016. Чистое стратегическое равновесие Нэша и одновременные игры с полной информацией. Стратегия и теория игр, [онлайн] стр. 25-60. Доступно по адресу: <https://link.springer.com/chapter/10.1007/978-3-319-32963-5_2> [Доступ 30 октября 2020 г.].
  12. ^ ab M., Amadae, S. (2016). Узники разума: теория игр и неолиберальная политическая экономия. Cambridge University Press. ISBN 978-1-107-67119-5. OCLC  946968759.{{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  13. ^ Бертонне, Ирен; Дельклит, Томас (2014-10-10), «Парето-оптимальность или Парето-эффективность: одна и та же концепция, разные названия? Анализ более чем столетия экономической литературы», A Research Annual , Emerald Group Publishing Limited, стр.  129–145 , doi :10.1108/s0743-415420140000032005, ISBN 978-1-78441-154-1, получено 2021-04-25
  14. ^ Вандершраф, Питер (2016). «В слабо доминируемой стратегии есть сила: эволюция оптимальности в охоте на оленя, дополненная возможностью наказания». Философия науки . 83 (1): 29– 59. doi :10.1086/684166. ISSN  0031-8248. S2CID  124619436.
  15. ^ Хао, Цзянье; Леунг, Хо-Фунг (2013). «Достижение социально оптимальных результатов в многоагентных системах с подкреплением социального обучения». Труды ACM по автономным и адаптивным системам . 8 (3): 1– 23. doi :10.1145/2517329. ISSN  1556-4665. S2CID  7496856.

Библиография

Взято с "https://en.wikipedia.org/w/index.php?title=Одновременная_игра&oldid=1270875405#Стратегия_Максимина"