Равновесие квантового отклика | |
---|---|
Концепция решения в теории игр | |
Отношение | |
Супермножество | Равновесие Нэша , Логит-равновесие |
Значение | |
Предложено | Ричард Маккелви и Томас Палфри |
Используется для | Некооперативные игры |
Пример | Дилемма путешественника |
Квантовое равновесие отклика ( QRE ) — это концепция решения в теории игр . Впервые введенная Ричардом Маккелви и Томасом Палфри , [1] [2] она обеспечивает понятие равновесия с ограниченной рациональностью . QRE не является уточнением равновесия и может давать существенно отличающиеся результаты от равновесия Нэша . QRE определена только для игр с дискретными стратегиями, хотя существуют аналоги с непрерывными стратегиями.
В равновесии квантового ответа предполагается, что игроки совершают ошибки при выборе чистой стратегии. Вероятность выбора любой конкретной стратегии положительно связана с выигрышем от этой стратегии. Другими словами, очень дорогостоящие ошибки маловероятны.
Равновесие возникает из реализации убеждений. Выигрыши игрока вычисляются на основе убеждений о распределении вероятностей других игроков по стратегиям. В равновесии убеждения игрока верны.
При анализе данных из игры реальных игр, особенно из лабораторных экспериментов , особенно из экспериментов с игрой в соответствующие пенни , равновесие Нэша может быть неумолимым. Любой неравновесный ход может показаться одинаково «неправильным», но реалистично не должен использоваться для отклонения теории. QRE позволяет играть любую стратегию с ненулевой вероятностью, и поэтому любые данные возможны (хотя и не обязательно разумны).
Наиболее распространенной спецификацией для QRE является логит-равновесие ( LQRE ). В логит-равновесии стратегии игроков выбираются в соответствии с распределением вероятностей:
- вероятность выбора игроком стратегии . - ожидаемая полезность для игрока выбора стратегии при убеждении, что другие игроки играют в соответствии с распределением вероятностей . Обратите внимание, что плотность «убеждений» в ожидаемом выигрыше на правой стороне должна соответствовать плотности выбора на левой стороне. Таким образом, вычисление ожиданий наблюдаемых величин, таких как выигрыш, спрос, выпуск и т. д., требует нахождения фиксированных точек, как в теории среднего поля . [3]
Особый интерес в логит-модели представляет неотрицательный параметр λ (иногда его записывают как 1/μ). λ можно рассматривать как параметр рациональности. При λ→0 игроки становятся «совершенно нерациональными» и разыгрывают каждую стратегию с равной вероятностью. При λ→∞ игроки становятся «совершенно рациональными» и игра приближается к равновесию Нэша. [4]
Для динамических ( расширенной формы ) игр Маккелви и Палфри определили квантовое равновесие реакции агента ( AQRE ). AQRE в некоторой степени аналогично совершенству подигры . В AQRE каждый игрок играет с некоторой ошибкой, как в QRE. В заданном узле принятия решения игрок определяет ожидаемый выигрыш каждого действия, рассматривая свое будущее «я» как независимого игрока с известным распределением вероятностей по действиям. Как и в QRE, в AQRE каждая стратегия используется с ненулевой вероятностью.
Подход квантового равновесия отклика применялся в различных условиях. Например, Goeree et al. (2002) изучают переоценку ставок на частных аукционах, [5] Yi (2005) исследует поведение в ультимативных играх, [6] Hoppe и Schmitz (2013) изучают роль социальных предпочтений в задачах принципала-агента, [7] а Kawagoe et al. (2018) исследуют игры с общественными благами на уровне шагов с бинарными решениями. [8]
Большинство тестов квантового равновесия реакции основаны на экспериментах, в которых участники не мотивированы или мотивированы только в небольшой степени хорошо выполнять задачу. Однако квантовое равновесие реакции также объясняет поведение в условиях высоких ставок. Например, масштабный анализ американского телевизионного игрового шоу The Price Is Right показывает, что поведение участников в так называемой Showcase Showdown, последовательной игре с идеальной информацией , может быть хорошо объяснено моделью квантового равновесия реакции агента (AQRE). [9]
Работа Хайле и др. показала, что QRE не поддается фальсификации в любой нормальной форме игры, даже при наличии существенных априорных ограничений на возмущения выплат. [10] Авторы утверждают, что концепция LQRE иногда может ограничивать набор возможных результатов игры, но может оказаться недостаточной для обеспечения мощного теста поведения без априорных ограничений на возмущения выплат.
Как и в статистической механике, подход среднего поля, в частности ожидание в показателе степени, приводит к потере информации. [11] В более общем плане, различия в выплате агента относительно его стратегической переменной приводят к потере информации.
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь )