Сверхрациональность

Черта игрока в теории игр

В экономике и теории игр считается, что участник обладает сверхрациональностью (или ренормализованной рациональностью ), если он обладает идеальной рациональностью (и, таким образом, максимизирует свою полезность ), но предполагается, что все остальные игроки также сверхрациональны и что сверхрациональный человек всегда будет придумывать ту же стратегию, что и любой другой сверхрациональный мыслитель, столкнувшись с той же проблемой. Применяя это определение, сверхрациональный игрок, играющий против сверхрационального противника в дилемме заключенного, будет сотрудничать, в то время как рационально эгоистичный игрок предаст.

Это правило принятия решений не является общепринятой моделью в теории игр и было предложено Дугласом Хофштадтером в его статье, серии и книге «Метамагические темы» [1] как альтернативный тип рационального принятия решений, отличный от широко распространенного теоретико-игрового . Хофштадтер дал следующее определение: «Сверхрациональные мыслители, по рекурсивному определению, включают в свои расчеты тот факт, что они находятся в группе сверхрациональных мыслителей». [1]

В отличие от предполагаемого « ответственного человека », сверхрациональный мыслитель не всегда будет придерживаться равновесия, максимизирующего общую общественную полезность, и, следовательно, не является филантропом .

Дилемма заключенного

Идея сверхрациональности заключается в том, что два логически мыслящих человека, анализируя одну и ту же задачу, придут к одному и тому же правильному ответу. Например, если два человека оба хороши в математике и им обоим дали одну и ту же сложную задачу, оба получат один и тот же правильный ответ. В математике знание того, что два ответа будут одинаковыми, не меняет ценности задачи, но в теории игр знание того, что ответ будет одинаковым, может изменить сам ответ.

Дилемма заключенного обычно формулируется в терминах тюремного заключения для преступников, но ее можно с тем же успехом сформулировать и с денежными призами. Каждому из двух игроков предоставляется выбор сотрудничать (C) или предать (D). Игроки выбирают, не зная, что собирается сделать другой. Если оба будут сотрудничать, каждый получит по 100 долларов. Если они оба предают, каждый получит по 1 доллару. Если один будет сотрудничать, а другой предаст, то предавший игрок получит 150 долларов, а сотрудничающий игрок не получит ничего.

Ниже перечислены четыре результата и выигрыш каждого игрока.

Игрок B сотрудничаетДефекты игрока B
Игрок А сотрудничаетОба получают по 100 долларов.Игрок A: 0 долларов
Игрок B: 150 долларов
Игрок А ошибаетсяИгрок A: 150 долларов
Игрок B: 0 долларов
Оба получают по 1 доллару

Один из допустимых способов рассуждения игроков заключается в следующем:

  1. Предположим, что другой игрок предаст, то если я буду сотрудничать, то не получу ничего, а если предам, то получу доллар.
  2. Если предположить, что другой игрок сотрудничает, я получу 100 долларов, если буду сотрудничать, и 150 долларов, если откажусь.
  3. Поэтому, что бы ни делал другой игрок, мой выигрыш увеличивается за счет отказа, пусть даже всего на один доллар.

Вывод таков, что рациональным решением будет предать. Этот тип рассуждений определяет теоретико-игровую рациональность, и два теоретико-игровых рациональных игрока, играющих в эту игру, оба предают и получают по доллару каждый.

Сверхрациональность — это альтернативный метод рассуждения. Во-первых, предполагается, что ответ на симметричную задачу будет одинаковым для всех сверхрациональных игроков. Таким образом, одинаковость учитывается до того, как будет известна стратегия. Стратегия находится путем максимизации выигрыша для каждого игрока, предполагая, что все они используют одну и ту же стратегию. Поскольку сверхрациональный игрок знает, что другой сверхрациональный игрок сделает то же самое, что бы это ни было, для двух сверхрациональных игроков есть только два выбора. Оба будут сотрудничать или оба предадут в зависимости от значения сверхрационального ответа. Таким образом, два сверхрациональных игрока будут оба сотрудничать, поскольку этот ответ максимизирует их выигрыш. Два сверхрациональных игрока, играющих в эту игру, уйдут каждый с 100 долларами.

Сверхрациональный игрок, играющий против рационального игрока, придерживающегося теории игр, предаст, поскольку стратегия предполагает только согласие сверхрациональных игроков.

Хотя стандартная теория игр предполагает общее знание рациональности, она делает это по-другому. Игровой теоретико-анализ максимизирует выигрыши, позволяя каждому игроку менять стратегии независимо от других, хотя в конечном итоге он предполагает, что ответ в симметричной игре будет одинаковым для всех. Это определение игрового теоретико- равновесия Нэша , которое определяет стабильную стратегию как такую, при которой ни один игрок не может улучшить выигрыши, односторонне изменив курс. Сверхрациональное равновесие в симметричной игре — это такое равновесие, при котором все стратегии игроков вынуждены быть одинаковыми до шага максимизации. (Хотя нет согласованного расширения концепции сверхрациональности на асимметричные игры, см. § Асимметричные игры для получения дополнительной информации.)

Некоторые утверждают [ кто? ] , что сверхрациональность подразумевает своего рода магическое мышление , в котором каждый игрок предполагает, что его решение сотрудничать заставит другого игрока сотрудничать, даже если нет никакой коммуникации. Хофштадтер указывает, что концепция «выбора» неприменима, когда цель игрока состоит в том, чтобы что-то выяснить, и что решение не заставляет другого игрока сотрудничать, но та же логика приводит к тому же ответу независимо от коммуникации или причины и следствия. Этот спор о том, разумно ли для людей действовать сверхрациональным образом, а не о том, что означает сверхрациональность, и похож на аргументы о том, разумно ли для людей действовать «рациональным» образом, как описано в теории игр (где они могут выяснить, что другие игроки будут или сделали, спрашивая себя, что бы я сделал, если бы я был ими, и применяя обратную индукцию и итеративное исключение доминируемых стратегий ).

Вероятностные стратегии

Для простоты, вышеизложенный отчет о сверхрациональности игнорировал смешанные стратегии : возможность того, что лучшим выбором может быть подбрасывание монеты, или, в более общем смысле, выбор различных результатов с некоторой вероятностью . В дилемме заключенного сверхрационально сотрудничать с вероятностью 1, даже когда допускаются смешанные стратегии, потому что средний выигрыш, когда один игрок сотрудничает, а другой предает, такой же, как и когда оба сотрудничают, и поэтому предательство увеличивает риск предательства обоих, что снижает ожидаемую выплату. Но в некоторых случаях сверхрациональная стратегия является смешанной.

Например, если выплаты следующие:

СС – 100$/100$
CD – 0/1 000 000 долл. США
DC – $1,000,000/$0
ДД – 1 доллар/1 доллар

Так что предательство имеет огромное вознаграждение, сверхрациональная стратегия предает с вероятностью 499 900/999 899 или чуть больше 49,995%. По мере того, как вознаграждение увеличивается до бесконечности, вероятность приближается только к 1/2, а потери от принятия более простой стратегии 1/2 (которые уже минимальны) приближаются к 0. В менее экстремальном примере, если выигрыш для одного кооператора и одного предателя составил 400 и 0 долларов соответственно, сверхрациональный смешанный мир стратегии предает с вероятностью 100/299 или около 1/3.

В подобных ситуациях с большим количеством игроков использование рандомизирующего устройства может быть необходимым. Одним из примеров, обсуждаемых Хофштадтером, является дилемма Платонии : эксцентричный триллионер связывается с 20 людьми и говорит им, что если один и только один из них отправит ему или ей телеграмму (предполагается, что она ничего не стоит) до полудня следующего дня, этот человек получит миллиард долларов. Если они получат больше одной телеграммы или вообще ни одной, никто не получит никаких денег, и общение между игроками запрещено. В этой ситуации сверхрациональным решением (если известно, что все 20 сверхрациональны) будет отправить телеграмму с вероятностью p=1/20 — то есть каждый получатель по сути бросает 20-гранный кубик и отправляет телеграмму только в том случае, если выпадет «1». Это максимизирует вероятность того, что будет получена ровно одна телеграмма.

Обратите внимание, что это не решение в традиционном теоретико-игровом анализе. Двадцать теоретически рациональных игроков отправят телеграммы и, следовательно, ничего не получат. Это потому, что отправка телеграмм является доминирующей стратегией ; если отдельный игрок отправляет телеграммы, у него есть шанс получить деньги, но если он не отправит ни одной телеграммы, он не сможет ничего получить. (Если бы все телеграммы гарантированно приходили, они бы отправили только одну, и никто бы не ожидал получить какие-либо деньги).

Асимметричные игры

Научная работа по распространению концепции сверхрациональности на асимметричные игры все еще находится в начальной стадии.

Одна из таких работ, разработанная Гисленом Фурни [2], предлагает алгоритм принятия решений, который при выполнении группой агентов приведет к тому, что он назвал Совершенно Прозрачным Равновесием:

Обобщенное равновесие называется Совершенно Прозрачным Равновесием (PTE). [...] хотя оно не всегда существует, когда оно существует, оно всегда уникально, всегда является Парето-оптимальным и совпадает с равновесием Хофштадтера в симметричных играх.

Этот алгоритм неформально можно понимать как следующую последовательность шагов:

  1. Определите, учитывая, какие варианты выбора могут быть доступны игрокам, какой результат будет достигнут, если каждый из них применит правило принятия решений максимина . Назовите этот результат m .
  2. Исключите из рассмотрения любой результат , который не доминирует по Парето .
  3. Повторяйте шаги 1 и 2 до тех пор, пока не останется только один результат или не будет исключено большее количество результатов.

Результатом, который пройдет этот процесс исключения, если таковой будет, станет PTE.

Вопрос о том, следует ли сотрудничать в однократной дилемме заключенного в некоторых обстоятельствах, также возник в литературе по теории принятия решений, вызванной проблемой Ньюкомба . Теория причинно-следственных решений предполагает, что сверхрациональность иррациональна, в то время как теория доказательственных решений поддерживает линии рассуждений, сходные с сверхрациональностью, и рекомендует сотрудничество в дилемме заключенного против похожего оппонента. [3] [4]

Программное равновесие было предложено как механистическая модель сверхрациональности. [5] [6] [7]

Смотрите также

Ссылки

  1. ^ ab Хофштадтер, Дуглас (июнь 1983 г.). «Дилеммы для сверхрациональных мыслителей, ведущие к заманчивой лотерее». Scientific American . 248 (6).– перепечатано в: Хофштадтер, Дуглас (1985). Метамагические Темы . Базовые книги. стр. 737–755. ISBN 0-465-04566-9.
  2. ^ Fourny, Ghislain ( июнь 2020 г.). «Идеальное предсказание в нормальной форме: сверхрациональное мышление, распространенное на несимметричные игры». Журнал математической психологии . 96. arXiv : 1712.05723 . doi : 10.1016/j.jmp.2020.102332.
  3. ^ Льюис, Дэвид (1979). «Дилемма заключенных — проблема Ньюкомба». Философия и общественные дела . 8 (3): 235–240. doi :10.1093/0195036468.003.0011. JSTOR  2265034.
  4. ^ Брамс, Стивен Дж. (1975). «Проблема Ньюкомба и дилемма заключенных». Журнал разрешения конфликтов . 19 (4): 596–612.
  5. ^ Howard, JV (май 1988). «Сотрудничество в дилемме заключенного». Теория и решение . 24 (3): 203–213. doi :10.1007/BF00148954.
  6. ^ Бараш, М.; Кристиано, П .; Фалленштейн, Б.; Херрешофф, М.; ЛаВиктуар, П.; Юдковски, Э. (2014). «Надежное сотрудничество в дилемме заключенного: равновесие программы с помощью логики доказуемости». arXiv : 1401.5577 [cs.GT].
  7. ^ Эстерхельд, Каспар; Трейтляйн, Йоханнес; Гроссе, Роджер; Конитцер, Винсент; Фёрстер, Якоб (2023). «Кооперативное равновесие на основе сходства». Труды Neural Information Processing Systems (NeurIPS) .
Взято с "https://en.wikipedia.org/w/index.php?title=Сверхрациональность&oldid=1255938956"