Оценка полезности

Оценка полезности [1] , также называемая измерением полезности [2], представляет собой процесс, с помощью которого можно оценить функцию полезности отдельных лиц или групп. Существует множество различных методов оценки полезности [3] .

Оценка функций полезности с одним атрибутом

Функция полезности с одним атрибутом отображает сумму денег, которую человек имеет (или получает), в число, представляющее субъективное удовлетворение, которое он получает от этого. Мотивация определения функции полезности исходит из парадокса Санкт-Петербурга : наблюдения, что люди не готовы платить много за лотерею, даже если ее ожидаемый денежный выигрыш бесконечен. Классическое решение этого парадокса, предложенное Даниэлем Бернулли и Габриэлем Крамером , заключается в том, что у большинства людей функция полезности строго вогнута , и они стремятся максимизировать свою ожидаемую полезность , а не свой ожидаемый выигрыш.

Утилита Power-log

Сам Бернулли предполагал, что полезность логарифмическая , то есть u( x )=log( x ), где x — сумма денег; этого было достаточно для решения парадокса Санкт-Петербурга. Густав Фехнер [4] также предоставил психофизическое обоснование логарифмической функции (известной как закон Вебера-Фехнера ). Но Стэнли Смит Стивенс [5] показал, что связь между физическим стимулом и психологическим восприятием можно лучше объяснить с помощью степенной функции , то есть u( x )=x p , с показателем p от 0,3 до 2.

Многие исследователи пытались определить, лучше ли полезность представлена ​​логарифмическими функциями или степенными функциями. Используя различные методы, они показали, что степенные функции лучше соответствуют данным о полезности. [6] [7] [8] [9] [10] В результате степенные функции были включены в психологические теории принятия решений, такие как кумулятивная теория перспектив , модель мультипликативных весов, затронутых рангом (RAM), и модель передачи внимания (TAX). Однако некоторые экономические приложения по-прежнему используют логарифмические функции. [11]

Ваккер [12] отметил, что степенные функции могут иметь отрицательный показатель, но в этом случае их знак должен измениться так, чтобы они оставались возрастающими. Один из способов определить это обобщенное семейство функций:

ты г ( х ) = х г / г {\displaystyle u_{r}(x)=x^{r}/r}

которая возрастает для любого показателя степени r ≠ 0. Более того, предел этой функции при r → 0 — это в точности логарифмическая функция: . Поэтому семейство функций u r ( x ) для всех действительных p иногда называют полезностью степенного логарифма . [13] ты 0 ( х ) = вн ( х ) {\displaystyle u_{0}(x)=\ln(x)}

Процедуры оценки полезности

Функции полезности обычно оцениваются в экспериментах, проверяющих предпочтения субъектов относительно лотерей . Использовались два общих типа процедур: [1]

  1. В процедурах эквивалентности субъектов просят скорректировать сумму денег в одной лотерее так, чтобы она стала эквивалентной — в их глазах — другой лотерее. Например, субъектов могут попросить рассмотреть две лотереи: (a) получение $x наверняка; (b) получение $20 с вероятностью 60% и получение $0 с вероятностью 40%. Их спрашивают: «При каком значении x вам было бы безразлично, какая из этих двух лотерей выберет другую?». Каждый такой вопрос дает уравнение вида , которое можно использовать для оценки формы функции полезности. Например, если субъект отвечает x=$10, мы получаем уравнение . Предполагая степенную полезность, это дает , что дает . я п 1 , я ты ( х 1 , я ) = я п 2 , я ты ( х 2 , я ) {\displaystyle \sum _{i}p_{1,i}u(x_{1,i})=\sum _{i}p_{2,i}u(x_{2,i})} ты ( 10 ) = 0,6 ты ( 20 ) + 0,4 ты ( 0 ) {\displaystyle u(10)=0,6u(20)+0,4u(0)} 10 г = 0,6 20 г {\displaystyle {10}^{r}=0,6\cdot {20}^{r}} г = бревно ( 0,6 ) / бревно ( 0,5 ) 0,74 {\displaystyle r=\log(0,6)/\log(0,5)\приблизительно 0,74}
  2. В процедурах выбора испытуемым показывают две или более лотереи и спрашивают, какую лотерею они предпочитают. Например, испытуемым может быть предложено выбрать между двумя вариантами: "(a) получить 10 долларов наверняка; (b) получить 20 долларов с вероятностью 60% и получить 0 долларов с вероятностью 40%". Каждый такой вопрос дает неравенство вида , где p 1,i и x 1,i — вероятности и суммы в предпочитаемой лотерее, а p 2,i и x 2,i — вероятности и суммы в другой лотерее. Преимущество вопросов с выбором в том, что на них легче отвечать; последовательность таких вопросов может привести к точке эквивалентности. я п 1 , я ты ( х 1 , я ) > я п 2 , я ты ( х 2 , я ) {\displaystyle \sum _{i}p_{1,i}u(x_{1,i})>\sum _{i}p_{2,i}u(x_{2,i})}

С этими процедурами связано несколько проблем. [3]

Во-первых, они предполагают, что люди взвешивают события по их истинным (объективным) вероятностям, p 1,i и p 2,i . Фактически, многие свидетельства показывают, что люди взвешивают события по субъективным вероятностям . [14] В частности, люди склонны переоценивать малые вероятности и недооценивать средние и большие вероятности (см. Теорию перспектив ). Нелинейность субъективной вероятности может быть смешана с вогнутостью функции полезности. Например, человека, которому безразличны лотереи [100%: $10] и [60%: $20, 40%: 0], можно смоделировать с помощью линейной функции полезности, если предположить, что он недооценивает вероятность от 60% до примерно 50%.

Один из способов избежать этого смешения — использовать равные вероятности во всех запросах; это было сделано, например, Кумбсом и Коморитой. [15] Этот трюк работает для неконфигурационных весовых теорий , [16] которые предполагают, что субъективная вероятность является функцией объективной вероятности (то есть каждая объективная вероятность переводится в уникальную субъективную вероятность). В этом случае, когда все вероятности в запросах равны, и они сокращаются в уравнениях. Уравнения включают только полезности, и мы можем снова использовать их для вывода формы функции полезности.

Однако теории конфигурационного веса [17] , мотивированные парадоксом Алле , показывают, что субъективная вероятность может зависеть как от объективной вероятности, так и от результата. Кирби [3] представил способ разработки запросов таким образом, что для полезностей степенного логарифма и отрицательно-экспоненциальных полезностей предсказания не зависят от отмены субъективных вероятностей.

Вторая проблема заключается в том, что некоторые эксперименты используют как выигрыши, так и потери. [15] [18] Однако более поздние исследования показывают, что вогнутость функции полезности может быть разной для выигрышей и потерь (см. теорию перспектив и неприятие потерь ). Объединение областей выигрышей и потерь может привести к неправильной функции полезности.

Возможным решением является измерение каждой из этих двух областей по отдельности. [19] Юджин Галантер разработал другое решение, как для первой, так и для второй проблемы. [6] [20] Он проводил эксперименты, в которых не использовались вероятности; вместо этого он задавал такие вопросы, как «сколько денег вам понадобится, чтобы чувствовать себя вдвое счастливее, чем $10»? Если ответ, например, $18, то мы получаем уравнение, такое как , которое дает информацию о функции полезности, без и в зависимости от вероятностей и отношения к риску. Его эксперименты последовательно показывали, что степенные функции лучше соответствуют данным, чем логарифмические функции. ты ( 18 ) = 2 ты ( 10 ) {\displaystyle u(18)=2u(10)}

Третья проблема заключается в том, что большинство экспериментов сравнивают относительное соответствие различных моделей полезности данным. Например, они могут показать, что степенные функции соответствуют данным лучше, чем логарифмические функции, но не могут отвергнуть гипотезу о том, что степенные функции соответствуют данным. Кирби [3] представил новый дизайн эксперимента, который позволил ему получить точечные прогнозы для каждой модели отдельно. Его эксперименты показывают, что как степенные логарифмические функции, так и функции с отрицательным показателем не соответствуют данным. Он оставляет поиск более подходящей функции открытой проблемой.

Оценка многоатрибутивных функций полезности

Функция многоатрибутной полезности (MAU) сопоставляет набор с двумя или более атрибутами (например, деньги и свободное время) с числом, представляющим субъективное удовлетворение от этого набора.

Оценка MAU актуальна даже в условиях определенности. Например, в то время как большинство людей предпочитают $12 000 наверняка, чем $10 000 наверняка, разные люди могут иметь разные предпочтения между пакетами (зарплата $10 000, 8 рабочих часов в день) и (зарплата $12 000, 9 рабочих часов в день), даже когда оба пакета являются определенными. Процедура оценки MAU в условиях определенности представлена ​​в Ordinal utility#assessment .

Оценка MAU в условиях неопределенности является более сложной задачей; подробности см. в разделе «многоатрибутная полезность#оценка» .

В здоровье

Оценка функций MAU особенно актуальна в экономике здравоохранения . Часто требуется выбирать среди различных возможных методов лечения, где каждое лечение имеет различные атрибуты относительно продолжительности жизни, качества жизни, безопасности и стоимости. После обширных опросов были разработаны функции MAU для состояний, связанных со здоровьем; см. Год жизни с поправкой на качество и EQ-5D#assessment . Наиболее распространенным методом оценки полезности, связанной со здоровьем, является компромисс времени . Чтобы обеспечить принятие решений на национальном уровне, функция MAU для здоровья строится на национальном уровне как «средняя» функция полезности всех пациентов в стране.

Функции полезности обычно нормализуются таким образом, что полезность 1 означает «полное здоровье», а полезность 0 означает «смерть». Отрицательные функции полезности возможны для ситуаций, которые считаются «хуже смерти». В качестве примера, вот описание протокола для построения набора значений для EQ-5D-Y (5-мерная шкала EuroQol для молодых людей). [21] Построение выполняется в два этапа: онлайн- опрос Discrete Choice Experiment (DCE) и очное композитное интервью по временному компромиссу (cTTO):

  1. Шаг DCE измеряет относительную важность пяти измерений, но дает результаты в скрытой шкале, а не нормализованные значения полезности. Рекомендуемый экспериментальный дизайн содержит 10 блоков с 15 парами состояний здоровья в каждом блоке (всего 150 пар). Каждому испытуемому дается один блок (15 пар). Для каждой пары испытуемый должен сказать, какое из этих двух состояний он предпочитает (например, «вы предпочитаете 12333 или 31122?»).
  2. Шаг cTTO используется для вычисления нормализованного значения для состояния привязки, которое является состоянием 33333: состояние с наихудшим уровнем (3) во всех 5 измерениях. Каждый испытуемый должен ответить на 10 запросов TTO. Каждый запрос TTO показывает пару здоровье-состояние+продолжительность, и испытуемый должен сказать, какой из них он предпочитает. Существует два вида запросов: [21] : 660, Рис.2 
    • Один вид предполагает, что состояние лучше смерти. Вопросы выглядят так: «какую жизнь вы предпочитаете: 2 года в полном здравии или 10 лет в состоянии 33333»?.
    • Другой вид предполагает, что состояние хуже смерти. Вопросы выглядят так: «какую жизнь вы предпочитаете: 2 года в полном здравии или 5 лет в полном здравии плюс 10 лет в состоянии 33333»?.

На обоих этапах испытуемыми являются взрослые, и их просят ответить на вопросы с точки зрения 10-летнего ребенка. Причины, по которым задавали вопросы взрослым, а не детям, были следующими: (1) взрослые являются налогоплательщиками — они должны решать, как использовать бюджет здравоохранения; (2) есть вопросы о смерти, которые могут быть неуместны для детей; (3) дети могут неправильно понять вопросы.

Вышеуказанный протокол был впервые реализован в Словении следующим образом: [22]

  • Опрос DCE проводился на репрезентативной выборке из 1276 взрослых словенцев через онлайн-панель коммерческой исследовательской компании (Valicon Ljubljana) с использованием LimeSurvey . Экспериментальный дизайн представлял собой D-эффективный дизайн , разделенный на 10 блоков по 15 пар в блоке, так что в общей сложности сравнивалось 150 пар. 150 пар были выбраны случайным образом из пар, которые максимизируют информационную матрицу Фишера . Дизайн позволял оценить модель полиномиальной логистической регрессии с 50 параметрами: 10 параметров для основных эффектов и 40 параметров для двустороннего взаимодействия.
    • В качестве проверки качества были удалены 202 ответа (ответы, в которых был сделан неправильный выбор в двух из трех фиксированных пар, в которых одно состояние здоровья доминирует над другим, и респонденты, которые ответили слишком быстро).
  • Интервью cTTO проводилось лицом к лицу с 210 взрослыми, которые не являются репрезентативной выборкой (все живут в Приморске , и большинство из них были молодыми), но выборки были взвешены для повышения репрезентативности. Элементы задания cTTO включают оценку состояний здоровья «хуже, чем мертвые» и состояний здоровья «лучше, чем мертвые» с использованием сценария инвалидной коляски . Интервьюируемых просили оценить 10 состояний cTTO, заполнить описательный профиль EQ-5D-Y и ВАШ ( визуальная аналоговая шкала ).
    • В ходе проверки качества было удалено 8 ответов (ответы без объяснения задачи «хуже, чем мертво», оценки cTTO были непоследовательными: 33333 не было самым низким состоянием, или на задачу было потрачено недостаточно времени).
    • Значение якорного состояния 33333 оказалось равным -0,691; другие значения были 33233:-0,48, 31133:-0,049, 32223:0,139, 22232:0,237, 11121:0,911, 21111:0,962.
  • На основе этих двух фаз была оценена линейная аддитивная модель полезности . Была использована смешанная логит-модель , и коэффициенты худшего результата 3 в 5 измерениях были (от наиболее важного к наименее важному): боль/дискомфорт: -0,463, тревога/депрессия: -0,380, обычные действия: -0,322, подвижность: -0,305, уход за собой: -0,221. Обратите внимание, что 1-0,463-0,380-0,322-0,305-0,221 = -0,691, что действительно является якорным значением состояния 33333.

Смотрите также

Ссылки

  1. ^ ab Farquhar, Peter H. (ноябрь 1984 г.). «Современное состояние дел — методы оценки полезности». Management Science . 30 (11): 1283– 1300. doi :10.1287/mnsc.30.11.1283.
  2. ^ Алчиан, Армен А. (1953). «Значение измерения полезности». The American Economic Review . 43 (1): 26–50 . JSTOR  1810289.
  3. ^ abcd Кирби, Крис Н. (2011). «Эмпирическая оценка формы функций полезности». Журнал экспериментальной психологии: обучение, память и познание . 37 (2): 461– 476. doi :10.1037/a0021968. PMID  21355669.
  4. ^ Фехнер, Густав Теодор (1860). Элементы психофизики (на немецком языке). Брейткопф У. Хертель.[ нужна страница ]
  5. ^ Стивенс, СС (1957). «О психофизическом законе». Psychological Review . 64 (3): 153– 181. doi :10.1037/h0046162. PMID  13441853. ProQuest  614283678.
  6. ^ ab Галантер, Юджин (1962). «Прямое измерение полезности и субъективной вероятности». Американский журнал психологии . 75 (2): 208– 220. doi :10.2307/1419604. JSTOR  1419604. PMID  13896303.
  7. ^ Галантер, Юджин; Холман, Гарвин Л. (1967). «Некоторые инварианты функции изочувствительности и их последствия для функции полезности денег». Журнал экспериментальной психологии . 73 (3): 333– 339. doi :10.1037/h0024275. PMID  6032534. ProQuest  614257044.
  8. ^ Хамблин, Роберт Л.; Клермонт, Дональд Х.; Чедвик, Брюс А. (март 1975 г.). «Полезность и азартные решения: эксперименты и уравнения». Исследования социальных наук . 4 (1): 1– 15. doi :10.1016/0049-089X(75)90016-2.
  9. ^ Корнброт, Диана Э.; Доннелли, Майкл; Галантер, Юджин (апрель 1981 г.). «Оценки параметров функции полезности из экспериментов по обнаружению сигналов». Журнал экспериментальной психологии: восприятие и производительность человека . 7 (2): 441– 458. doi :10.1037/0096-1523.7.2.441. ProQuest  614275914.
  10. ^ Паркер, Скотт; Стайн, Дэвид; Дарте, Эд; Шнайдер, Брюс; Поппер, Ричард; Нидель, Стивен (1981). «Функция полезности для денег, определенная с помощью совместного измерения». Американский журнал психологии . 94 (4): 563– 573. doi :10.2307/1422419. JSTOR  1422419.
  11. ^ О'Донохью, Тед; Рабин, Мэтью (ноябрь 2006 г.). «Оптимальные налоги на грех». Журнал общественной экономики . 90 ( 10–11 ): 1825–1849 . doi :10.1016/j.jpubeco.2006.03.001.
  12. ^ Wakker, Peter P. (декабрь 2008 г.). «Объяснение характеристик семейства утилит мощности (CRRA)». Health Economics . 17 (12): 1329– 1344. doi :10.1002/hec.1331. PMID  18213676.
  13. ^ Kale, Jivendra K. (2009). «Максимизация роста и защита от падения с использованием функций полезности степенного логарифма для оптимизации портфелей с производными инструментами». Международный журнал компьютерных приложений в технологиях . 34 (4): 309. doi :10.1504/IJCAT.2009.024085.
  14. ^ Престон, Малкольм Г.; Баратта, Филип (1948). «Экспериментальное исследование аукционной стоимости неопределенного результата». Американский журнал психологии . 61 (2): 183– 193. doi :10.2307/1416964. ISSN  0002-9556.
  15. ^ ab Coombs, CH; Komorita, SS (1958). «Измерение полезности денег посредством решений». Американский журнал психологии . 71 (2): 383– 389. doi :10.2307/1420083. ISSN  0002-9556.
  16. ^ Бирнбаум, Майкл Х. (1992-08-01). «Проблемы измерения полезности». Организационное поведение и процессы принятия решений человеком . Измерение полезности. 52 (3): 319– 330. doi :10.1016/0749-5978(92)90024-2. ISSN  0749-5978.
  17. ^ Бирнбаум, Майкл Х. (2004-04-01). «Причины парадоксов общих следствий Алле: экспериментальное вскрытие». Журнал математической психологии . 48 (2): 87– 106. doi :10.1016/j.jmp.2004.01.001. ISSN  0022-2496.
  18. ^ Мостеллер, Фредерик; Ноги, Филипп (1951-10-01). «Экспериментальное измерение полезности». Журнал политической экономии . 59 (5): 371– 404. doi :10.1086/257106. ISSN  0022-3808.
  19. ^ Херши, Джон К.; Кунройтер, Говард К.; Шумейкер, Пол Дж. Х. (август 1982 г.). «Источники смещения в процедурах оценки функций полезности». Management Science . 28 (8): 936–954 . doi :10.1287/mnsc.28.8.936. ISSN  0025-1909.
  20. ^ Галантер, Юджин (1990). «Функции полезности для неденежных событий». Американский журнал психологии . 103 (4): 449– 470. doi :10.2307/1423318. ISSN  0002-9556.
  21. ^ ab Рамос-Гони, Хуан М.; Оппе, Марк; Столк, Элли; Шах, Кунал; Креймейер, Симона; Риверо-Ариас, Оливер; Девлин, Нэнси (01.07.2020). «Международный протокол оценки для EQ-5D-Y-3L». PharmacoEconomics . 38 (7): 653–663 . doi : 10.1007/s40273-020-00909-3 . hdl : 11343/252049 . ISSN  1179-2027.
  22. ^ Превольник Рупель, Валентина; Огоревц, Марко; Группа IMPACT HTA HRQoL (апрель 2021 г.). «Набор значений EQ-5D-Y для Словении». Фармакоэкономика . 39 (4): 463–471 . doi : 10.1007/s40273-020-00994-4. ПМЦ 8009800 . ПМИД  33565048. 
  23. ^ Бозе, Утпал; Дэйви, Энн М.; Олсон, Дэвид Л. (1997-12-01). «Многоатрибутные методы полезности в групповом принятии решений: прошлые применения и потенциал для включения в GDSS». Omega . 25 (6): 691– 706. doi :10.1016/S0305-0483(97)00040-6. ISSN  0305-0483.
Взято с "https://en.wikipedia.org/w/index.php?title=Оценка_полезности&oldid=1258462310"