Многоатрибутная утилита

В теории принятия решений многоатрибутивная функция полезности используется для представления предпочтений агента относительно наборов товаров либо в условиях определенности относительно результатов любого потенциального выбора, либо в условиях неопределенности.

Предварительные

Человек должен сделать выбор между двумя или более вариантами. Решение принимается на основе атрибутов вариантов.

Самый простой случай — когда есть только один атрибут, например: деньги. Обычно предполагается, что все люди предпочитают больше денег меньшему; следовательно, проблема в этом случае тривиальна: выберите вариант, который дает вам больше денег.

В реальности есть два или более атрибутов. Например, человек должен выбрать между двумя вариантами трудоустройства: вариант A дает ему $12 тыс. в месяц и 20 дней отпуска, а вариант B дает ему $15 тыс. в месяц и только 10 дней отпуска. Человек должен выбрать между (12 тыс., 20) и (15 тыс., 10). У разных людей могут быть разные предпочтения. При определенных условиях предпочтения человека можно представить числовой функцией. Статья ordinal utility описывает некоторые свойства таких функций и некоторые способы, с помощью которых их можно вычислить.

Другим соображением, которое может усложнить задачу принятия решения, является неопределенность . Хотя существует по крайней мере четыре источника неопределенности — результаты атрибутов и неопределенность лица, принимающего решения, относительно: a) конкретных форм функций полезности отдельных атрибутов, b) значений агрегирующих констант и c) являются ли функции полезности атрибутов аддитивными, эти термины рассматриваются в настоящее время — неопределенность в дальнейшем означает только случайность на уровнях атрибутов. Это усложнение неопределенности существует даже при наличии одного атрибута, например: денег. Например, вариант A может быть лотереей с 50%-ным шансом выиграть 2 доллара, в то время как вариант B — гарантированный выигрыш 1 доллара. Человек должен выбрать между лотереей <2:0,5> и лотереей <1:1>. Опять же, разные люди могут иметь разные предпочтения. Опять же, при определенных условиях предпочтения могут быть представлены числовой функцией. Такие функции называются кардинальными функциями полезности. В статье Теорема полезности фон Неймана–Моргенштерна описываются некоторые способы, с помощью которых их можно вычислить.

Наиболее общая ситуация заключается в том, что есть как множественные атрибуты , так и неопределенность. Например, вариант A может быть лотереей с 50%-ным шансом выиграть два яблока и два банана, в то время как вариант B — гарантированный выигрыш двух бананов. Решение принимается между <(2,2):(0.5,0.5)> и <(2,0):(1,0)>. Предпочтения здесь могут быть представлены функциями кардинальной полезности , которые принимают несколько переменных (атрибутов). [1] : 26–27  Такие функции находятся в центре внимания текущей статьи.

Цель состоит в том, чтобы вычислить функцию полезности , которая представляет предпочтения человека в отношении лотерейных пакетов. То есть, лотерея A предпочтительнее лотереи B тогда и только тогда, когда ожидание функции выше при A, чем при B: ты ( х 1 , . . . , х н ) {\displaystyle u(x_{1},...,x_{n})} ты {\displaystyle u}

Э А [ ты ( х 1 , . . . , х н ) ] > Э Б [ ты ( х 1 , . . . , х н ) ] {\displaystyle E_{A}[u(x_{1},...,x_{n})]>E_{B}[u(x_{1},...,x_{n})]}

Оценка многоатрибутивной функции кардинальной полезности

Если число возможных наборов конечно, то u можно построить напрямую, как объяснили фон Нейман и Моргенштерн (VNM): упорядочить наборы от наименее предпочтительного к наиболее предпочтительному, присвоить полезность 0 первому и полезность 1 второму, и присвоить каждому набору между ними полезность, равную вероятности эквивалентной лотереи. [1] : 222–223 

Если число наборов бесконечно, один из вариантов — начать с игнорирования случайности и оценить порядковую функцию полезности , которая представляет полезность человека для определенных наборов. То есть, набор x предпочтительнее набора y тогда и только тогда, когда функция выше для x, чем для y: в ( х 1 , . . . , х н ) {\displaystyle v(x_{1},...,x_{n})} в {\displaystyle v}

в ( х 1 , . . . , х н ) > в ( у 1 , . . . , у н ) {\displaystyle v(x_{1},...,x_{n})>v(y_{1},...,y_{n})}

Эта функция, по сути, преобразует многоатрибутную задачу в одноатрибутную: атрибутом является . Затем VNM можно использовать для построения функции . [1] : 219–220  в {\displaystyle v} ты {\displaystyle u}

Обратите внимание, что u должно быть положительным монотонным преобразованием v . Это означает, что существует монотонно возрастающая функция , такая что: г : Р Р {\displaystyle r:\mathbb {R} \to \mathbb {R} }

ты ( х 1 , . . . , х н ) = г ( в ( х 1 , . . . , х н ) ) {\displaystyle u(x_{1},...,x_{n})=r(v(x_{1},...,x_{n}))}

Проблема с этим подходом заключается в том, что оценить функцию r непросто . При оценке функции полезности с одним атрибутом с использованием VNM мы задаем такие вопросы, как: «Какая вероятность выиграть 2 $ эквивалентна 1 $?». Поэтому для оценки функции r мы должны задать такой вопрос: «Какая вероятность выиграть 2 единицы ценности эквивалентна 1 ценности?». На последний вопрос ответить гораздо сложнее, чем на первый, поскольку он включает «ценность», которая является абстрактной величиной.

Возможным решением является вычисление n одномерных кардинальных функций полезности — по одной для каждого атрибута. Например, предположим, что есть два атрибута: яблоки ( ) и бананы ( ), оба находятся в диапазоне от 0 до 99. Используя VNM, мы можем вычислить следующие одномерные функции полезности: х 1 {\displaystyle x_{1}} х 2 {\displaystyle x_{2}}

  • ты ( х 1 , 0 ) {\displaystyle u(x_{1},0)} - основная полезность яблок, когда нет бананов (южная граница домена);
  • ты ( 99 , х 2 ) {\displaystyle u(99,x_{2})} - основная полезность бананов, когда урожай яблок достигает своего максимума (восточная граница домена).

Используя линейные преобразования, масштабируйте функции так, чтобы они имели одинаковое значение на (99,0).

Затем для каждого набора найдите эквивалентный набор (набор с тем же v ), который имеет либо форму , либо форму , и установите его полезность на то же число. [1] : 221–222  ( х 1 , х 2 ) {\displaystyle (x_{1}',x_{2}')} ( х 1 , 0 ) {\displaystyle (x_{1},0)} ( 99 , х 2 ) {\displaystyle (99,x_{2})}

Часто определенные свойства независимости между атрибутами могут быть использованы для упрощения построения функции полезности. Некоторые такие свойства независимости описаны ниже.

Аддитивная независимость

Самое сильное свойство независимости называется аддитивной независимостью . Два атрибута, 1 и 2, называются аддитивно независимыми , если предпочтение между двумя лотереями (определяемое как совместное распределение вероятностей по двум атрибутам) зависит только от их маргинальных распределений вероятностей (маргинальный PD по атрибуту 1 и маргинальный PD по атрибуту 2).

Это означает, например, что следующие две лотереи эквивалентны:

  • Л {\displaystyle L} : Равновероятная лотерея между и ; ( х 1 , х 2 ) {\displaystyle (x_{1},x_{2})} ( у 1 , у 2 ) {\displaystyle (y_{1},y_{2})}
  • М {\displaystyle М} : Лотерея с равными шансами между и . ( х 1 , у 2 ) {\displaystyle (x_{1},y_{2})} ( у 1 , х 2 ) {\displaystyle (y_{1},x_{2})}

В обеих этих лотереях предельный PD по атрибуту 1 составляет 50% для и 50% для . Аналогично, предельный PD по атрибуту 2 составляет 50% для и 50% для . Следовательно, если агент имеет аддитивно-независимые полезности, он должен быть безразличен между этими двумя лотереями. [1] : 229–232  х 1 {\displaystyle x_{1}} у 1 {\displaystyle y_{1}} х 2 {\displaystyle x_{2}} у 2 {\displaystyle y_{2}}

Фундаментальный результат теории полезности заключается в том, что два атрибута являются аддитивно независимыми тогда и только тогда, когда их двухатрибутивная функция полезности аддитивна и имеет вид:

ты ( х 1 , х 2 ) = ты 1 ( х 1 ) + ты 2 ( х 2 ) {\displaystyle u(x_{1},x_{2})=u_{1}(x_{1})+u_{2}(x_{2})}

ДОКАЗАТЕЛЬСТВО:

{\displaystyle \longrightarrow}

Если атрибуты не зависят от добавки, то лотереи и , определенные выше, эквивалентны. Это означает, что их ожидаемая полезность одинакова, т.е.: . Умножение на 2 дает: Л {\displaystyle L} М {\displaystyle М} Э Л [ ты ] = Э М [ ты ] {\displaystyle E_{L}[u]=E_{M}[u]}

ты ( х 1 , х 2 ) + ты ( у 1 , у 2 ) = ты ( х 1 , у 2 ) + ты ( у 1 , х 2 ) {\displaystyle u(x_{1},x_{2})+u(y_{1},y_{2})=u(x_{1},y_{2})+u(y_{1},x_{2})}

Это справедливо для любого выбора и . Предположим теперь, что и фиксированы. Произвольно заданы . Запишем: и . Уравнение выше становится: х я {\displaystyle x_{i}} у я {\displaystyle y_{i}} у 1 {\displaystyle y_{1}} у 2 {\displaystyle y_{2}} ты ( у 1 , у 2 ) = 0 {\displaystyle u(y_{1},y_{2})=0} ты 1 ( х 1 ) = ты ( х 1 , у 2 ) {\displaystyle u_{1}(x_{1})=u(x_{1},y_{2})} ты 2 ( х 2 ) = ты ( у 1 , х 2 ) {\displaystyle u_{2}(x_{2})=u(y_{1},x_{2})}

ты ( х 1 , х 2 ) = ты 1 ( х 1 ) + ты 2 ( х 2 ) {\displaystyle u(x_{1},x_{2})=u_{1}(x_{1})+u_{2}(x_{2})}

{\displaystyle \longleftarrow}

Если функция u аддитивна, то по правилам математического ожидания для каждой лотереи : Л {\displaystyle L}

Э Л [ ты ( х 1 , х 2 ) ] = Э Л [ ты 1 ( х 1 ) ] + Э Л [ ты 2 ( х 2 ) ] {\displaystyle E_{L}[u(x_{1},x_{2})]=E_{L}[u_{1}(x_{1})]+E_{L}[u_{2}(x_ {2})]}

Это выражение зависит только от предельных распределений вероятностей двух атрибутов. Л {\displaystyle L}

Этот результат обобщается на любое количество атрибутов: если предпочтения по лотереям по атрибутам 1,..., n зависят только от их предельных распределений вероятностей, то функция полезности n -атрибута является аддитивной: [1] : 295 

ты ( х 1 , , х н ) = я = 1 н к я ты я ( х я ) {\displaystyle u(x_{1},\dots ,x_{n})=\sum _{i=1}^{n}{k_{i}u_{i}(x_{i})}}

где и нормированы к диапазону , а являются константами нормировки. ты {\displaystyle u} ты я {\displaystyle u_{i}} [ 0 , 1 ] {\displaystyle [0,1]} к я {\displaystyle k_{i}}

Большая часть работы в области теории аддитивной полезности была проделана Питером К. Фишберном .

Независимость от коммунальных услуг

Немного более слабым свойством независимости является независимость от полезности . Атрибут 1 не зависит от полезности атрибута 2, если условные предпочтения в лотереях по атрибуту 1 при заданном постоянном значении атрибута 2 не зависят от этого постоянного значения.

Это означает, например, что предпочтение между лотереей и лотереей одинаково, независимо от значения . < ( х 1 , х 2 ) : ( у 1 , х 2 ) > {\displaystyle <(x_{1},x_{2}):(y_{1},x_{2})>} < ( х 1 , х 2 ) : ( у 1 , х 2 ) > {\displaystyle <(x'_{1},x_{2}):(y'_{1},x_{2})>} х 2 {\displaystyle x_{2}}

Обратите внимание, что независимость полезности (в отличие от аддитивной независимости) не является симметричной: возможно, что атрибут 1 независим от полезности атрибута 2, а не наоборот. [1] : 224–229 

Если атрибут 1 не зависит от полезности атрибута 2, то функция полезности для каждого значения атрибута 2 является линейным преобразованием функции полезности для каждого другого значения атрибута 2. Следовательно, ее можно записать как:

ты ( х 1 , х 2 ) = с 1 ( х 2 ) + с 2 ( х 2 ) ты ( х 1 , х 2 0 ) {\displaystyle u(x_{1},x_{2})=c_{1}(x_{2})+c_{2}(x_{2})\cdot u(x_{1},x_{2}^{0})}

когда — постоянное значение для атрибута 2. Аналогично, если атрибут 2 не зависит от полезности атрибута 1: х 2 0 {\displaystyle x_{2}^{0}}

ты ( х 1 , х 2 ) = г 1 ( х 1 ) + г 2 ( х 1 ) ты ( х 1 0 , х 2 ) {\displaystyle u(x_{1},x_{2})=d_{1}(x_{1})+d_{2}(x_{1})\cdot u(x_{1}^{0},x_{2})}

Если атрибуты взаимно независимы по полезности , то функция полезности u имеет следующую полилинейную форму : [1] : 233–235 

ты ( х 1 , х 2 ) = ты 1 ( х 1 ) + ты 2 ( х 2 ) + к ты 1 ( х 1 ) ты 2 ( х 2 ) {\displaystyle u(x_{1},x_{2})=u_{1}(x_{1})+u_{2}(x_{2})+k\cdot u_{1}(x_{1})\cdot u_{2}(x_{2})}

Где — константа, которая может быть положительной, отрицательной или равной 0. к {\displaystyle к}

  • Когда функция u аддитивна, а атрибуты не зависят от аддитивности. к = 0 {\displaystyle к=0}
  • При функция полезности является мультипликативной, поскольку ее можно записать как: к 0 {\displaystyle к\neq 0}
[ к ты ( х 1 , х 2 ) + 1 ] = [ к ты 1 ( х 1 ) + 1 ] [ к ты 2 ( х 2 ) + 1 ] {\displaystyle [ku(x_{1},x_{2})+1]=[ku_{1}(x_{1})+1]\cdot [ku_{2}(x_{2})+1]}
где каждый член представляет собой линейное преобразование функции полезности. к + 1 {\displaystyle k\cdot +1}

Эти результаты могут быть обобщены на любое количество атрибутов. При заданных атрибутах 1,..., n , если любое подмножество атрибутов не зависит от полезности его дополнения, то функция полезности n -атрибута является многолинейной и имеет одну из следующих форм:

  • Добавка, или -
  • Мультипликативный : [1] : 289–290 
1 + к ты ( х 1 , , х н ) = я = 1 н 1 + к к я ты я ( х я ) {\displaystyle 1+ku(x_{1},\dots ,x_{n})=\prod _{i=1}^{n}{1+kk_{i}u_{i}(x_{i})}}

где:

  • и нормализованы к диапазону ; ты {\displaystyle u} ты я {\displaystyle u_{i}} [ 0 , 1 ] {\displaystyle [0,1]}
  • Константы в ; к я {\displaystyle k_{i}} [ 0 , 1 ] {\displaystyle [0,1]}
  • к {\displaystyle к} — константа, которая находится либо в , либо в (обратите внимание, что пределом является аддитивная форма). ( 1 , 0 ) {\displaystyle (-1,0)} ( 0 , ) {\displaystyle (0,\infty )} k 0 {\displaystyle k\to 0}

Сравнение концепций независимости

Полезно сравнить три различных концепции, связанных с независимостью атрибутов: независимость от аддитивности (AI), независимость от полезности (UI) и независимость от предпочтений (PI). [1] : 344 

AI и UI оба касаются предпочтений в лотереях и объяснены выше. PI касается предпочтений в отношении определенных результатов и объясняется в статье о порядковой полезности .

Порядок их следования следующий:

ИИ ⇒ ИП ⇒ ПИ

AI является симметричным отношением (если атрибут 1 является AI атрибута 2, то атрибут 2 является AI атрибута 1), тогда как UI и PI таковыми не являются.

AI подразумевает взаимный UI. Обратное, в общем, неверно; это верно только если в многолинейной формуле для атрибутов UI. Но если, в дополнение к взаимному UI, существуют , для которых две лотереи и , определенные выше, эквивалентны - то должно быть 0, и это означает, что отношение предпочтения должно быть AI. [1] : 238–239  k = 0 {\displaystyle k=0} x 1 , x 2 , y 1 , y 2 {\displaystyle x_{1},x_{2},y_{1},y_{2}} L {\displaystyle L} M {\displaystyle M} k {\displaystyle k}

UI подразумевает PI. Обратное, в общем, неверно. Но если:

  • существует как минимум 3 основных атрибута:
  • все пары атрибутов {1, i } являются PI их дополнения, и:
  • атрибут 1 — это пользовательский интерфейс его дополнения,

тогда все атрибуты взаимно UI. Более того, в этом случае существует простая связь между кардинальной функцией полезности, представляющей предпочтения в лотереях, и порядковой функцией полезности, представляющей предпочтения в определенных наборах. Функция должна иметь одну из следующих форм: [1] : 330–332  [2] u {\displaystyle u} v {\displaystyle v} u {\displaystyle u}

  • Добавка: u ( x 1 , . . . , x n ) = v ( x 1 , . . . , x n ) {\displaystyle u(x_{1},...,x_{n})=v(x_{1},...,x_{n})}
  • Мультипликативный: u ( x 1 , . . . , x n ) = [ e x p ( R v ( x 1 , . . . , x n ) ) 1 ] / [ e x p ( R ) 1 ] {\displaystyle u(x_{1},...,x_{n})=[exp(R\cdot v(x_{1},...,x_{n}))-1]/[exp(R)-1]}

где . R 0 {\displaystyle R\neq 0}

ДОКАЗАТЕЛЬСТВО: Достаточно доказать, что u имеет постоянное абсолютное неприятие риска относительно значения v .

  • Предположение PI подразумевает , что функция ценности является аддитивной, т.е.: n 3 {\displaystyle n\geq 3}
v ( x 1 , , x n ) = i = 1 n λ i v i ( x i ) {\displaystyle v(x_{1},\dots ,x_{n})=\sum _{i=1}^{n}{\lambda _{i}v_{i}(x_{i})}}
  • Пусть будут два разных значения для атрибута 1. Пусть будет эквивалентом достоверности лотереи . Предположение UI подразумевает, что для каждой комбинации значений других атрибутов выполняется следующая эквивалентность: x 1 , z 1 {\displaystyle x_{1},z_{1}} y 1 {\displaystyle y_{1}} < x 1 : z 1 > {\displaystyle <x_{1}:z_{1}>} ( w 2 , , w n ) {\displaystyle (w_{2},\dots ,w_{n})}
( y 1 , w ) ∼< ( x 1 , w ) : ( z 1 , w ) > {\displaystyle (y_{1},w)\sim <(x_{1},w):(z_{1},w)>}
  • Два предыдущих утверждения подразумевают, что для каждого w в пространстве значений имеет место следующая эквивалентность:
λ 1 v 1 ( y 1 ) + i = 2 n λ i v i ( w i ) ∼< λ 1 v 1 ( x 1 ) + i = 2 n λ i v i ( w i ) : λ 1 v 1 ( z 1 ) + i = 2 n λ i v i ( w i ) > {\displaystyle \lambda _{1}v_{1}(y_{1})+\sum _{i=2}^{n}{\lambda _{i}v_{i}(w_{i})}\sim <\lambda _{1}v_{1}(x_{1})+\sum _{i=2}^{n}{\lambda _{i}v_{i}(w_{i})}:\lambda _{1}v_{1}(z_{1})+\sum _{i=2}^{n}{\lambda _{i}v_{i}(w_{i})}>}
  • Это означает, что добавление любой величины к обеим сторонам лотереи (через термин ) увеличивает эквивалент достоверности лотереи на ту же величину. i = 2 n λ i v i ( w i ) {\displaystyle \sum _{i=2}^{n}{\lambda _{i}v_{i}(w_{i})}}
  • Последний факт подразумевает постоянное неприятие риска.

Смотрите также

Ссылки

  1. ^ abcdefghijkl Кини, Ральф Л.; Райффа, Ховард (1993). Решения с множественными целями . ISBN 0-521-44185-4.
  2. ^ Эта идея приписывается Ричарду Ф. Мейеру и Джону У. Пратту .
Retrieved from "https://en.wikipedia.org/w/index.php?title=Multi-attribute_utility&oldid=1239916590"