Заказанный логит

Регрессионная модель для порядковых зависимых переменных

В статистике упорядоченная логит -модель (также упорядоченная логистическая регрессия или модель пропорциональных шансов ) является порядковой регрессионной моделью, то есть регрессионной моделью для порядковых зависимых переменных , впервые рассмотренной Питером МакКаллахом . [1] Например, если на один вопрос опроса нужно ответить выбором между «плохо», «удовлетворительно», «хорошо», «очень хорошо» и «отлично» , а цель анализа — увидеть, насколько хорошо этот ответ может быть предсказан ответами на другие вопросы, некоторые из которых могут быть количественными, то можно использовать упорядоченную логистическую регрессию. Ее можно рассматривать как расширение модели логистической регрессии , которая применяется к дихотомическим зависимым переменным, допуская более двух (упорядоченных) категорий ответов.

Модель и предположение о пропорциональных шансах

Модель применима только к данным, которые соответствуют предположению о пропорциональных шансах , смысл которого можно проиллюстрировать следующим образом. Предположим, что есть пять результатов: «плохо», «удовлетворительно», «хорошо», «очень хорошо» и «отлично». Мы предполагаем, что вероятности этих результатов задаются как p 1 ( x ), p 2 ( x ), p 3 ( x ), p 4 ( x ), p 5 ( x ), все из которых являются функциями некоторой независимой переменной(ых) x . Тогда для фиксированного значения x логарифмы шансов (а не логарифмы вероятностей) ответов определенными способами равны:

poor:  log p 1 ( x ) p 2 ( x ) + p 3 ( x ) + p 4 ( x ) + p 5 ( x ) , poor or fair:  log p 1 ( x ) + p 2 ( x ) p 3 ( x ) + p 4 ( x ) + p 5 ( x ) , poor, fair, or good:  log p 1 ( x ) + p 2 ( x ) + p 3 ( x ) p 4 ( x ) + p 5 ( x ) , poor, fair, good, or very good:  log p 1 ( x ) + p 2 ( x ) + p 3 ( x ) + p 4 ( x ) p 5 ( x ) {\displaystyle {\begin{aligned}{\text{poor: }}&\log {\frac {p_{1}(x)}{p_{2}(x)+p_{3}(x)+p_{4}(x)+p_{5}(x)}},\\[8pt]{\text{poor or fair: }}&\log {\frac {p_{1}(x)+p_{2}(x)}{p_{3}(x)+p_{4}(x)+p_{5}(x)}},\\[8pt]{\text{poor, fair, or good: }}&\log {\frac {p_{1}(x)+p_{2}(x)+p_{3}(x)}{p_{4}(x)+p_{5}(x)}},\\[8pt]{\text{poor, fair, good, or very good: }}&\log {\frac {p_{1}(x)+p_{2}(x)+p_{3}(x)+p_{4}(x)}{p_{5}(x)}}\end{aligned}}}

Предположение о пропорциональных шансах гласит, что числа, добавленные к каждому из этих логарифмов для получения следующего, одинаковы независимо от x . Другими словами, разница между логарифмом шансов иметь плохое или удовлетворительное здоровье минус логарифм шансов иметь плохое здоровье одинакова независимо от x ; аналогично, логарифм шансов иметь плохое, удовлетворительное или хорошее здоровье минус логарифм шансов иметь плохое или удовлетворительное здоровье одинакова независимо от x ; и т. д. [2]

Примерами категорий множественных ответов являются рейтинги облигаций, опросы общественного мнения с ответами от «полностью согласен» до «полностью не согласен», уровни государственных расходов на правительственные программы (высокие, средние или низкие), выбранный уровень страхового покрытия (отсутствие, частичное или полное) и статус занятости (не работаю, работаю неполный рабочий день или полностью занят). [3]

Упорядоченный логит может быть получен из модели скрытых переменных, подобной той, из которой может быть получена бинарная логистическая регрессия . Предположим, что базовый процесс, который нужно охарактеризовать, это

y = x T β + ε , {\displaystyle y^{*}=\mathbf {x} ^{\mathsf {T}}\beta +\varepsilon ,\,}

где — ненаблюдаемая зависимая переменная (возможно, точный уровень согласия с утверждением, предложенным опросчиком); — вектор независимых переменных; — ошибка , предположительно соответствующая стандартному логистическому распределению; и — вектор коэффициентов регрессии, которые мы хотим оценить. Далее предположим, что, хотя мы не можем наблюдать , вместо этого мы можем наблюдать только категории ответа y {\displaystyle y^{*}} x {\displaystyle \mathbf {x} } ε {\displaystyle \varepsilon } β {\displaystyle \beta } y {\displaystyle y^{*}}

y = { 0 if  y μ 1 , 1 if  μ 1 < y μ 2 , 2 if  μ 2 < y μ 3 , N if  μ N < y {\displaystyle y={\begin{cases}0&{\text{if }}y^{*}\leq \mu _{1},\\1&{\text{if }}\mu _{1}<y^{*}\leq \mu _{2},\\2&{\text{if }}\mu _{2}<y^{*}\leq \mu _{3},\\\vdots \\N&{\text{if }}\mu _{N}<y^{*}\end{cases}}}

где параметры являются внешне навязанными конечными точками наблюдаемых категорий. Затем упорядоченный метод логита будет использовать наблюдения по y , которые являются формой цензурированных данных по y* , для подгонки вектора параметров . μ i {\displaystyle \mu _{i}} β {\displaystyle \beta }

Оценка

Как обычно, оценка максимального правдоподобия или байесовский вывод являются наиболее распространенными способами подбора параметров для такой модели. [4] Оцененные параметры указывают направление и величину влияния каждой независимой переменной на вероятность попадания зависимой переменной в более высокую или более низкую категорию.

Приложения

Упорядоченные логистические регрессии использовались во многих областях, таких как транспорт, [5] маркетинг [6] или управление стихийными бедствиями. [7]

В клинических исследованиях эффект, который может оказать лекарство на пациента, можно смоделировать с помощью порядковой регрессии. Независимые переменные могут включать использование или неиспользование лекарства, а также контрольные переменные, такие как демографические данные и данные из истории болезни. Зависимая переменная может быть ранжирована по следующему списку: полное излечение, улучшение симптомов, отсутствие изменений, ухудшение симптомов или смерть. [ необходима цитата ]

Другим примером применения являются элементы типа Лайкерта, обычно используемые в исследованиях опросов, где респонденты оценивают свое согласие по упорядоченной шкале (например, от «Категорически не согласен» до «Категорически согласен»). Упорядоченная пробит-модель обеспечивает соответствующее соответствие этим данным, сохраняя порядок вариантов ответа, не делая никаких предположений о расстояниях между вариантами. [8]

Смотрите также

Ссылки

  1. ^ МакКаллах, Питер (1980). «Модели регрессии для порядковых данных». Журнал Королевского статистического общества . Серия Б (Методическая). 42 (2): 109–142. doi :10.1111/j.2517-6161.1980.tb01109.x. JSTOR  2984952.
  2. ^ Грин, Уильям Х. (2012). Эконометрический анализ (седьмое изд.). Бостон: Pearson Education. стр. 827–831. ISBN 978-0-273-75356-8.
  3. ^ Грин, Уильям Х. (2012). Эконометрический анализ (седьмое изд.). Бостон: Pearson Education. стр. 824–827. ISBN 978-0-273-75356-8.
  4. ^ Грин, Уильям Х.; Хеншер, Дэвид А. (2010-04-08). Моделирование упорядоченных выборов: Учебник. Cambridge University Press. ISBN 978-1-139-48595-1.
  5. ^ dell'Olio, Luigi; Ibeas, Angel; Cecín, Patricia (2010-11-01). «Моделирование восприятия пользователем качества автобусного транспорта». Transport Policy . 17 (6): 388–397. doi :10.1016/j.tranpol.2010.04.006. ISSN  0967-070X.
  6. ^ Катахира, Хотака (февраль 1990 г.). «Картирование восприятия с использованием упорядоченного логит-анализа». Marketing Science . 9 (1): 1–17. doi :10.1287/mksc.9.1.1. ISSN  0732-2399.
  7. ^ Ловреглио, Руджеро; Кулиговски, Эрика; Уолпол, Эмили; Линк, Эрик; Гвинн, Стив (01.11.2020). «Калибровка модели принятия решений по лесным пожарам с использованием гибридного моделирования выбора». Международный журнал по снижению риска бедствий . 50 : 101770. doi : 10.1016/j.ijdrr.2020.101770 . ISSN  2212-4209.
  8. ^ Лидделл, Т.; Крушке, Дж. (2018). «Анализ порядковых данных с помощью метрических моделей: что может пойти не так?» (PDF) . Журнал экспериментальной социальной психологии . 79 : 328–348. doi :10.1016/j.jesp.2018.08.009.

Дальнейшее чтение

  • Беккер, Уильям Э.; Кеннеди, Питер Э. (1992). «Графическое представление упорядоченного пробита». Эконометрическая теория . 8 (1): 127–131. doi :10.1017/S0266466600010781.
  • Гельман, Эндрю; Хилл, Дженнифер (2007). Анализ данных с использованием регрессии и многоуровневых/иерархических моделей. Нью-Йорк: Cambridge University Press. С. 119–124. ISBN 978-0-521-68689-1.
  • Хардин, Джеймс; Хильбе, Джозеф (2007). Обобщенные линейные модели и расширения (2-е изд.). College Station: Stata Press. ISBN 978-1-59718-014-6.
  • Вудворд, Марк (2005). Эпидемиология: дизайн исследования и анализ данных (2-е изд.). Chapman & Hall/CRC. ISBN 978-1-58488-415-6.
  • Вулдридж, Джеффри (2010). Эконометрический анализ данных поперечного сечения и панельных данных (второе издание). Кембридж: MIT Press. стр. 643–666. ISBN 978-0-262-23258-6.
  • Саймон, Стив (2004-09-22). "Размер выборки для порядкового результата". STATS − Попытка Стива научить статистике . Получено 2014-08-22 .
  • Родригес, Герман. «Упорядоченные логит-модели». Принстонский университет .
Retrieved from "https://en.wikipedia.org/w/index.php?title=Ordered_logit&oldid=1251922079"