Модель случайных эффектов

Статистическая модель

В статистике модель случайных эффектов , также называемая моделью компонентов дисперсии , представляет собой статистическую модель , где параметры модели являются случайными величинами . Это разновидность иерархической линейной модели , которая предполагает, что анализируемые данные берутся из иерархии различных популяций, различия которых связаны с этой иерархией. Модель случайных эффектов является частным случаем смешанной модели .

Сравните это с определениями биостатистики , [1] [2] [3] [4] [5], поскольку биостатистики используют «фиксированные» и «случайные» эффекты для обозначения соответственно средних по популяции и специфических для субъекта эффектов (и где последние, как правило, предполагаются неизвестными, скрытыми переменными ).

Качественное описание

Модели случайных эффектов помогают контролировать ненаблюдаемую гетерогенность , когда гетерогенность постоянна во времени и не коррелирует с независимыми переменными. Эта константа может быть удалена из продольных данных посредством дифференциации, поскольку взятие первой разности удалит любые инвариантные во времени компоненты модели. [6]

Можно сделать два общих предположения относительно индивидуального специфического эффекта: предположение о случайных эффектах и ​​предположение о фиксированных эффектах. Предположение о случайных эффектах заключается в том, что индивидуальная ненаблюдаемая гетерогенность не коррелирует с независимыми переменными. Предположение о фиксированных эффектах заключается в том, что индивидуальный специфический эффект коррелирует с независимыми переменными. [6]

Если предположение о случайных эффектах верно, то оценка случайных эффектов более эффективна, чем модель с фиксированными эффектами.

Простой пример

Предположим, что крупные начальные школы выбираются случайным образом из тысяч в большой стране. Предположим также, что ученики одного возраста выбираются случайным образом в каждой выбранной школе. Их баллы по стандартному тесту на способности устанавливаются. Пусть будет баллом -го ученика в -й школе. м {\displaystyle м} н {\displaystyle n} И я дж {\displaystyle Y_{ij}} дж {\displaystyle j} я {\displaystyle я}

Простой способ моделирования этой переменной:

И я дж = μ + У я + Вт я дж , {\displaystyle Y_{ij}=\mu +U_{i}+W_{ij},\,}

где - средний балл теста для всего населения. μ {\displaystyle \мю}

В этой модели есть школьно-специфический случайный эффект : он измеряет разницу между средним баллом в школе и средним баллом по всей стране. Термином является индивидуально-специфический случайный эффект, т. е. это отклонение балла -го ученика от среднего балла для -й школы. У я {\displaystyle U_{i}} я {\displaystyle я} Вт я дж {\displaystyle W_{ij}} дж {\displaystyle j} я {\displaystyle я}

Модель может быть расширена путем включения дополнительных объясняющих переменных, которые будут фиксировать различия в результатах среди разных групп. Например:

И я дж = μ + β 1 С е х я дж + β 2 П а г е н т с Э г ты с я дж + У я + Вт я дж , {\displaystyle Y_{ij}=\mu +\beta _{1}\mathrm {Sex} _{ij}+\beta _{2}\mathrm {ParentsEduc} _{ij}+U_{i}+W_{ ij},\,}

где — это бинарная фиктивная переменная , которая записывает, скажем, средний уровень образования родителей ребенка. Это смешанная модель , а не модель чисто случайных эффектов, поскольку она вводит члены с фиксированными эффектами для пола и образования родителей. С е х я дж {\displaystyle \mathrm {Секс} _{ij}} П а г е н т с Э г ты с я дж {\displaystyle \mathrm {ParentsEduc} _{ij}}

Компоненты дисперсии

Дисперсия равна сумме дисперсий и и соответственно . И я дж {\displaystyle Y_{ij}} τ 2 {\displaystyle \тау ^{2}} σ 2 {\displaystyle \сигма ^{2}} У я {\displaystyle U_{i}} Вт я дж {\displaystyle W_{ij}}

Позволять

И ¯ я = 1 н дж = 1 н И я дж {\displaystyle {\overline {Y}}_{i\bullet }={\frac {1}{n}}\sum _{j=1}^{n}Y_{ij}}

будет средним значением не всех оценок в -й школе, а тех оценок в -й школе, которые включены в случайную выборку . Пусть я {\displaystyle я} я {\displaystyle я}

И ¯ = 1 м н я = 1 м дж = 1 н И я дж {\displaystyle {\overline {Y}}_{\bullet \bullet }={\frac {1}{mn}}\sum _{i=1}^{m}\sum _{j=1}^{n}Y_{ij}}

быть средним показателем .

Позволять

С С Вт = я = 1 м дж = 1 н ( И я дж И ¯ я ) 2 {\displaystyle SSW=\sum _{i=1}^{m}\sum _{j=1}^{n}(Y_{ij}-{\overline {Y}}_{i\bullet })^{2}\,}
S S B = n i = 1 m ( Y ¯ i Y ¯ ) 2 {\displaystyle SSB=n\sum _{i=1}^{m}({\overline {Y}}_{i\bullet }-{\overline {Y}}_{\bullet \bullet })^{2}\,}

быть соответственно суммой квадратов из-за различий внутри групп и суммой квадратов из-за различий между группами. Тогда можно показать [ нужна цитата ], что

1 m ( n 1 ) E ( S S W ) = σ 2 {\displaystyle {\frac {1}{m(n-1)}}E(SSW)=\sigma ^{2}}

и

1 ( m 1 ) n E ( S S B ) = σ 2 n + τ 2 . {\displaystyle {\frac {1}{(m-1)n}}E(SSB)={\frac {\sigma ^{2}}{n}}+\tau ^{2}.}

Эти « ожидаемые средние квадраты » можно использовать в качестве основы для оценки «компонентов дисперсии» и . σ 2 {\displaystyle \sigma ^{2}} τ 2 {\displaystyle \tau ^{2}}

Параметр также называется коэффициентом внутриклассовой корреляции . σ 2 {\displaystyle \sigma ^{2}}

Предельная вероятность

Для моделей случайных эффектов важны предельные вероятности . [7]

Приложения

Модели случайных эффектов, используемые на практике, включают модель Бюльмана для страховых контрактов и модель Фэя-Херриота, используемую для оценки малых территорий .

Смотрите также

Дальнейшее чтение

  • Балтаги, Бади Х. (2008). Эконометрический анализ панельных данных (4-е изд.). Нью-Йорк, Нью-Йорк: Wiley. С. 17–22. ISBN 978-0-470-51886-1.
  • Сяо, Ченг (2003). Анализ панельных данных (2-е изд.). Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. стр. 73–92. ISBN 0-521-52271-4.
  • Вулдридж, Джеффри М. (2002). Эконометрический анализ данных поперечного сечения и панельных данных . Кембридж, Массачусетс: MIT Press. стр. 257–265. ISBN 0-262-23219-7.
  • Гомес, Дилан GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC  8784019 . PMID  35116198.

Ссылки

  1. ^ Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171. ISBN 0-19-852484-6.
  2. ^ Фицморис, Гарретт М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной лонгитюдный анализ . Хобокен: John Wiley & Sons. стр. 326–328. ISBN 0-471-21487-6.
  3. ^ Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. doi :10.2307/2529876. JSTOR  2529876. PMID  7168798.
  4. ^ Гардинер, Джозеф К.; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221–239. doi :10.1002/sim.3478. PMID  19012297.
  5. ^ Гомес, Дилан GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID  35116198. 
  6. ^ ab Wooldridge, Jeffrey (2010). Эконометрический анализ данных поперечного сечения и панельных данных (2-е изд.). Кембридж, Массачусетс: MIT Press. стр. 252. ISBN 9780262232586. OCLC  627701062.
  7. ^ Хедекер, Д., Гиббонс, Р. Д. (2006). Анализ продольных данных. Германия: Wiley. Страница 163 https://books.google.com/books?id=f9p9iIgzQSQC&pg=PA163
  • Модели с фиксированными и случайными эффектами
  • Как провести метаанализ: модели с фиксированным и случайным эффектом
Retrieved from "https://en.wikipedia.org/w/index.php?title=Random_effects_model&oldid=1243103822"