Многоуровневая модель

Статистические модели параметров, которые изменяются на более чем одном уровне

Многоуровневые модели (также известные как иерархические линейные модели , линейные модели со смешанными эффектами , смешанные модели , модели вложенных данных , случайные коэффициенты , модели со случайными эффектами , модели со случайными параметрами или планы с разделенным участком ) — это статистические модели параметров , которые изменяются на более чем одном уровне. [1] Примером может служить модель успеваемости учащихся, которая содержит показатели для отдельных учащихся, а также показатели для классов, в которых учащиеся сгруппированы. Эти модели можно рассматривать как обобщения линейных моделей (в частности, линейной регрессии ), хотя их также можно распространять на нелинейные модели. Эти модели стали гораздо более популярными после того, как стали доступны достаточная вычислительная мощность и программное обеспечение. [1]

Многоуровневые модели особенно подходят для исследовательских проектов, где данные для участников организованы на более чем одном уровне (т. е. вложенные данные ). [2] Единицами анализа обычно являются отдельные лица (на более низком уровне), которые вложены в контекстные/агрегированные единицы (на более высоком уровне). [3] Хотя самым низким уровнем данных в многоуровневых моделях обычно является отдельное лицо, могут также изучаться повторные измерения отдельных лиц. [2] [4] Таким образом, многоуровневые модели предоставляют альтернативный тип анализа для одномерного или многомерного анализа повторных измерений . Могут изучаться индивидуальные различия в кривых роста . [2] Кроме того, многоуровневые модели могут использоваться в качестве альтернативы ANCOVA , где оценки по зависимой переменной корректируются с учетом ковариатов (например, индивидуальных различий) перед тестированием различий в лечении. [5] Многоуровневые модели способны анализировать эти эксперименты без предположений об однородности наклонов регрессии, которые требуются для ANCOVA. [2]

Многоуровневые модели могут использоваться на данных со многими уровнями, хотя двухуровневые модели являются наиболее распространенными, и остальная часть этой статьи посвящена только им. Зависимая переменная должна быть исследована на самом низком уровне анализа. [1]

Уравнение регрессии уровня 1

Когда есть одна независимая переменная уровня 1, модель уровня 1 имеет вид

И я дж = β 0 дж + β 1 дж Х я дж + е я дж {\displaystyle Y_{ij}=\beta _{0j}+\beta _{1j}X_{ij}+e_{ij}} .

  • И я дж {\displaystyle Y_{ij}} относится к оценке зависимой переменной для отдельного наблюдения на уровне 1 (нижний индекс i относится к отдельному случаю, нижний индекс j относится к группе).
  • Х я дж {\displaystyle X_{ij}} относится к предиктору уровня 1.
  • β 0 дж {\displaystyle \beta _{0j}} относится к пересечению зависимой переменной для группы j.
  • β 1 дж {\displaystyle \beta _{1j}} относится к наклону связи в группе j (уровень 2) между предиктором уровня 1 и зависимой переменной.
  • е я дж {\displaystyle e_{ij}} относится к случайным ошибкам прогнозирования для уравнения уровня 1 (иногда его также называют ). г я дж {\displaystyle r_{ij}}

е я дж Н ( 0 , σ 1 2 ) {\displaystyle e_{ij}\sim {\mathcal {N}}(0,\sigma _{1}^{2})}

На уровне 1 как отрезки, так и наклоны в группах могут быть либо фиксированными (что означает, что все группы имеют одинаковые значения, хотя в реальном мире это было бы редким явлением), неслучайно изменяющимися (что означает, что отрезки и/или наклоны предсказуемы из независимой переменной на уровне 2), либо случайно изменяющимися (что означает, что отрезки и/или наклоны различны в разных группах, и что каждая имеет свое собственное общее среднее значение и дисперсию). [2] [4]

При наличии нескольких независимых переменных уровня 1 модель можно расширить, подставив векторы и матрицы в уравнение.

Когда связь между ответом и предиктором не может быть описана линейной связью, то можно найти некоторую нелинейную функциональную связь между ответом и предиктором и расширить модель до нелинейной модели со смешанными эффектами . Например, когда ответ является кумулятивной траекторией заражения -й страны и представляет -й временной момент, то упорядоченная пара для каждой страны может показывать форму, похожую на логистическую функцию . [6] [7] И я дж {\displaystyle Y_{ij}} Х я дж {\displaystyle X_{ij}} И я дж {\displaystyle Y_{ij}} я {\displaystyle я} Х я дж {\displaystyle X_{ij}} дж {\displaystyle j} ( Х я дж , И я дж ) {\displaystyle (X_{ij},Y_{ij})}

Уравнение регрессии 2-го уровня

Зависимые переменные — это отрезки и наклоны для независимых переменных на уровне 1 в группах уровня 2.

ты 0 дж Н ( 0 , σ 2 2 ) {\displaystyle u_{0j}\sim {\mathcal {N}}(0,\sigma _{2}^{2})}

ты 1 дж Н ( 0 , σ 3 2 ) {\displaystyle u_{1j}\sim {\mathcal {N}}(0,\sigma _{3}^{2})}

β 0 дж = γ 00 + γ 01 ж дж + ты 0 дж {\displaystyle \beta _{0j}=\gamma _{00}+\gamma _{01}w_{j}+u_{0j}}

β 1 дж = γ 10 + γ 11 ж дж + ты 1 дж {\displaystyle \beta _{1j} =\gamma _{10}+\gamma _{11}w_{j}+u_{1j}}

  • γ 00 {\displaystyle \гамма _{00}} относится к общему интерсепту. Это общее среднее значение оценок зависимой переменной по всем группам, когда все предикторы равны 0.
  • γ 10 {\displaystyle \гамма _{10}} относится к среднему наклону между зависимой переменной и предиктором уровня 1.
  • ж дж {\displaystyle w_{j}} относится к предиктору уровня 2.
  • γ 01 {\displaystyle \гамма _{01}} и относятся к влиянию предиктора уровня 2 на пересечение и наклон уровня 1 соответственно. γ 11 {\displaystyle \гамма _{11}}
  • ты 0 дж {\displaystyle u_{0j}} относится к отклонению в группе j от общего значения.
  • ты 1 дж {\displaystyle u_{1j}} относится к отклонению в группе j от среднего наклона между зависимой переменной и предиктором уровня 1.

Типы моделей

Перед проведением многоуровневого анализа модели исследователь должен решить несколько аспектов, включая то, какие предикторы следует включить в анализ, если таковые имеются. Во-вторых, исследователь должен решить, будут ли значения параметров (т. е. элементы, которые будут оцениваться) фиксированными или случайными. [2] [5] [4] Фиксированные параметры состоят из константы по всем группам, тогда как случайный параметр имеет разное значение для каждой из групп. [4] Кроме того, исследователь должен решить, использовать ли оценку максимального правдоподобия или ограниченный тип оценки максимального правдоподобия. [2]

Модель случайных перехватов

Модель случайных перехватов — это модель, в которой перехваты могут варьироваться, и, следовательно, оценки зависимой переменной для каждого отдельного наблюдения предсказываются перехватом, который варьируется в зависимости от группы. [5] [8] [4] Эта модель предполагает, что наклоны фиксированы (одинаковы в разных контекстах). Кроме того, эта модель предоставляет информацию о внутриклассовых корреляциях , которые полезны для определения того, требуются ли многоуровневые модели в первую очередь. [2]

Модель случайных наклонов

Модель случайных наклонов — это модель, в которой наклоны могут изменяться в соответствии с матрицей корреляции, и, следовательно, наклоны различаются по группирующим переменным, таким как время или индивидуумы. Эта модель предполагает, что интерсепты фиксированы (одинаковы в разных контекстах). [5]

Модель случайных пересечений и наклонов

Модель, включающая как случайные точки пересечения, так и случайные наклоны, вероятно, является наиболее реалистичным типом модели, хотя она также является наиболее сложной. В этой модели и точки пересечения, и наклоны могут варьироваться в разных группах, что означает, что они различаются в разных контекстах. [5]

Разработка многоуровневой модели

Чтобы провести многоуровневый анализ модели, нужно начать с фиксированных коэффициентов (наклонов и отсекаемых точек). Один аспект может изменяться за раз (то есть изменяться) и сравниваться с предыдущей моделью, чтобы оценить лучшее соответствие модели. [1] Есть три разных вопроса, которые исследователь задает при оценке модели. Во-первых, хороша ли эта модель? Во-вторых, лучше ли более сложная модель? В-третьих, какой вклад вносят отдельные предикторы в модель?

Для оценки моделей будут рассмотрены различные статистики соответствия модели. [2] Одной из таких статистик является тест отношения правдоподобия хи-квадрат , который оценивает разницу между моделями. Тест отношения правдоподобия может быть использован для построения моделей в целом, для изучения того, что происходит, когда эффекты в модели могут варьироваться, и при тестировании категориальной переменной с фиктивным кодом как одного эффекта. [2] Однако тест можно использовать только тогда, когда модели являются вложенными (это означает, что более сложная модель включает все эффекты более простой модели). При тестировании невложенных моделей сравнения между моделями могут быть сделаны с использованием информационного критерия Акаике (AIC) или информационного критерия Байеса (BIC), среди прочих. [1] [2] [5] См. далее Выбор модели .

Предположения

Многоуровневые модели имеют те же предположения, что и другие основные общие линейные модели (например, ANOVA , регрессия ), но некоторые предположения изменены с учетом иерархической природы дизайна (т. е. вложенных данных).

Линейность

Предположение о линейности утверждает, что существует прямолинейная (прямолинейная, в отличие от нелинейной или U-образной) связь между переменными. [9] Однако модель может быть расширена до нелинейных связей. [10] В частности, когда средняя часть уравнения регрессии уровня 1 заменяется нелинейной параметрической функцией, то такая модельная структура широко называется нелинейной моделью со смешанными эффектами . [7]

Нормальность

Предположение о нормальности утверждает, что члены ошибки на каждом уровне модели распределены нормально. [9] [ оспариваетсяобсудить ] Однако большинство статистического программного обеспечения позволяет задавать различные распределения для членов дисперсии, такие как пуассоновское, биномиальное, логистическое. Многоуровневый подход к моделированию может использоваться для всех форм обобщенных линейных моделей.

Гомоскедастичность

Предположение о гомоскедастичности , также известное как однородность дисперсии, предполагает равенство дисперсий совокупности. [9] Однако для учета этого можно указать другую матрицу дисперсии-корреляции, а также можно смоделировать неоднородность дисперсии.

Независимость наблюдений (отсутствие автокорреляции остатков модели)

Независимость — это предположение общих линейных моделей, которое утверждает, что случаи являются случайными выборками из популяции и что оценки зависимой переменной независимы друг от друга. [9] Одной из основных целей многоуровневых моделей является рассмотрение случаев, когда предположение о независимости нарушается; однако многоуровневые модели предполагают, что 1) остатки уровня 1 и уровня 2 некоррелированы и 2) ошибки (измеренные остатками) на самом высоком уровне некоррелированы. [11]

Ортогональность регрессоров к случайным эффектам

Регрессоры не должны коррелировать со случайными эффектами . Это предположение проверяемо, но часто игнорируется, что делает оценщик непоследовательным. [12] Если это предположение нарушается, случайный эффект должен быть явно смоделирован в фиксированной части модели, либо с использованием фиктивных переменных, либо с включением кластерных средних всех регрессоров. [12] [13] [14] [15] Это предположение, вероятно, является наиболее важным предположением, которое делает оценщик, но оно неправильно понимается большинством прикладных исследователей, использующих эти типы моделей. [12] ты 0 дж {\displaystyle u_{0j}} Х я дж {\displaystyle X_{ij}}

Статистические тесты

Тип статистических тестов, используемых в многоуровневых моделях, зависит от того, исследуются ли фиксированные эффекты или компоненты дисперсии. При исследовании фиксированных эффектов тесты сравниваются со стандартной ошибкой фиксированного эффекта, что приводит к Z-тесту . [5] Также можно вычислить t -тест . При вычислении t-теста важно помнить о степенях свободы, которые будут зависеть от уровня предиктора (например, предиктор уровня 1 или предиктор уровня 2). [5] Для предиктора уровня 1 степени свободы основаны на количестве предикторов уровня 1, количестве групп и количестве индивидуальных наблюдений. Для предиктора уровня 2 степени свободы основаны на количестве предикторов уровня 2 и количестве групп. [5]

Статистическая мощность

Статистическая мощность многоуровневых моделей различается в зависимости от того, исследуются ли эффекты уровня 1 или уровня 2. Мощность для эффектов уровня 1 зависит от количества индивидуальных наблюдений, тогда как мощность для эффектов уровня 2 зависит от количества групп. [16] Для проведения исследований с достаточной мощностью в многоуровневых моделях требуются большие размеры выборки. Однако количество индивидуальных наблюдений в группах не так важно, как количество групп в исследовании. Для обнаружения межуровневых взаимодействий, учитывая, что размеры групп не слишком малы, было рекомендовано использовать не менее 20 групп, [16] хотя можно использовать гораздо меньшее количество групп, если интересуют только выводы о фиксированных эффектах, а случайные эффекты являются контрольными или «мешающими» переменными. [4] Вопрос статистической мощности в многоуровневых моделях осложняется тем фактом, что мощность изменяется в зависимости от размера эффекта и внутриклассовых корреляций, она отличается для фиксированных эффектов по сравнению со случайными эффектами и меняется в зависимости от количества групп и количества индивидуальных наблюдений в группе. [16]

Приложения

Уровень

Концепция уровня является краеугольным камнем этого подхода. В примере образовательного исследования уровни для двухуровневой модели могут быть

  1. ученик
  2. сорт

Однако если изучать несколько школ и несколько школьных округов, то четырехуровневая модель может включать:

  1. ученик
  2. сорт
  3. школа
  4. округ

Исследователь должен установить для каждой переменной уровень, на котором она измерялась. В этом примере «тестовый балл» может измеряться на уровне ученика, «опыт учителя» на уровне класса, «финансирование школы» на уровне школы, а «город» на уровне района.

Пример

В качестве простого примера рассмотрим базовую линейную регрессионную модель, которая предсказывает доход как функцию возраста, класса, пола и расы. Затем можно заметить, что уровень дохода также варьируется в зависимости от города и штата проживания. Простым способом включить это в регрессионную модель было бы добавление дополнительной независимой категориальной переменной для учета местоположения (т. е. набора дополнительных бинарных предикторов и связанных с ними коэффициентов регрессии, по одному на местоположение). Это имело бы эффект смещения среднего дохода вверх или вниз — но это все еще предполагало бы, например, что влияние расы и пола на доход везде одинаково. В действительности это вряд ли так — разные местные законы, разные пенсионные политики, различия в уровне расовых предрассудков и т. д., вероятно, приведут к тому, что все предикторы будут иметь разные виды эффектов в разных местах.

Другими словами, простая линейная регрессионная модель может, например, предсказать, что данный случайно выбранный человек в Сиэтле будет иметь средний годовой доход на 10 000 долларов выше, чем аналогичный человек в Мобайле, штат Алабама . Однако она также предскажет, например, что белый человек может иметь средний доход на 7 000 долларов выше, чем черный человек, а 65-летний может иметь доход на 3 000 долларов ниже, чем 45-летний, в обоих случаях независимо от местоположения. Многоуровневая модель, однако, допускает различные коэффициенты регрессии для каждого предиктора в каждом местоположении. По сути, она предполагает, что люди в данном местоположении имеют коррелированные доходы, генерируемые одним набором коэффициентов регрессии, тогда как люди в другом месте имеют доходы, генерируемые другим набором коэффициентов. Между тем, сами коэффициенты считаются коррелированными и генерируемыми из одного набора гиперпараметров . Возможны дополнительные уровни: например, люди могут быть сгруппированы по городам, а коэффициенты регрессии на уровне города — по штатам, а коэффициенты на уровне штата могут быть получены из одного гипергиперпараметра.

Многоуровневые модели являются подклассом иерархических байесовских моделей , которые являются общими моделями с несколькими уровнями случайных величин и произвольными отношениями между различными переменными. Многоуровневый анализ был расширен, чтобы включить многоуровневое структурное моделирование уравнений , многоуровневое моделирование латентных классов и другие более общие модели.

Использует

Многоуровневые модели использовались в исследованиях в области образования или географических исследованиях для раздельной оценки различий между учениками в одной и той же школе и различий между школами. В психологических приложениях множественные уровни — это элементы инструмента, отдельные лица и семьи. В социологических приложениях многоуровневые модели используются для изучения отдельных лиц, включенных в регионы или страны. В исследованиях организационной психологии данные отдельных лиц часто должны быть вложены в команды или другие функциональные единицы. Они часто используются в экологических исследованиях, а также под более общим термином смешанные модели . [4]

Различные ковариабы могут быть релевантными на разных уровнях. Их можно использовать для лонгитюдных исследований, как и в исследованиях роста, для разделения изменений в пределах одного человека и различий между людьми.

Межуровневые взаимодействия также могут представлять существенный интерес; например, когда наклону разрешено изменяться случайным образом, предиктор уровня 2 может быть включен в формулу наклона для ковариата уровня 1. Например, можно оценить взаимодействие расы и соседства, чтобы получить оценку взаимодействия между характеристиками индивидуума и социальным контекстом.

Приложения к продольным (повторные измерения) данным

Альтернативные способы анализа иерархических данных

Существует несколько альтернативных способов анализа иерархических данных, хотя большинство из них имеют некоторые проблемы. Во-первых, можно использовать традиционные статистические методы. Можно было бы разбить переменные более высокого порядка на индивидуальный уровень и, таким образом, провести анализ на этом индивидуальном уровне (например, назначить переменные класса на индивидуальный уровень). Проблема с этим подходом заключается в том, что это нарушит предположение о независимости и, таким образом, может исказить наши результаты. Это известно как атомистическое заблуждение. [17] Другой способ анализа данных с использованием традиционных статистических подходов заключается в том, чтобы агрегировать переменные индивидуального уровня в переменные более высокого порядка, а затем провести анализ на этом более высоком уровне. Проблема с этим подходом заключается в том, что он отбрасывает всю внутригрупповую информацию (потому что он берет среднее значение переменных индивидуального уровня). До 80–90% дисперсии может быть потрачено впустую, а связь между агрегированными переменными будет раздута и, таким образом, искажена. [18] Это известно как экологическое заблуждение , и статистически этот тип анализа приводит к снижению мощности в дополнение к потере информации. [2]

Другой способ анализа иерархических данных — модель случайных коэффициентов. Эта модель предполагает, что у каждой группы своя регрессионная модель — со своим собственным отсеканием и наклоном. [5] Поскольку группы являются выборочными, модель предполагает, что отсекаемые отрезки и наклоны также случайным образом выбираются из совокупности отсекаемых отрезков и наклонов групп. Это позволяет проводить анализ, в котором можно предположить, что наклоны фиксированы, но отсекаемые отрезки могут меняться. [5] Однако это представляет собой проблему, поскольку отдельные компоненты независимы, но групповые компоненты независимы между группами, но зависимы внутри групп. Это также позволяет проводить анализ, в котором наклоны случайны; однако корреляции членов ошибки (возмущений) зависят от значений переменных индивидуального уровня. [5] Таким образом, проблема с использованием модели случайных коэффициентов для анализа иерархических данных заключается в том, что по-прежнему невозможно включить переменные более высокого порядка.

Условия ошибки

Многоуровневые модели имеют два члена ошибок, которые также известны как помехи. Все индивидуальные компоненты независимы, но есть также групповые компоненты, которые независимы между группами, но коррелируют внутри групп. Однако компоненты дисперсии могут различаться, поскольку некоторые группы более однородны, чем другие. [18]

Байесовская нелинейная модель смешанных эффектов

Байесовский цикл исследований с использованием байесовской нелинейной модели смешанных эффектов: (a) стандартный цикл исследований и (b) байесовский рабочий процесс. [19]

Многоуровневое моделирование часто используется в различных приложениях и может быть сформулировано с помощью байесовского фреймворка. В частности, байесовские нелинейные модели смешанных эффектов в последнее время привлекли значительное внимание. Базовая версия байесовских нелинейных моделей смешанных эффектов представлена ​​в виде следующей трехэтапной:

Этап 1: Модель индивидуального уровня

у я дж = ф ( т я дж ; θ 1 я , θ 2 я , , θ л я , , θ К я ) + ϵ я дж , с п а с е г ϵ я дж Н ( 0 , σ 2 ) , с п а с е г я = 1 , , Н , дж = 1 , , М я . {\displaystyle {\begin{aligned}&{y}_{ij}=f(t_{ij};\theta _{1i},\theta _{2i},\ldots ,\theta _{li},\ldots ,\theta _{Ki})+\epsilon _{ij},\\{\phantom {spacer}}\\&\epsilon _{ij}\sim N(0,\sigma ^{2}),\\{\phantom {spacer}}\\&i=1,\ldots ,N,\,j=1,\ldots ,M_{i}.\end{aligned}}}

Этап 2: Модель населения

θ л я = α л + б = 1 П β л б х я б + η л я , с п а с е г η л я Н ( 0 , ω л 2 ) , с п а с е г я = 1 , , Н , л = 1 , , К . {\displaystyle {\begin{aligned}&\theta _{li}=\alpha _{l}+\sum _{b=1}^{P}\beta _{lb}x_{ib}+\eta _{li},\\{\phantom {spacer}}\\&\eta _{li}\sim N(0,\omega _{l}^{2}),\\{\phantom {spacer}}\\&i=1,\ldots ,N,\,l=1,\ldots ,K.\end{aligned}}}

Этап 3: Предшествующий

σ 2 π ( σ 2 ) , s p a c e r α l π ( α l ) , s p a c e r ( β l 1 , , β l b , , β l P ) π ( β l 1 , , β l b , , β l P ) , s p a c e r ω l 2 π ( ω l 2 ) , s p a c e r l = 1 , , K . {\displaystyle {\begin{aligned}&\sigma ^{2}\sim \pi (\sigma ^{2}),\\{\phantom {spacer}}\\&\alpha _{l}\sim \pi (\alpha _{l}),\\{\phantom {spacer}}\\&(\beta _{l1},\ldots ,\beta _{lb},\ldots ,\beta _{lP})\sim \pi (\beta _{l1},\ldots ,\beta _{lb},\ldots ,\beta _{lP}),\\{\phantom {spacer}}\\&\omega _{l}^{2}\sim \pi (\omega _{l}^{2}),\\{\phantom {spacer}}\\&l=1,\ldots ,K.\end{aligned}}}

Здесь обозначает непрерывную реакцию -го субъекта в момент времени , а - -й ковариат -го субъекта. Параметры, участвующие в модели, записаны греческими буквами. - известная функция, параметризованная -мерным вектором . Обычно - `нелинейная' функция, описывающая временную траекторию индивидуумов. В модели и описывают внутрииндивидуальную и межиндивидуальную изменчивость соответственно. Если этап 3: априорный не рассматривается, то модель сводится к частотной нелинейной модели со смешанными эффектами. y i j {\displaystyle y_{ij}} i {\displaystyle i} t i j {\displaystyle t_{ij}} x i b {\displaystyle x_{ib}} b {\displaystyle b} i {\displaystyle i} f ( t ; θ 1 , , θ K ) {\displaystyle f(t;\theta _{1},\ldots ,\theta _{K})} K {\displaystyle K} ( θ 1 , , θ K ) {\displaystyle (\theta _{1},\ldots ,\theta _{K})} f {\displaystyle f} ϵ i j {\displaystyle \epsilon _{ij}} η l i {\displaystyle \eta _{li}}

Центральной задачей при применении байесовских нелинейных моделей смешанного эффекта является оценка апостериорной плотности:

π ( { θ l i } i = 1 , l = 1 N , K , σ 2 , { α l } l = 1 K , { β l b } l = 1 , b = 1 K , P , { ω l } l = 1 K | { y i j } i = 1 , j = 1 N , M i ) {\displaystyle \pi (\{\theta _{li}\}_{i=1,l=1}^{N,K},\sigma ^{2},\{\alpha _{l}\}_{l=1}^{K},\{\beta _{lb}\}_{l=1,b=1}^{K,P},\{\omega _{l}\}_{l=1}^{K}|\{y_{ij}\}_{i=1,j=1}^{N,M_{i}})}

π ( { y i j } i = 1 , j = 1 N , M i , { θ l i } i = 1 , l = 1 N , K , σ 2 , { α l } l = 1 K , { β l b } l = 1 , b = 1 K , P , { ω l } l = 1 K ) {\displaystyle \propto \pi (\{y_{ij}\}_{i=1,j=1}^{N,M_{i}},\{\theta _{li}\}_{i=1,l=1}^{N,K},\sigma ^{2},\{\alpha _{l}\}_{l=1}^{K},\{\beta _{lb}\}_{l=1,b=1}^{K,P},\{\omega _{l}\}_{l=1}^{K})}

=   π ( { y i j } i = 1 , j = 1 N , M i | { θ l i } i = 1 , l = 1 N , K , σ 2 ) } Stage 1: Individual-Level Model s p a c e r ×   π ( { θ l i } i = 1 , l = 1 N , K | { α l } l = 1 K , { β l b } l = 1 , b = 1 K , P , { ω l } l = 1 K ) } Stage 2: Population Model s p a c e r ×   p ( σ 2 , { α l } l = 1 K , { β l b } l = 1 , b = 1 K , P , { ω l } l = 1 K ) } Stage 3: Prior {\displaystyle {\begin{aligned}=&~\left.{\pi (\{y_{ij}\}_{i=1,j=1}^{N,M_{i}}|\{\theta _{li}\}_{i=1,l=1}^{N,K},\sigma ^{2})}\right\}{\text{Stage 1: Individual-Level Model}}\\{\phantom {spacer}}\\\times &~\left.{\pi (\{\theta _{li}\}_{i=1,l=1}^{N,K}|\{\alpha _{l}\}_{l=1}^{K},\{\beta _{lb}\}_{l=1,b=1}^{K,P},\{\omega _{l}\}_{l=1}^{K})}\right\}{\text{Stage 2: Population Model}}\\{\phantom {spacer}}\\\times &~\left.{p(\sigma ^{2},\{\alpha _{l}\}_{l=1}^{K},\{\beta _{lb}\}_{l=1,b=1}^{K,P},\{\omega _{l}\}_{l=1}^{K})}\right\}{\text{Stage 3: Prior}}\end{aligned}}}

Панель справа отображает байесовский исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов. [19] Исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов состоит из двух этапов: (a) стандартный исследовательский цикл и (b) байесовский рабочий процесс. Стандартный исследовательский цикл включает обзор литературы, определение проблемы и указание исследовательского вопроса и гипотезы. Байесовский рабочий процесс состоит из трех подэтапов: (b)–(i) формализация априорных распределений на основе фоновых знаний и априорного выявления; (b)–(ii) определение функции правдоподобия на основе нелинейной функции ; и (b)–(iii) выполнение апостериорного вывода. Полученный апостериорный вывод может быть использован для начала нового исследовательского цикла. f {\displaystyle f}

Смотрите также

Ссылки

  1. ^ abcde Bryk, Stephen W. Raudenbush, Anthony S. (2002). Иерархические линейные модели: приложения и методы анализа данных (2-е изд., [3-е изд.]). Thousand Oaks, CA [ua]: Sage Publications. ISBN 978-0-7619-1904-9.{{cite book}}: CS1 maint: multiple names: authors list (link)
  2. ^ abcdefghijkl Фиделл, Барбара Г. Табачник, Линда С. (2007). Использование многомерной статистики (5-е изд.). Бостон; Монреаль: Пирсон / A & B. ISBN 978-0-205-45938-4.{{cite book}}: CS1 maint: multiple names: authors list (link)
  3. ^ Люк, Дуглас А. (2004). Многоуровневое моделирование (3-е переиздание). Thousand Oaks, CA: Sage. ISBN 978-0-7619-2879-9.
  4. ^ abcdefg Гомес, Дилан GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID  35116198. 
  5. ^ abcdefghijkl Коэн, Якоб (3 октября 2003 г.). Прикладной множественный регрессионный/корреляционный анализ для поведенческих наук (3-е изд.). Mahwah, NJ [ua]: Erlbaum. ISBN 978-0-8058-2223-6.
  6. ^ Ли, Се Юн; Лей, Боуэн; Маллик, Бани (2020). «Оценка кривых распространения COVID-19 с учетом глобальных данных и заимствованной информации». PLOS ONE . 15 (7): e0236860. arXiv : 2005.00662 . Bibcode : 2020PLoSO..1536860L. doi : 10.1371/journal.pone.0236860 . PMC 7390340. PMID  32726361 . 
  7. ^ ab Lee, Se Yoon; Mallick, Bani (2021). «Байесовское иерархическое моделирование: применение к результатам добычи в сланцевом месторождении Игл-Форд в Южном Техасе». Sankhya B. 84 : 1–43. doi :10.1007/s13571-020-00245-8. S2CID  234027590.
  8. ^ редактор, G. David Garson (10 апреля 2012 г.). Иерархическое линейное моделирование: руководство и приложения . Thousand Oaks, Калифорния: Sage Publications. ISBN 978-1-4129-9885-7. {{cite book}}: |last=имеет общее название ( помощь )
  9. ^ abcd Salkind, Samuel B. Green, Neil J. (2004). Использование SPSS для Windows и Macintosh: анализ и понимание данных (4-е изд.). Upper Saddle River, NJ: Pearson Education. ISBN 978-0-13-146597-8.{{cite book}}: CS1 maint: multiple names: authors list (link)
  10. ^ Голдстейн, Харви (1991). «Нелинейные многоуровневые модели с применением к дискретным данным отклика». Biometrika . 78 (1): 45–51. doi :10.1093/biomet/78.1.45. JSTOR  2336894.
  11. ^ ATS Statistical Consulting Group. "Введение в многоуровневое моделирование с использованием HLM 6" (PDF) . Архивировано из оригинала (PDF) 31 декабря 2010 г.
  12. ^ abc Антонакис, Джон; Бастардоз, Николас; Рёнккё, Микко (2021). «Об игнорировании предположения о случайных эффектах в многоуровневых моделях: обзор, критика и рекомендации» (PDF) . Методы организационных исследований . 24 (2): 443–483. doi : 10.1177/1094428119877457. ISSN  1094-4281. S2CID  210355362.
  13. ^ Макнейш, Дэниел; Келли, Кен (2019). «Модели с фиксированными эффектами против моделей со смешанными эффектами для кластеризованных данных: обзор подходов, выявление различий и выработка рекомендаций» . Психологические методы . 24 (1): 20–35. doi :10.1037/met0000182. ISSN  1939-1463. PMID  29863377. S2CID  44145669.
  14. ^ Bliese, Paul D.; Schepker, Donald J.; Essman, Spenser M.; Ployhart, Robert E. (2020). «Преодоление методологических различий между макро- и микроисследованиями: эндогенность и методы для панельных данных». Journal of Management . 46 (1): 70–99. doi : 10.1177/0149206319868016. ISSN  0149-2063. S2CID  202288849.
  15. ^ Вулдридж, Джеффри М. (1 октября 2010 г.). Эконометрический анализ данных поперечного сечения и панельных данных, второе издание. MIT Press. ISBN 978-0-262-29679-3.
  16. ^ abc Leeuw, Ita Kreft, Jan de (1998). Введение в многоуровневое моделирование (переиздание). Лондон: Sage Publications Ltd. ISBN 978-0-7619-5141-4.{{cite book}}: CS1 maint: multiple names: authors list (link)
  17. ^ Hox, Joop (2002). Многоуровневый анализ: методы и приложения (Переиздание. ред.). Mahwah, NJ [ua]: Erlbaum. ISBN 978-0-8058-3219-8.
  18. ^ ab Bryk, Anthony S.; Raudenbush, Stephen W. (1 января 1988 г.). «Гетерогенность дисперсии в экспериментальных исследованиях: вызов общепринятым интерпретациям». Psychological Bulletin . 104 (3): 396–404. doi :10.1037/0033-2909.104.3.396.
  19. ^ ab Lee, Se Yoon (2022). «Байесовские нелинейные модели для данных повторных измерений: обзор, реализация и приложения». Математика . 10 (6): 898. arXiv : 2201.12430 . doi : 10.3390/math10060898 .

Дальнейшее чтение

  • Гельман, А.; Хилл, Дж. (2007). Анализ данных с использованием регрессии и многоуровневых/иерархических моделей. Нью-Йорк: Cambridge University Press. С. 235–299. ISBN 978-0-521-68689-1.
  • Голдштейн, Х. (2011). Многоуровневые статистические модели (4-е изд.). Лондон: Wiley. ISBN 978-0-470-74865-7.
  • Хедекер, Д.; Гиббонс, Р.Д. (2012). Анализ продольных данных (2-е изд.). Нью-Йорк: Wiley. ISBN 978-0-470-88918-3.
  • Хокс, Дж. Дж. (2010). Многоуровневый анализ: методы и приложения (2-е изд.). Нью-Йорк: Routledge. ISBN 978-1-84872-845-5.
  • Raudenbush, SW; Bryk, AS (2002). Иерархические линейные модели: приложения и методы анализа данных (2-е изд.). Thousand Oaks, CA: Sage. Основное внимание уделяется образованию.
  • Snijders, TAB; Bosker, RJ (2011). Многоуровневый анализ: введение в базовое и расширенное многоуровневое моделирование (2-е изд.). Лондон: Sage. ISBN 9781446254332.
  • Свами, ПАВБ ; Тавлас, Джордж С. (2001). «Модели случайных коэффициентов». В Baltagi, Бади Х. (ред.). Спутник теоретической эконометрики . Оксфорд: Blackwell. стр. 410–429. ISBN 978-0-631-21254-6.
  • Вербеке, Г.; Моленбергс, Г. (2013). Линейные смешанные модели для продольных данных . Springer.Включает код SAS
  • Гомес, Дилан GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC  8784019 . PMID  35116198.
  • Центр многоуровневого моделирования
Retrieved from "https://en.wikipedia.org/w/index.php?title=Multilevel_model&oldid=1253657562"