Модель с фиксированными эффектами

Статистическая модель

В статистике модель с фиксированными эффектами — это статистическая модель , в которой параметры модели являются фиксированными или неслучайными величинами. Это контрастирует с моделями со случайными эффектами и смешанными моделями , в которых все или некоторые параметры модели являются случайными величинами. Во многих приложениях, включая эконометрику [1] и биостатистику [2] [3] [4] [5] [6], модель с фиксированными эффектами относится к регрессионной модели, в которой групповые средние значения фиксированы (неслучайны), в отличие от модели со случайными эффектами, в которой групповые средние значения являются случайной выборкой из популяции. [7] [6] Как правило, данные можно сгруппировать в соответствии с несколькими наблюдаемыми факторами. Групповые средние значения могут быть смоделированы как фиксированные или случайные эффекты для каждой группы. В модели с фиксированными эффектами каждое групповое среднее значение является фиксированной величиной, специфичной для группы.

В панельных данных , где существуют продольные наблюдения для одного и того же субъекта, фиксированные эффекты представляют собой специфические для субъекта средние значения. В анализе панельных данных термин оценщик фиксированных эффектов (также известный как внутренний оценщик ) используется для обозначения оценщика коэффициентов в регрессионной модели, включая эти фиксированные эффекты (один инвариантный во времени отсекаемый элемент для каждого субъекта).

Качественное описание

Такие модели помогают контролировать смещение пропущенных переменных из-за ненаблюдаемой неоднородности, когда эта неоднородность постоянна во времени. Эту неоднородность можно удалить из данных с помощью дифференциации, например, вычитая среднее значение на уровне группы во времени или взяв первую разность , которая удалит любые инвариантные во времени компоненты модели.

Существует два распространенных предположения относительно индивидуального специфического эффекта: предположение о случайных эффектах и ​​предположение о фиксированных эффектах. Предположение о случайных эффектах заключается в том, что индивидуально-специфические эффекты не коррелируют с независимыми переменными. Предположение о фиксированных эффектах заключается в том, что индивидуально-специфические эффекты коррелируют с независимыми переменными. Если предположение о случайных эффектах выполняется, то оценка случайных эффектов более эффективна , чем оценка фиксированных эффектов. Однако, если это предположение не выполняется, то оценка случайных эффектов не является последовательной . Тест Дурбина–Ву–Хаусмана часто используется для различения моделей с фиксированными и случайными эффектами. [8] [9]

Формальная модель и предположения

Рассмотрим линейную модель ненаблюдаемых эффектов для наблюдений и периодов времени: N {\displaystyle N} T {\displaystyle T}

y i t = X i t β + α i + u i t {\displaystyle y_{it}=X_{it}\mathbf {\beta } +\alpha _{i}+u_{it}} для и t = 1 , , T {\displaystyle t=1,\dots ,T} i = 1 , , N {\displaystyle i=1,\dots ,N}

Где:

  • y i t {\displaystyle y_{it}} является зависимой переменной, наблюдаемой для индивидуума в момент времени . i {\displaystyle i} t {\displaystyle t}
  • X i t {\displaystyle X_{it}} — вектор регрессора, зависящий от времени (числа независимых переменных). 1 × k {\displaystyle 1\times k}
  • β {\displaystyle \beta } — матрица параметров. k × 1 {\displaystyle k\times 1}
  • α i {\displaystyle \alpha _{i}} это ненаблюдаемый неизменный во времени индивидуальный эффект. Например, врожденная способность для отдельных лиц или исторические и институциональные факторы для стран.
  • u i t {\displaystyle u_{it}} является ошибочным термином .

В отличие от , не может наблюдаться напрямую. X i t {\displaystyle X_{it}} α i {\displaystyle \alpha _{i}}

В отличие от модели случайных эффектов , где ненаблюдаемое не зависит от для всех , модель фиксированных эффектов (FE) позволяет коррелировать с матрицей регрессора . Строгая экзогенность в отношении идиосинкразического члена ошибки все еще требуется. α i {\displaystyle \alpha _{i}} X i t {\displaystyle X_{it}} t = 1 , . . . , T {\displaystyle t=1,...,T} α i {\displaystyle \alpha _{i}} X i t {\displaystyle X_{it}} u i t {\displaystyle u_{it}}

Статистическая оценка

Оценщик фиксированных эффектов

Поскольку не наблюдается, его нельзя контролировать напрямую . Модель FE устраняет путем обесценивания переменных с помощью преобразования внутри : α i {\displaystyle \alpha _{i}} α i {\displaystyle \alpha _{i}}

y i t y ¯ i = ( X i t X ¯ i ) β + ( α i α ¯ i ) + ( u i t u ¯ i ) y ¨ i t = X ¨ i t β + u ¨ i t {\displaystyle y_{it}-{\overline {y}}_{i}=\left(X_{it}-{\overline {X}}_{i}\right)\beta +\left(\alpha _{i}-{\overline {\alpha }}_{i}\right)+\left(u_{it}-{\overline {u}}_{i}\right)\implies {\ddot {y}}_{it}={\ddot {X}}_{it}\beta +{\ddot {u}}_{it}}

где , , и . y ¯ i = 1 T t = 1 T y i t {\displaystyle {\overline {y}}_{i}={\frac {1}{T}}\sum \limits _{t=1}^{T}y_{it}} X ¯ i = 1 T t = 1 T X i t {\displaystyle {\overline {X}}_{i}={\frac {1}{T}}\sum \limits _{t=1}^{T}X_{it}} u ¯ i = 1 T t = 1 T u i t {\displaystyle {\overline {u}}_{i}={\frac {1}{T}}\sum \limits _{t=1}^{T}u_{it}}

Так как является константой, и, следовательно, эффект устраняется. Затем оценка FE получается с помощью регрессии OLS на . α i {\displaystyle \alpha _{i}} α i ¯ = α i {\displaystyle {\overline {\alpha _{i}}}=\alpha _{i}} β ^ F E {\displaystyle {\hat {\beta }}_{FE}} y ¨ {\displaystyle {\ddot {y}}} X ¨ {\displaystyle {\ddot {X}}}

Существуют по крайней мере три альтернативы внутренней трансформации с вариациями.

Один из них заключается в добавлении фиктивной переменной для каждого индивидуума (исключая первого индивидуума из-за мультиколлинеарности ). Это численно, но не вычислительно, эквивалентно модели с фиксированным эффектом и работает только в том случае, если сумма числа серий и числа глобальных параметров меньше числа наблюдений. [10] Подход с фиктивной переменной особенно требователен с точки зрения использования памяти компьютера и не рекомендуется для задач, превышающих доступную оперативную память и компиляцию прикладной программы. i > 1 {\displaystyle i>1}

Вторая альтернатива — использовать подход последовательных повторений для локальных и глобальных оценок. [11] Этот подход очень подходит для систем с небольшим объемом памяти, в которых он гораздо более эффективен с вычислительной точки зрения, чем подход с фиктивной переменной.

Третий подход представляет собой вложенную оценку, при которой локальная оценка для отдельных рядов программируется как часть определения модели. [12] Этот подход является наиболее эффективным с точки зрения вычислений и памяти, но он требует профессиональных навыков программирования и доступа к программному коду модели; хотя его можно запрограммировать, в том числе в SAS. [13] [14]

Наконец, каждая из вышеперечисленных альтернатив может быть улучшена, если оценка, специфичная для ряда, является линейной (в рамках нелинейной модели), и в этом случае прямое линейное решение для отдельных рядов может быть запрограммировано как часть определения нелинейной модели. [15]

Оценка первой разности

Альтернативой внутреннему преобразованию является первое разностное преобразование, которое дает другую оценку. Для : t = 2 , , T {\displaystyle t=2,\dots ,T}

y i t y i , t 1 = ( X i t X i , t 1 ) β + ( α i α i ) + ( u i t u i , t 1 ) Δ y i t = Δ X i t β + Δ u i t . {\displaystyle y_{it}-y_{i,t-1}=\left(X_{it}-X_{i,t-1}\right)\beta +\left(\alpha _{i}-\alpha _{i}\right)+\left(u_{it}-u_{i,t-1}\right)\implies \Delta y_{it}=\Delta X_{it}\beta +\Delta u_{it}.}

Затем оценка FD получается с помощью регрессии OLS на . β ^ F D {\displaystyle {\hat {\beta }}_{FD}} Δ y i t {\displaystyle \Delta y_{it}} Δ X i t {\displaystyle \Delta X_{it}}

Когда , оценки первой разности и фиксированных эффектов численно эквивалентны. Для , они не эквивалентны. Если члены ошибки гомоскедастичны без последовательной корреляции , оценка фиксированных эффектов более эффективна , чем оценка первой разности. Однако, если следует случайному блужданию , оценка первой разности более эффективна. [16] T = 2 {\displaystyle T=2} T > 2 {\displaystyle T>2} u i t {\displaystyle u_{it}} u i t {\displaystyle u_{it}}

Равенство фиксированных эффектов и оценок первой разности при T=2

Для специального двухпериодного случая ( ) оценка фиксированных эффектов (FE) и оценка первой разности (FD) численно эквивалентны. Это происходит потому, что оценка FE фактически «удваивает набор данных», используемый в оценке FD. Чтобы увидеть это, установим, что оценка фиксированных эффектов равна: T = 2 {\displaystyle T=2} F E T = 2 = [ ( x i 1 x ¯ i ) ( x i 1 x ¯ i ) + ( x i 2 x ¯ i ) ( x i 2 x ¯ i ) ] 1 [ ( x i 1 x ¯ i ) ( y i 1 y ¯ i ) + ( x i 2 x ¯ i ) ( y i 2 y ¯ i ) ] {\displaystyle {FE}_{T=2}=\left[(x_{i1}-{\bar {x}}_{i})(x_{i1}-{\bar {x}}_{i})'+(x_{i2}-{\bar {x}}_{i})(x_{i2}-{\bar {x}}_{i})'\right]^{-1}\left[(x_{i1}-{\bar {x}}_{i})(y_{i1}-{\bar {y}}_{i})+(x_{i2}-{\bar {x}}_{i})(y_{i2}-{\bar {y}}_{i})\right]}

Поскольку каждое из них можно переписать как , мы перепишем строку как: ( x i 1 x ¯ i ) {\displaystyle (x_{i1}-{\bar {x}}_{i})} ( x i 1 x i 1 + x i 2 2 ) = x i 1 x i 2 2 {\displaystyle (x_{i1}-{\dfrac {x_{i1}+x_{i2}}{2}})={\dfrac {x_{i1}-x_{i2}}{2}}}

F E T = 2 = [ i = 1 N x i 1 x i 2 2 x i 1 x i 2 2 + x i 2 x i 1 2 x i 2 x i 1 2 ] 1 [ i = 1 N x i 1 x i 2 2 y i 1 y i 2 2 + x i 2 x i 1 2 y i 2 y i 1 2 ] {\displaystyle {FE}_{T=2}=\left[\sum _{i=1}^{N}{\dfrac {x_{i1}-x_{i2}}{2}}{\dfrac {x_{i1}-x_{i2}}{2}}'+{\dfrac {x_{i2}-x_{i1}}{2}}{\dfrac {x_{i2}-x_{i1}}{2}}'\right]^{-1}\left[\sum _{i=1}^{N}{\dfrac {x_{i1}-x_{i2}}{2}}{\dfrac {y_{i1}-y_{i2}}{2}}+{\dfrac {x_{i2}-x_{i1}}{2}}{\dfrac {y_{i2}-y_{i1}}{2}}\right]}

= [ i = 1 N 2 x i 2 x i 1 2 x i 2 x i 1 2 ] 1 [ i = 1 N 2 x i 2 x i 1 2 y i 2 y i 1 2 ] {\displaystyle =\left[\sum _{i=1}^{N}2{\dfrac {x_{i2}-x_{i1}}{2}}{\dfrac {x_{i2}-x_{i1}}{2}}'\right]^{-1}\left[\sum _{i=1}^{N}2{\dfrac {x_{i2}-x_{i1}}{2}}{\dfrac {y_{i2}-y_{i1}}{2}}\right]}
= 2 [ i = 1 N ( x i 2 x i 1 ) ( x i 2 x i 1 ) ] 1 [ i = 1 N 1 2 ( x i 2 x i 1 ) ( y i 2 y i 1 ) ] {\displaystyle =2\left[\sum _{i=1}^{N}(x_{i2}-x_{i1})(x_{i2}-x_{i1})'\right]^{-1}\left[\sum _{i=1}^{N}{\frac {1}{2}}(x_{i2}-x_{i1})(y_{i2}-y_{i1})\right]}
= [ i = 1 N ( x i 2 x i 1 ) ( x i 2 x i 1 ) ] 1 i = 1 N ( x i 2 x i 1 ) ( y i 2 y i 1 ) = F D T = 2 {\displaystyle =\left[\sum _{i=1}^{N}(x_{i2}-x_{i1})(x_{i2}-x_{i1})'\right]^{-1}\sum _{i=1}^{N}(x_{i2}-x_{i1})(y_{i2}-y_{i1})={FD}_{T=2}}

Метод Чемберлена

Метод Гэри Чемберлена, обобщение внутренней оценки, заменяет ее линейной проекцией на объясняющие переменные. Записываем линейную проекцию как: α i {\displaystyle \alpha _{i}}

α i = λ 0 + X i 1 λ 1 + X i 2 λ 2 + + X i T λ T + e i {\displaystyle \alpha _{i}=\lambda _{0}+X_{i1}\lambda _{1}+X_{i2}\lambda _{2}+\dots +X_{iT}\lambda _{T}+e_{i}}

в результате получается следующее уравнение:

y i t = λ 0 + X i 1 λ 1 + X i 2 λ 2 + + X i t ( λ t + β ) + + X i T λ T + e i + u i t {\displaystyle y_{it}=\lambda _{0}+X_{i1}\lambda _{1}+X_{i2}\lambda _{2}+\dots +X_{it}(\lambda _{t}+\mathbf {\beta } )+\dots +X_{iT}\lambda _{T}+e_{i}+u_{it}}

который можно оценить с помощью оценки минимального расстояния . [17]

Метод Хаусмана–Тейлора

Необходимо иметь более одного регрессора, изменяющегося во времени ( ), и регрессора, не изменяющегося во времени ( ), а также по крайней мере один и один , которые не коррелируют с . X {\displaystyle X} Z {\displaystyle Z} X {\displaystyle X} Z {\displaystyle Z} α i {\displaystyle \alpha _{i}}

Разделите переменные и таким образом, чтобы и не были коррелированы с . Необходимо . X {\displaystyle X} Z {\displaystyle Z} X = [ X 1 i t T N × K 1 X 2 i t T N × K 2 ] Z = [ Z 1 i t T N × G 1 Z 2 i t T N × G 2 ] {\displaystyle {\begin{array}{c}X=[{\underset {TN\times K1}{X_{1it}}}\vdots {\underset {TN\times K2}{X_{2it}}}]\\Z=[{\underset {TN\times G1}{Z_{1it}}}\vdots {\underset {TN\times G2}{Z_{2it}}}]\end{array}}} X 1 {\displaystyle X_{1}} Z 1 {\displaystyle Z_{1}} α i {\displaystyle \alpha _{i}} K 1 > G 2 {\displaystyle K1>G2}

Оценка с помощью МНК при использовании и в качестве инструментов дает согласованную оценку. γ {\displaystyle \gamma } d i ^ = Z i γ + φ i t {\displaystyle {\widehat {di}}=Z_{i}\gamma +\varphi _{it}} X 1 {\displaystyle X_{1}} Z 1 {\displaystyle Z_{1}}

Обобщение с неопределенностью входных данных

Когда для данных имеется неопределенность на входе , то следует минимизировать значение, а не сумму квадратов остатков. [18] Этого можно напрямую добиться с помощью правил подстановки: y {\displaystyle y} δ y {\displaystyle \delta y} χ 2 {\displaystyle \chi ^{2}}

y i t δ y i t = β X i t δ y i t + α i 1 δ y i t + u i t δ y i t {\displaystyle {\frac {y_{it}}{\delta y_{it}}}=\mathbf {\beta } {\frac {X_{it}}{\delta y_{it}}}+\alpha _{i}{\frac {1}{\delta y_{it}}}+{\frac {u_{it}}{\delta y_{it}}}} ,

тогда значения и стандартные отклонения для и могут быть определены с помощью классического обычного анализа наименьших квадратов и матрицы дисперсии-ковариации . β {\displaystyle \mathbf {\beta } } α i {\displaystyle \alpha _{i}}

Используйте для проверки согласованности

Оценки случайных эффектов могут быть непоследовательными иногда в пределе длинных временных рядов, если случайные эффекты неправильно определены (т. е. модель, выбранная для случайных эффектов, неверна). Однако модель с фиксированными эффектами может быть последовательна в некоторых ситуациях. Например, если моделируемый временной ряд не является стационарным, модели случайных эффектов, предполагающие стационарность, могут быть непоследовательными в пределе длинных рядов. Одним из примеров этого является ситуация, когда временной ряд имеет тенденцию к росту. Затем, по мере того как ряд становится длиннее, модель пересматривает оценки для среднего значения более ранних периодов в сторону увеличения, давая все более смещенные прогнозы коэффициентов. Однако модель с фиксированными временными эффектами не объединяет информацию во времени, и в результате более ранние оценки не будут затронуты.

В таких ситуациях, когда известно, что модель с фиксированными эффектами является последовательной, тест Дурбина-Ву-Хаусмана можно использовать для проверки последовательности выбранной модели со случайными эффектами. Если истинно, то и то , и то являются последовательными, но только то эффективно. Если истинно, то последовательность не может быть гарантирована. H 0 {\displaystyle H_{0}} β ^ R E {\displaystyle {\widehat {\beta }}_{RE}} β ^ F E {\displaystyle {\widehat {\beta }}_{FE}} β ^ R E {\displaystyle {\widehat {\beta }}_{RE}} H a {\displaystyle H_{a}} β ^ R E {\displaystyle {\widehat {\beta }}_{RE}}

Смотрите также

Примечания

  1. ^ Грин, WH, 2011. Эконометрический анализ , 7-е изд., Prentice Hall
  2. ^ Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр.  169–171 . ISBN. 0-19-852484-6.
  3. ^ Фицморис, Гарретт М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной лонгитюдный анализ . Хобокен: John Wiley & Sons. стр.  326–328 . ISBN 0-471-21487-6.
  4. ^ Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974 . doi :10.2307/2529876. JSTOR  2529876.
  5. ^ Гардинер, Джозеф К.; Луо, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221– 239. doi :10.1002/sim.3478. PMID  19012297. S2CID  16277040.
  6. ^ ab Gomes, Dylan GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID  35116198. 
  7. ^ Рэмси, Ф., Шефер, Д., 2002. Статистический сыщик: курс по методам анализа данных , 2-е изд. Duxbury Press
  8. ^ Кэмерон, А. Колин; Триведи, Правин К. (2005). Микроэконометрика: методы и приложения. Cambridge University Press. С.  717–19 . ISBN 9780521848053.
  9. ^ Нерлав, Марк (2005). Эссе по эконометрике панельных данных. Cambridge University Press. С.  36–39 . ISBN 9780521022460.
  10. ^ Гарсия, Оскар. (1983). «Модель стохастического дифференциального уравнения для роста высоты лесных насаждений». Биометрия . 39 (4): 1059– 1072. doi :10.2307/2531339. JSTOR  2531339.
  11. ^ Тейт, Дэвид; Цешевски, Крис Дж.; Белла, Имре Э. (1986). «Динамика насаждений сосны скрученной широкохвойной». Can. J. For. Res . 18 (10): 1255– 1260. doi :10.1139/x88-193.
  12. ^ Strub, Mike; Cieszewski, Chris J. (2006). «Свойства инвариантности базового возраста двух методов оценки параметров моделей индекса участка». Forest Science . 52 (2): 182– 186. doi :10.1093/forestscience/52.2.182.
  13. ^ Strub, Mike; Cieszewski, Chris J. (2003). Burkhart, HA (ред.). Fitting global site index settings when plot or tree site index is treatised as a local luisance option . Труды симпозиума по статистике и информационным технологиям в лесном хозяйстве; 8–12 сентября 2002 г.; Блэксбург, Вирджиния: Политехнический институт и государственный университет Вирджинии. С.  97–107 .
  14. ^ Цешевски, Крис Дж.; Харрисон, Майк; Мартин, Стейси В. (2000). «Практические методы оценки несмещенных параметров в самореферентных моделях роста и урожайности» (PDF) . Технический отчет PMRC . 2000 (7): 12.
  15. ^ Шнуте, Джон; МакКиннелл, Скип (1984). «Биологически значимый подход к анализу поверхности отклика». Can. J. Fish. Aquat. Sci . 41 (6): 936–953 . doi :10.1139/f84-108.
  16. ^ Вулдридж, Джеффри М. (2001). Эконометрический анализ данных поперечного сечения и панельных данных . MIT Press. С. 279–291. ISBN 978-0-262-23219-7.
  17. ^ Чемберлен, Гэри (1984). Глава 22 Панельные данные . Справочник по эконометрике. Том 2. С.  1247–1318 . doi :10.1016/S1573-4412(84)02014-6. ISBN 9780444861863. ISSN  1573-4412.
  18. ^ Ren, Bin; Dong, Ruobing; Esposito, Thomas M.; Pueyo, Laurent; Debes, John H.; Poteet, Charles A.; Choquet, Élodie; Benisty, Myriam; Chiang, Eugene; Grady, Carol A.; Hines, Dean C.; Schneider, Glenn; Soummer, Rémi (2018). «Десятилетие изображений диска MWC 758: где планеты, движущиеся по спиральным рукавам?». The Astrophysical Journal Letters . 857 (1): L9. arXiv : 1803.06776 . Bibcode : 2018ApJ...857L...9R. doi : 10.3847/2041-8213/aab7f5 . S2CID  59427417.

Ссылки

  • Кристенсен, Рональд (2002). Плоские ответы на сложные вопросы: Теория линейных моделей (третье изд.). Нью-Йорк: Springer. ISBN 0-387-95361-2.
  • Гуджарати, Дамодар Н.; Портер, Дон К. (2009). «Модели регрессии панельных данных». Основы эконометрики (Пятое международное издание). Бостон: McGraw-Hill. С.  591– 616. ISBN 978-007-127625-2.
  • Сяо, Ченг (2003). «Модели с фиксированными эффектами». Анализ панельных данных (2-е изд.). Нью-Йорк: Cambridge University Press. С.  95–103 . ISBN 0-521-52271-4.
  • Вулдридж, Джеффри М. (2013). «Оценка фиксированных эффектов». Введение в эконометрику: современный подход (Пятое международное издание). Мейсон, Огайо: Юго-Западный. С.  466–474 . ISBN 978-1-111-53439-4.
  • Модели с фиксированными и случайными эффектами
  • Примеры всех моделей ANOVA и ANCOVA с тремя факторами лечения, включая рандомизированный блок, разделенный график, повторные измерения и латинские квадраты, а также их анализ в R
Retrieved from "https://en.wikipedia.org/w/index.php?title=Fixed_effects_model&oldid=1266873789"