В статистике модель с фиксированными эффектами — это статистическая модель , в которой параметры модели являются фиксированными или неслучайными величинами. Это контрастирует с моделями со случайными эффектами и смешанными моделями , в которых все или некоторые параметры модели являются случайными величинами. Во многих приложениях, включая эконометрику [1] и биостатистику [2] [3] [4] [5] [6], модель с фиксированными эффектами относится к регрессионной модели, в которой групповые средние значения фиксированы (неслучайны), в отличие от модели со случайными эффектами, в которой групповые средние значения являются случайной выборкой из популяции. [7] [6] Как правило, данные можно сгруппировать в соответствии с несколькими наблюдаемыми факторами. Групповые средние значения могут быть смоделированы как фиксированные или случайные эффекты для каждой группы. В модели с фиксированными эффектами каждое групповое среднее значение является фиксированной величиной, специфичной для группы.
В панельных данных , где существуют продольные наблюдения для одного и того же субъекта, фиксированные эффекты представляют собой специфические для субъекта средние значения. В анализе панельных данных термин оценщик фиксированных эффектов (также известный как внутренний оценщик ) используется для обозначения оценщика коэффициентов в регрессионной модели, включая эти фиксированные эффекты (один инвариантный во времени отсекаемый элемент для каждого субъекта).
Качественное описание
Такие модели помогают контролировать смещение пропущенных переменных из-за ненаблюдаемой неоднородности, когда эта неоднородность постоянна во времени. Эту неоднородность можно удалить из данных с помощью дифференциации, например, вычитая среднее значение на уровне группы во времени или взяв первую разность , которая удалит любые инвариантные во времени компоненты модели.
Существует два распространенных предположения относительно индивидуального специфического эффекта: предположение о случайных эффектах и предположение о фиксированных эффектах. Предположение о случайных эффектах заключается в том, что индивидуально-специфические эффекты не коррелируют с независимыми переменными. Предположение о фиксированных эффектах заключается в том, что индивидуально-специфические эффекты коррелируют с независимыми переменными. Если предположение о случайных эффектах выполняется, то оценка случайных эффектов более эффективна , чем оценка фиксированных эффектов. Однако, если это предположение не выполняется, то оценка случайных эффектов не является последовательной . Тест Дурбина–Ву–Хаусмана часто используется для различения моделей с фиксированными и случайными эффектами. [8] [9]
Формальная модель и предположения
Рассмотрим линейную модель ненаблюдаемых эффектов для наблюдений и периодов времени:
для и
Где:
является зависимой переменной, наблюдаемой для индивидуума в момент времени .
— вектор регрессора, зависящий от времени (числа независимых переменных).
— матрица параметров.
это ненаблюдаемый неизменный во времени индивидуальный эффект. Например, врожденная способность для отдельных лиц или исторические и институциональные факторы для стран.
В отличие от модели случайных эффектов , где ненаблюдаемое не зависит от для всех , модель фиксированных эффектов (FE) позволяет коррелировать с матрицей регрессора . Строгая экзогенность в отношении идиосинкразического члена ошибки все еще требуется.
Статистическая оценка
Оценщик фиксированных эффектов
Поскольку не наблюдается, его нельзя контролировать напрямую . Модель FE устраняет путем обесценивания переменных с помощью преобразования внутри :
где , , и .
Так как является константой, и, следовательно, эффект устраняется. Затем оценка FE получается с помощью регрессии OLS на .
Существуют по крайней мере три альтернативы внутренней трансформации с вариациями.
Один из них заключается в добавлении фиктивной переменной для каждого индивидуума (исключая первого индивидуума из-за мультиколлинеарности ). Это численно, но не вычислительно, эквивалентно модели с фиксированным эффектом и работает только в том случае, если сумма числа серий и числа глобальных параметров меньше числа наблюдений. [10] Подход с фиктивной переменной особенно требователен с точки зрения использования памяти компьютера и не рекомендуется для задач, превышающих доступную оперативную память и компиляцию прикладной программы.
Вторая альтернатива — использовать подход последовательных повторений для локальных и глобальных оценок. [11] Этот подход очень подходит для систем с небольшим объемом памяти, в которых он гораздо более эффективен с вычислительной точки зрения, чем подход с фиктивной переменной.
Третий подход представляет собой вложенную оценку, при которой локальная оценка для отдельных рядов программируется как часть определения модели. [12] Этот подход является наиболее эффективным с точки зрения вычислений и памяти, но он требует профессиональных навыков программирования и доступа к программному коду модели; хотя его можно запрограммировать, в том числе в SAS. [13] [14]
Наконец, каждая из вышеперечисленных альтернатив может быть улучшена, если оценка, специфичная для ряда, является линейной (в рамках нелинейной модели), и в этом случае прямое линейное решение для отдельных рядов может быть запрограммировано как часть определения нелинейной модели. [15]
Оценка первой разности
Альтернативой внутреннему преобразованию является первое разностное преобразование, которое дает другую оценку. Для :
Затем оценка FD получается с помощью регрессии OLS на .
Когда , оценки первой разности и фиксированных эффектов численно эквивалентны. Для , они не эквивалентны. Если члены ошибки гомоскедастичны без последовательной корреляции , оценка фиксированных эффектов более эффективна , чем оценка первой разности. Однако, если следует случайному блужданию , оценка первой разности более эффективна. [16]
Равенство фиксированных эффектов и оценок первой разности при T=2
Для специального двухпериодного случая ( ) оценка фиксированных эффектов (FE) и оценка первой разности (FD) численно эквивалентны. Это происходит потому, что оценка FE фактически «удваивает набор данных», используемый в оценке FD. Чтобы увидеть это, установим, что оценка фиксированных эффектов равна:
Поскольку каждое из них можно переписать как , мы перепишем строку как:
Метод Чемберлена
Метод Гэри Чемберлена, обобщение внутренней оценки, заменяет ее линейной проекцией на объясняющие переменные. Записываем линейную проекцию как:
Необходимо иметь более одного регрессора, изменяющегося во времени ( ), и регрессора, не изменяющегося во времени ( ), а также по крайней мере один и один , которые не коррелируют с .
Разделите переменные и таким образом, чтобы и не были коррелированы с . Необходимо .
Оценка с помощью МНК при использовании и в качестве инструментов дает согласованную оценку.
Обобщение с неопределенностью входных данных
Когда для данных имеется неопределенность на входе , то следует минимизировать значение, а не сумму квадратов остатков. [18] Этого можно напрямую добиться с помощью правил подстановки:
Оценки случайных эффектов могут быть непоследовательными иногда в пределе длинных временных рядов, если случайные эффекты неправильно определены (т. е. модель, выбранная для случайных эффектов, неверна). Однако модель с фиксированными эффектами может быть последовательна в некоторых ситуациях. Например, если моделируемый временной ряд не является стационарным, модели случайных эффектов, предполагающие стационарность, могут быть непоследовательными в пределе длинных рядов. Одним из примеров этого является ситуация, когда временной ряд имеет тенденцию к росту. Затем, по мере того как ряд становится длиннее, модель пересматривает оценки для среднего значения более ранних периодов в сторону увеличения, давая все более смещенные прогнозы коэффициентов. Однако модель с фиксированными временными эффектами не объединяет информацию во времени, и в результате более ранние оценки не будут затронуты.
В таких ситуациях, когда известно, что модель с фиксированными эффектами является последовательной, тест Дурбина-Ву-Хаусмана можно использовать для проверки последовательности выбранной модели со случайными эффектами. Если истинно, то и то , и то являются последовательными, но только то эффективно. Если истинно, то последовательность не может быть гарантирована.
^ Грин, WH, 2011. Эконометрический анализ , 7-е изд., Prentice Hall
^ Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171 . ISBN.0-19-852484-6.
^ Фицморис, Гарретт М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной лонгитюдный анализ . Хобокен: John Wiley & Sons. стр. 326–328 . ISBN0-471-21487-6.
^ Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974 . doi :10.2307/2529876. JSTOR 2529876.
^ Гардинер, Джозеф К.; Луо, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221– 239. doi :10.1002/sim.3478. PMID 19012297. S2CID 16277040.
^ ab Gomes, Dylan GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID 35116198.
^ Рэмси, Ф., Шефер, Д., 2002. Статистический сыщик: курс по методам анализа данных , 2-е изд. Duxbury Press
^ Кэмерон, А. Колин; Триведи, Правин К. (2005). Микроэконометрика: методы и приложения. Cambridge University Press. С. 717–19 . ISBN9780521848053.
^ Нерлав, Марк (2005). Эссе по эконометрике панельных данных. Cambridge University Press. С. 36–39 . ISBN9780521022460.
^ Гарсия, Оскар. (1983). «Модель стохастического дифференциального уравнения для роста высоты лесных насаждений». Биометрия . 39 (4): 1059– 1072. doi :10.2307/2531339. JSTOR 2531339.
^ Тейт, Дэвид; Цешевски, Крис Дж.; Белла, Имре Э. (1986). «Динамика насаждений сосны скрученной широкохвойной». Can. J. For. Res . 18 (10): 1255– 1260. doi :10.1139/x88-193.
^ Strub, Mike; Cieszewski, Chris J. (2006). «Свойства инвариантности базового возраста двух методов оценки параметров моделей индекса участка». Forest Science . 52 (2): 182– 186. doi :10.1093/forestscience/52.2.182.
^ Strub, Mike; Cieszewski, Chris J. (2003). Burkhart, HA (ред.). Fitting global site index settings when plot or tree site index is treatised as a local luisance option . Труды симпозиума по статистике и информационным технологиям в лесном хозяйстве; 8–12 сентября 2002 г.; Блэксбург, Вирджиния: Политехнический институт и государственный университет Вирджинии. С. 97–107 .
^ Цешевски, Крис Дж.; Харрисон, Майк; Мартин, Стейси В. (2000). «Практические методы оценки несмещенных параметров в самореферентных моделях роста и урожайности» (PDF) . Технический отчет PMRC . 2000 (7): 12.
^ Шнуте, Джон; МакКиннелл, Скип (1984). «Биологически значимый подход к анализу поверхности отклика». Can. J. Fish. Aquat. Sci . 41 (6): 936–953 . doi :10.1139/f84-108.
^ Вулдридж, Джеффри М. (2001). Эконометрический анализ данных поперечного сечения и панельных данных . MIT Press. С. 279–291. ISBN978-0-262-23219-7.
^ Чемберлен, Гэри (1984). Глава 22 Панельные данные . Справочник по эконометрике. Том 2. С. 1247–1318 . doi :10.1016/S1573-4412(84)02014-6. ISBN9780444861863. ISSN 1573-4412.
^ Ren, Bin; Dong, Ruobing; Esposito, Thomas M.; Pueyo, Laurent; Debes, John H.; Poteet, Charles A.; Choquet, Élodie; Benisty, Myriam; Chiang, Eugene; Grady, Carol A.; Hines, Dean C.; Schneider, Glenn; Soummer, Rémi (2018). «Десятилетие изображений диска MWC 758: где планеты, движущиеся по спиральным рукавам?». The Astrophysical Journal Letters . 857 (1): L9. arXiv : 1803.06776 . Bibcode : 2018ApJ...857L...9R. doi : 10.3847/2041-8213/aab7f5 . S2CID 59427417.
Ссылки
Кристенсен, Рональд (2002). Плоские ответы на сложные вопросы: Теория линейных моделей (третье изд.). Нью-Йорк: Springer. ISBN0-387-95361-2.
Гуджарати, Дамодар Н.; Портер, Дон К. (2009). «Модели регрессии панельных данных». Основы эконометрики (Пятое международное издание). Бостон: McGraw-Hill. С. 591– 616. ISBN978-007-127625-2.
Сяо, Ченг (2003). «Модели с фиксированными эффектами». Анализ панельных данных (2-е изд.). Нью-Йорк: Cambridge University Press. С. 95–103 . ISBN0-521-52271-4.
Вулдридж, Джеффри М. (2013). «Оценка фиксированных эффектов». Введение в эконометрику: современный подход (Пятое международное издание). Мейсон, Огайо: Юго-Западный. С. 466–474 . ISBN978-1-111-53439-4.
Внешние ссылки
Модели с фиксированными и случайными эффектами
Примеры всех моделей ANOVA и ANCOVA с тремя факторами лечения, включая рандомизированный блок, разделенный график, повторные измерения и латинские квадраты, а также их анализ в R