Функции управления (также известные как двухэтапное остаточное включение ) являются статистическими методами для исправления проблем эндогенности путем моделирования эндогенности в погрешности . Таким образом, подход отличается важными способами от других моделей, которые пытаются учесть ту же эконометрическую проблему. Инструментальные переменные , например, пытаются моделировать эндогенную переменную X как часто обратимую модель по отношению к соответствующему и экзогенному инструменту Z. Панельный анализ использует специальные свойства данных для выделения ненаблюдаемой неоднородности, которая, как предполагается, фиксируется с течением времени .
Функции управления были введены Хекманом и Роббом [1], хотя этот принцип можно проследить и в более ранних работах. [2] Одной из причин их популярности является то, что они работают для необратимых моделей (таких как модели дискретного выбора ) и допускают неоднородные эффекты, когда эффекты на индивидуальном уровне могут отличаться от эффектов на совокупном уровне. [3] Известным примером подхода с использованием функции управления является поправка Хекмана .
Предположим, что мы начинаем со стандартной настройки эндогенных переменных с аддитивными ошибками, где X — эндогенная переменная, а Z — экзогенная переменная, которая может служить инструментом.
1 |
2 |
3 |
4 |
Популярный подход инструментальных переменных заключается в использовании двухшаговой процедуры и оценке уравнения ( 2 ) в первую очередь, а затем использовании оценок этого первого шага для оценки уравнения ( 1 ) на втором шаге. Однако функция управления использует то, что эта модель подразумевает
5 |
Функция h ( V ) фактически является контрольной функцией, которая моделирует эндогенность, и отсюда этот эконометрический подход получил свое название. [4]
В структуре потенциальных результатов причинно-следственной модели Рубина , где Y 1 — это переменная результата людей, для которых показатель участия D равен 1, подход на основе функции контроля приводит к следующей модели:
6 |
до тех пор, пока потенциальные результаты Y 0 и Y 1 не зависят от D и зависят от X и Z . [5]
Поскольку регрессия второго этапа включает сгенерированные регрессоры , ее матрицу дисперсии-ковариации необходимо скорректировать. [6] [7]
Вулдридж и Терца предлагают методологию как для работы с эндогенностью, так и для ее проверки в рамках экспоненциальной регрессии, за которой тесно следует последующее обсуждение. [8] Хотя пример фокусируется на модели регрессии Пуассона , его можно обобщить и на другие модели экспоненциальной регрессии, хотя это может быть достигнуто за счет дополнительных предположений (например, для моделей бинарного отклика или цензурированных данных).
Предположим следующую модель экспоненциальной регрессии, где — ненаблюдаемый член в скрытой переменной. Мы допускаем корреляцию между и (подразумевая , что возможно эндогенно), но не допускаем такой корреляции между и .
Переменные служат инструментальными переменными для потенциально эндогенных . Можно предположить линейную связь между этими двумя переменными или альтернативно спроецировать эндогенную переменную на инструменты, чтобы получить следующее уравнение приведенной формы:
1 |
Обычное условие ранга необходимо для обеспечения идентификации. Затем эндогенность моделируется следующим образом, где определяет серьезность эндогенности и предполагается, что она не зависит от .
Принимая эти предположения, предполагая, что модели правильно определены, и нормализуя , мы можем переписать условное среднее следующим образом:
2 |
Если бы они были известны на этом этапе, можно было бы оценить соответствующие параметры с помощью оценки квазимаксимального правдоподобия (QMLE). Следуя двухшаговым стратегиям процедуры, Вулдридж и Терца предлагают оценивать уравнение ( 1 ) с помощью обычных наименьших квадратов . Подогнанных остатков из этой регрессии затем можно включить в оценочное уравнение ( 2 ), и методы QMLE приведут к согласованным оценкам интересующих параметров. Тесты значимости затем можно использовать для проверки эндогенности в модели.
Первоначальная процедура Хеккита делает предположения о распределении относительно ошибок, однако были установлены более гибкие подходы к оценке с более слабыми предположениями о распределении. [9] Кроме того, Бланделл и Пауэлл показывают, как подход с использованием функции управления может быть особенно полезен в моделях с неаддитивными ошибками, таких как модели дискретного выбора. [10] Однако этот последний подход неявно делает предположения о сильных формах распределения и функциональности. [5]