В статистике пробит- модель — это тип регрессии , в которой зависимая переменная может принимать только два значения, например, женат или не женат. Слово является портманто, происходящим от probability + un it . [ 1 ] Целью модели является оценка вероятности того, что наблюдение с определенными характеристиками попадет в определенную категорию; более того, классификация наблюдений на основе их предсказанных вероятностей является типом модели бинарной классификации .
Предположим, что переменная ответа Y является бинарной , то есть она может иметь только два возможных результата , которые мы обозначим как 1 и 0. Например, Y может представлять наличие/отсутствие определенного условия, успех/неудачу некоторого устройства, ответ да/нет в опросе и т. д. У нас также есть вектор регрессоров X , которые, как предполагается, влияют на результат Y. В частности, мы предполагаем, что модель принимает вид
Можно мотивировать модель пробит как модель скрытой переменной . Предположим, что существует вспомогательная случайная величина
где ε ~ N (0, 1). Тогда Y можно рассматривать как индикатор того, является ли эта скрытая переменная положительной:
Использование стандартного нормального распределения не приводит к потере общности по сравнению с использованием нормального распределения с произвольным средним значением и стандартным отклонением, поскольку прибавление фиксированной величины к среднему значению можно компенсировать вычитанием той же величины из отсекаемого значения, а умножение стандартного отклонения на фиксированную величину можно компенсировать умножением весов на ту же величину.
Чтобы убедиться в эквивалентности двух моделей, обратите внимание, что
Оценка модели
Оценка максимального правдоподобия
Предположим, что набор данных содержит n независимых статистических единиц, соответствующих приведенной выше модели.
Для отдельного наблюдения, обусловленного вектором входных данных этого наблюдения, мы имеем:
где — вектор входных данных, а — вектор коэффициентов.
Тогда вероятность единичного наблюдения равна
В самом деле, если , то , и если , то .
Поскольку наблюдения независимы и одинаково распределены, то правдоподобие всей выборки, или совместное правдоподобие , будет равно произведению правдоподобий отдельных наблюдений:
Таким образом, совместная логарифмическая функция правдоподобия имеет вид
Оценщик , который максимизирует эту функцию, будет последовательным , асимптотически нормальным и эффективным при условии, что существует и не является сингулярным. Можно показать, что эта функция логарифмического правдоподобия глобально вогнута в , и поэтому стандартные численные алгоритмы оптимизации быстро сойдутся к уникальному максимуму.
и является функцией плотности вероятности ( PDF ) стандартного нормального распределения.
Также доступны полупараметрические и непараметрические методы максимального правдоподобия для пробит-типа и других связанных моделей. [4]
Метод минимального хи-квадрат Берксона
Этот метод можно применять только тогда, когда имеется много наблюдений переменной отклика , имеющих одно и то же значение вектора регрессоров (такую ситуацию можно назвать «много наблюдений на ячейку»). Более конкретно, модель можно сформулировать следующим образом.
Предположим, что среди n наблюдений имеется только T различных значений регрессоров, что можно обозначить как . Пусть будет числом наблюдений с , а числом таких наблюдений с . Мы предполагаем, что действительно имеется «много» наблюдений на каждую «ячейку»: для каждого .
Можно показать, что эта оценка является последовательной (при n →∞ и фиксированном T ), асимптотически нормальной и эффективной. [ требуется ссылка ] Ее преимуществом является наличие замкнутой формулы для оценки. Однако проводить этот анализ имеет смысл только тогда, когда отдельные наблюдения недоступны, а доступны только их агрегированные подсчеты , , и (например, при анализе поведения избирателей).
выборка Гиббса
Выборка Гиббса пробит-модели возможна, поскольку регрессионные модели обычно используют нормальные априорные распределения по весам, и это распределение сопряжено с нормальным распределением ошибок (и, следовательно, скрытых переменных Y * ). Модель можно описать как
Отсюда можно определить необходимые полные условные плотности:
Единственная сложность в последних двух уравнениях. Обозначение — скобка Айверсона , иногда пишется или похоже. Оно указывает, что распределение должно быть усечено в пределах заданного диапазона и соответствующим образом перемасштабировано. В этом конкретном случае возникает усеченное нормальное распределение . Выборка из этого распределения зависит от того, насколько усечено. Если остается большая часть исходной массы, выборку можно легко сделать с помощью выборки отклонения — просто выберите число из неусеченного распределения и отклоните его, если оно выходит за пределы ограничения, налагаемого усечением. Однако, если выборка выполняется только из небольшой части исходной массы (например, если выборка выполняется из одного из хвостов нормального распределения — например, если около 3 или более, и требуется отрицательная выборка), то это будет неэффективно, и придется прибегнуть к другим алгоритмам выборки. Общую выборку из усеченной нормальной функции можно осуществить с помощью приближений к нормальной функции распределения и пробит-функции , а в R имеется функция для генерации усеченно-нормальных выборок.rtnorm()
Оценка модели
Пригодность предполагаемой бинарной модели можно оценить, подсчитав количество истинных наблюдений, равных 1, и количество, равное нулю, для которых модель назначает правильную предсказанную классификацию, рассматривая любую предполагаемую вероятность выше 1/2 (или ниже 1/2) как назначение предсказания 1 (или 0). Подробности см. в разделе Логистическая регрессия § Модель .
Рассмотрим формулировку модели скрытых переменных пробит-модели. Когда дисперсия условного значения не является постоянной, а зависит от , то возникает проблема гетероскедастичности . Например, предположим, что и , где — непрерывная положительная объясняющая переменная. При гетероскедастичности оценка пробит-модели для обычно несостоятельна, и большинство тестов на коэффициенты недействительны. Что еще более важно, оценка для также становится несостоятельной. Чтобы справиться с этой проблемой, исходную модель необходимо преобразовать в гомоскедастичную. Например, в том же примере можно переписать как , где . Следовательно, и запуск пробит-модели для генерирует состоятельную оценку для условной вероятности
Когда предположение о том, что распределение нормальное, не выполняется, возникает проблема неверной спецификации функциональной формы : если модель по-прежнему оценивается как пробит-модель, оценки коэффициентов несостоятельны. Например, если следует логистическому распределению в истинной модели, но модель оценивается по пробиту, оценки будут в целом меньше истинного значения. Однако несостоятельность оценок коэффициентов практически не имеет значения, поскольку оценки для частичных эффектов, будут близки к оценкам, полученным с помощью истинной логит-модели. [5]
Чтобы избежать проблемы неправильной спецификации распределения, можно принять общее предположение о распределении для погрешности, так что в модель можно включить много различных типов распределения. Стоимостью являются более тяжелые вычисления и более низкая точность при увеличении числа параметров. [6] В большинстве случаев на практике, когда форма распределения указана неправильно, оценки коэффициентов несостоятельны, но оценки условной вероятности и частичных эффектов по-прежнему очень хороши. [ необходима цитата ]
Можно также использовать полупараметрические или непараметрические подходы, например, с помощью методов локальной вероятности или непараметрических методов квазиправдоподобия, которые избегают предположений о параметрической форме для индексной функции и являются устойчивыми к выбору функции связи (например, пробит или логит). [4]
История
Модель пробит обычно приписывают Честеру Блиссу , который ввел термин «пробит» в 1934 году, [7] и Джону Гэддуму (1933), который систематизировал более ранние работы. [8] Однако базовая модель восходит к закону Вебера-Фехнера Густава Фехнера , опубликованному в Fechner (1860), и неоднократно переоткрывалась вплоть до 1930-х годов; см. Finney (1971, Глава 3.6) и Aitchison & Brown (1957, Глава 1.2). [8]
↑ Oxford English Dictionary , 3-е изд. sv probit (статья от июня 2007 г.): Bliss, CI (1934). «Метод пробитов». Science . 79 (2037): 38– 39. Bibcode : 1934Sci....79...38B. doi : 10.1126/science.79.2037.38. PMID 17813446. Эти произвольные единицы вероятности были названы «пробитами».
^ Агрести, Алан (2015). Основы линейных и обобщенных линейных моделей . Нью-Йорк: Wiley. С. 183–186 . ISBN978-1-118-73003-4.
^ Олдрич, Джон Х.; Нельсон, Форрест Д.; Адлер, Э. Скотт (1984). Линейная вероятность, логит- и пробит-модели. Sage. стр. 48–65 . ISBN0-8039-2133-0.
^ ab Park, Byeong U.; Simar, Léopold; Zelenyuk, Valentin (2017). "Непараметрическая оценка динамических моделей дискретного выбора для данных временных рядов" (PDF) . Computational Statistics & Data Analysis . 108 : 97–120 . doi :10.1016/j.csda.2016.10.024.
^ Более подробную информацию см. в: Cappé, O., Moulines, E. и Ryden, T. (2005): «Вывод в скрытых марковских моделях», Springer-Verlag New York, Глава 2.
^ Блисс, CI (1934). «Метод пробитов». Science . 79 (2037): 38– 39. Bibcode :1934Sci....79...38B. doi :10.1126/science.79.2037.38. PMID 17813446.
^ ab Cramer 2002, стр. 7.
^ Фишер, РА (1935). «Дело о нулевых выживших в пробит-анализах». Annals of Applied Biology . 22 : 164– 165. doi :10.1111/j.1744-7348.1935.tb07713.x. Архивировано из оригинала 2014-04-30.
Эйтчисон, Джон; Браун, Джеймс Алан Калверт (1957). Логнормальное распределение: с особым акцентом на его применение в экономике. University Press. ISBN978-0-521-04011-2.
Крамер, Дж. С. (2002). Истоки логистической регрессии (PDF) (Технический отчет). Том 119. Институт Тинбергена. С. 167–178 . doi :10.2139/ssrn.360300.
Опубликовано в: Cramer, JS (2004). "Ранние истоки модели логита". Исследования по истории и философии науки Часть C: Исследования по истории и философии биологических и биомедицинских наук . 35 (4): 613– 626. doi :10.1016/j.shpsc.2004.09.003.
Фехнер, Густав Теодор (1860). Elemente der Psychophysik [ Элементы психофизики ]. Том. группа 2. Лейпциг: Breitkopf und Härtel.
Финни, Дж. Д. (1971). Пробит-анализ .
Дальнейшее чтение
Альберт, Дж. Х.; Чиб, С. (1993). «Байесовский анализ бинарных и полихотомических данных отклика». Журнал Американской статистической ассоциации . 88 (422): 669– 679. doi :10.1080/01621459.1993.10476321. JSTOR 2290350.