В статистике асимптотическая теория или теория больших выборок является основой для оценки свойств оценщиков и статистических тестов . В рамках этой основы часто предполагается, что размер выборки n может расти неограниченно; свойства оценщиков и тестов затем оцениваются при пределе n → ∞ . На практике предельная оценка считается приблизительно действительной и для больших конечных размеров выборки. [1]
Обзор
Большинство статистических задач начинаются с набора данных размером n . Асимптотическая теория исходит из предположения, что возможно (в принципе) продолжать собирать дополнительные данные, таким образом, что размер выборки будет расти бесконечно, т. е. n → ∞ . При таком предположении можно получить много результатов, которые недоступны для выборок конечного размера. Примером является слабый закон больших чисел . Закон гласит, что для последовательности независимых и одинаково распределенных (IID) случайных величин X 1 , X 2 , ... , если из каждой случайной величины извлекается одно значение и среднее первых n значений вычисляется как X n , то X n сходится по вероятности к среднему значению популяции E[ X i ] при n → ∞ . [2]
В асимптотической теории стандартный подход — n → ∞ . Для некоторых статистических моделей могут использоваться немного отличающиеся подходы асимптотики. Например, с панельными данными обычно предполагается, что одно измерение в данных остается фиксированным, тогда как другое измерение растет: T = константа и N → ∞ , или наоборот. [2]
Помимо стандартного подхода к асимптотике существуют и другие альтернативные подходы:
В рамках локальной асимптотической нормальности предполагается, что значение «истинного параметра» в модели немного меняется с n , так что n -я модель соответствует θ n = θ + h / √ n . Такой подход позволяет нам изучать регулярность оценок .
Когда статистические тесты изучаются на предмет их способности различать альтернативы, близкие к нулевой гипотезе, это делается в рамках так называемых «локальных альтернатив»: нулевая гипотеза — H 0 : θ = θ 0 , а альтернатива — H 1 : θ = θ 0 + h / √ n . Этот подход особенно популярен для тестов на единичный корень .
Существуют модели, в которых размерность пространства параметров Θ n медленно расширяется с ростом n , что отражает тот факт, что чем больше наблюдений, тем больше структурных эффектов можно реально включить в модель.
В оценке плотности ядра и регрессии ядра предполагается дополнительный параметр — полоса пропускания h . В этих моделях обычно предполагается, что h → 0 при n → ∞ . Скорость сходимости должна быть выбрана тщательно, обычно h ∝ n −1/5 .
Во многих случаях высокоточные результаты для конечных выборок могут быть получены с помощью численных методов (т. е. компьютеров); однако даже в таких случаях асимптотический анализ может быть полезен. Этот момент был отмечен Смоллом (2010, §1.4) следующим образом.
Основная цель асимптотического анализа — получить более глубокое качественное понимание количественных инструментов. Выводы асимптотического анализа часто дополняют выводы, которые можно получить численными методами.
Последовательность оценок называется последовательной , если она сходится по вероятности к истинному значению оцениваемого параметра:
То есть, грубо говоря, при бесконечном количестве данных оценщик (формула для генерации оценок) почти наверняка даст правильный результат для оцениваемого параметра. [2]
Если возможно найти последовательности неслучайных констант { a n }, { b n } (возможно, зависящие от значения θ 0 ) и невырожденное распределение G такие, что
Балакришнан, Н.; Ибрагимов, ИАВБ; Невзоров, ВБ, ред. (2001), Асимптотические методы в теории вероятностей и статистике с приложениями, Birkhäuser , ISBN9781461202097