Понятия вероятностной сходимости, применяемые к оценке и асимптотическому анализу
В теории вероятностей существует несколько различных понятий сходимости последовательностей случайных величин , включая сходимость по вероятности , сходимость по распределению и почти наверняка сходимость . Различные понятия сходимости охватывают различные свойства последовательности, при этом некоторые понятия сходимости сильнее других. Например, сходимость по распределению говорит нам о предельном распределении последовательности случайных величин. Это более слабое понятие, чем сходимость по вероятности, которое говорит нам о значении, которое примет случайная величина, а не только о распределении.
Эта концепция важна в теории вероятностей и ее приложениях к статистике и стохастическим процессам . Те же концепции известны в более общей математике как стохастическая сходимость , и они формализуют идею о том, что некоторые свойства последовательности по существу случайных или непредсказуемых событий иногда могут, как ожидается, прийти к поведению, которое по существу не меняется, когда элементы достаточно далеко в последовательности изучаются. Различные возможные понятия сходимости связаны с тем, как такое поведение может быть охарактеризовано: два легко понимаемых поведения заключаются в том, что последовательность в конечном итоге принимает постоянное значение, и что значения в последовательности продолжают меняться, но могут быть описаны неизменным распределением вероятностей.
Фон
«Стохастическая сходимость» формализует идею о том, что последовательность по существу случайных или непредсказуемых событий иногда может, как ожидается, уложиться в шаблон. Шаблон может быть, например,
Сходимость в классическом смысле к фиксированному значению, возможно, сама происходящая из случайного события
Все большее сходство результатов с тем, что могла бы дать чисто детерминированная функция
Растущее предпочтение определенного результата
Растущее «отвращение» к слишком большому отклонению от определенного результата
Что распределение вероятностей, описывающее следующий результат, может становиться все более похожим на определенное распределение
Некоторые менее очевидные, более теоретические закономерности могут быть
Что ряд, сформированный путем вычисления ожидаемого значения расстояния результата от конкретного значения, может сходиться к 0
Что дисперсия случайной величины, описывающей следующее событие, становится все меньше и меньше.
Эти другие типы закономерностей, которые могут возникнуть, отражены в различных типах стохастической конвергенции, которые были изучены.
Хотя приведенное выше обсуждение касалось сходимости одного ряда к предельному значению, понятие сходимости двух рядов друг к другу также важно, но с этим легко справиться, изучая последовательность, определяемую либо как разность, либо как отношение двух рядов.
то при стремлении к бесконечности сходится по вероятности (см. ниже) к общему среднему , , случайных величин . Этот результат известен как слабый закон больших чисел . Другие формы сходимости важны в других полезных теоремах, включая центральную предельную теорему .
Далее мы предполагаем, что — последовательность случайных величин, а — случайная величина, и все они определены в одном и том же вероятностном пространстве .
Конвергенция в распределении
Примеры конвергенции в распределении
Фабрика игральных костей
Предположим, что только что построена новая фабрика по производству игральных костей. Первые несколько игральных костей выходят довольно предвзятыми из-за несовершенства производственного процесса. Результат подбрасывания любой из них будет следовать распределению, заметно отличающемуся от желаемого равномерного распределения .
По мере совершенствования фабрики игральные кости становятся все менее загруженными, а результаты подбрасывания новой игральной кости будут все более и более точно следовать равномерному распределению.
Бросание монет
Пусть X n будет долей орлов после подбрасывания несмещенной монеты n раз. Тогда X 1 имеет распределение Бернулли с ожидаемым значением μ = 0,5 и дисперсией σ 2 = 0,25 . Последующие случайные величины X 2 , X 3 , ... будут распределены биномиально .
По мере увеличения n это распределение постепенно начнет приобретать форму, все более похожую на колоколообразную кривую нормального распределения. Если мы сдвинем и изменим масштаб X n соответствующим образом, то распределение будет сходиться к стандартному нормальному, результат, который следует из знаменитой центральной предельной теоремы .
Графический пример
Предположим, что { X i } — это iid- последовательность равномерных U (−1, 1) случайных величин. Пусть — их (нормализованные) суммы. Тогда согласно центральной предельной теореме распределение Z n приближается к нормальному N (0, 1/3 ) распределение. Эта сходимость показана на рисунке: по мере увеличения n форма функции плотности вероятности становится все ближе и ближе к гауссовой кривой.
Грубо говоря, при таком режиме сходимости мы все больше ожидаем увидеть, как следующий результат в последовательности случайных экспериментов становится все лучше и лучше моделируемым заданным распределением вероятностей . Точнее, распределение связанной случайной величины в последовательности становится произвольно близким к указанному фиксированному распределению.
Сходимость в распределении является самой слабой формой сходимости, обычно обсуждаемой, поскольку она подразумевается всеми другими типами сходимости, упомянутыми в этой статье. Однако сходимость в распределении очень часто используется на практике; чаще всего она возникает из применения центральной предельной теоремы .
для каждого числа, при котором является непрерывным .
Требование того, чтобы рассматривались только точки непрерывности, является существенным. Например, если распределены равномерно на интервалах , то эта последовательность сходится по распределению к вырожденной случайной величине . Действительно, для всех , когда , и для всех , когда . Однако для этой предельной случайной величины , хотя для всех . Таким образом, сходимость cdfs нарушается в точке , где является разрывной.
Сходимость в распределении можно обозначить как
1
где — закон (распределение вероятностей) X. Например, если X — стандартно нормальное, мы можем записать .
Для случайных векторов сходимость по распределению определяется аналогично. Мы говорим, что эта последовательность сходится по распределению к случайному k -вектору X, если
для каждого , который является непрерывным множеством X .
Определение сходимости в распределении может быть расширено от случайных векторов до более общих случайных элементов в произвольных метрических пространствах и даже до «случайных величин», которые не поддаются измерению — ситуация, которая возникает, например, при изучении эмпирических процессов . Это «слабая сходимость законов без определения законов» — за исключением асимптотики. [1]
В этом случае термин слабая сходимость является предпочтительным (см. слабая сходимость мер ), и мы говорим, что последовательность случайных элементов { X n } слабо сходится к X (обозначается как X n ⇒ X ), если
для всех непрерывных ограниченных функций h . [2] Здесь E* обозначает внешнее ожидание , то есть ожидание «наименьшей измеримой функции g , которая доминирует над h ( X n ) ».
Характеристики
Поскольку , сходимость в распределении означает, что вероятность того, что X n находится в заданном диапазоне, приблизительно равна вероятности того, что значение X находится в этом диапазоне, при условии, что n достаточно велико .
В общем случае сходимость в распределении не означает, что последовательность соответствующих функций плотности вероятности также будет сходиться. В качестве примера можно рассмотреть случайные величины с плотностями f n ( x ) = (1 + cos(2 πnx )) 1 (0,1) . Эти случайные величины сходятся в распределении к равномерному U (0, 1), тогда как их плотности вообще не сходятся. [3]
Однако, согласно теореме Шеффе , сходимость функций плотности вероятности подразумевает сходимость распределения. [4]
Лемма о портманто дает несколько эквивалентных определений сходимости в распределении. Хотя эти определения менее интуитивны, они используются для доказательства ряда статистических теорем. Лемма утверждает, что { X n } сходится в распределении к X тогда и только тогда, когда верно любое из следующих утверждений: [5]
Теорема о непрерывном отображении утверждает, что для непрерывной функции g , если последовательность { X n } сходится по распределению к X , то { g ( X n )} сходится по распределению к g ( X ) .
Однако следует отметить, что сходимость в распределении { X n } к X и { Y n } к Y в общем случае не подразумевает сходимость в распределении { X n + Y n } к X + Y или { X n Y n } к XY .
Рассмотрим следующий эксперимент. Сначала выберите случайного человека на улице. Пусть X — его рост, который ex ante является случайной величиной. Затем попросите других людей оценить этот рост на глаз. Пусть X n — среднее значение первых n ответов. Тогда (при условии отсутствия систематической ошибки ) по закону больших чисел последовательность X n будет сходиться по вероятности к случайной величине X .
Прогнозирование генерации случайных чисел
Предположим, что генератор случайных чисел генерирует псевдослучайное число с плавающей точкой от 0 до 1. Пусть случайная величина X представляет распределение возможных выходов алгоритма. Поскольку псевдослучайное число генерируется детерминированно, его следующее значение не является по-настоящему случайным. Предположим, что, наблюдая за последовательностью случайно сгенерированных чисел, вы можете вывести закономерность и делать все более точные прогнозы относительно того, каким будет следующее случайно сгенерированное число. Пусть X n будет вашим предположением о значении следующего случайного числа после наблюдения первых n случайных чисел. По мере того, как вы узнаете закономерность и ваши предположения станут более точными, не только распределение X n будет сходиться к распределению X , но и результаты X n будут сходиться к результатам X .
Основная идея этого типа сходимости заключается в том, что вероятность «необычного» результата становится все меньше и меньше по мере развития последовательности.
Понятие сходимости по вероятности очень часто используется в статистике. Например, оценщик называется состоятельным , если он сходится по вероятности к оцениваемой величине. Сходимость по вероятности также является типом сходимости, установленным слабым законом больших чисел .
Определение
Последовательность { X n } случайных величин сходится по вероятности к случайной величине X, если для всех ε > 0
Более конкретно, пусть P n ( ε ) будет вероятностью того, что X n находится вне шара радиуса ε с центром в точке X . Тогда говорят, что X n сходится по вероятности к X , если для любого ε > 0 и любого δ > 0 существует число N (которое может зависеть от ε и δ ) такое, что для всех n ≥ N , P n ( ε ) < δ (определение предела).
Обратите внимание, что для выполнения условия невозможно, чтобы для каждого n случайные величины X и X n были независимыми (и, таким образом, сходимость по вероятности является условием для совместных cdf, в отличие от сходимости по распределению, которая является условием для индивидуальных cdf), если только X не является детерминированным, как для слабого закона больших чисел. В то же время случай детерминированного X не может, когда детерминированное значение является точкой разрыва (не изолированной), обрабатываться сходимостью по распределению, где точки разрыва должны быть явно исключены.
Сходимость по вероятности обозначается добавлением буквы p над стрелкой, указывающей на сходимость, или использованием оператора предела вероятности «plim»:
Сходимость по вероятности подразумевает сходимость по распределению. [доказательство]
В противоположном направлении, сходимость по распределению подразумевает сходимость по вероятности, когда предельная случайная величина X является константой. [доказательство]
Сходимость по вероятности не подразумевает почти наверняка сходимость. [доказательство]
Теорема о непрерывном отображении утверждает, что для каждой непрерывной функции , если , то также .
Сходимость по вероятности определяет топологию на пространстве случайных величин над фиксированным вероятностным пространством. Эта топология метризуема метрикой Ки Фана : [7] или альтернативно этой метрикой
Контрпримеры
Не каждая последовательность случайных величин, которая сходится к другой случайной величине по распределению, также сходится по вероятности к этой случайной величине. В качестве примера рассмотрим последовательность стандартных нормальных случайных величин и вторую последовательность . Обратите внимание, что распределение равно распределению для всех , но:
который не сходится к . Таким образом, у нас нет сходимости по вероятности.
Почти наверняка сходимость
Примеры почти достоверной сходимости
Пример 1
Рассмотрим животное какого-нибудь короткоживущего вида. Мы записываем количество пищи, которое это животное потребляет в день. Эта последовательность чисел будет непредсказуемой, но мы можем быть совершенно уверены, что однажды число станет нулевым и останется нулевым навсегда.
Пример 2
Рассмотрим человека, который каждое утро подбрасывает семь монет. Каждый день после полудня он жертвует один фунт на благотворительность за каждый выпавший орел. Однако в первый раз, когда результат будет полностью решкой, он остановится навсегда.
Пусть X 1 , X 2 , … будут ежедневными суммами, которые благотворительная организация получала от него.
Мы можем быть почти уверены , что в один прекрасный день эта сумма станет нулевой и останется нулевой навсегда после этого.
Однако, когда мы рассматриваем любое конечное число дней, существует ненулевая вероятность того, что условие завершения не наступит.
Сказать, что последовательность X n сходится почти наверняка или почти всюду , или с вероятностью 1 , или строго к X, означает, что
Это означает, что значения X n приближаются к значению X , в том смысле, что события, для которых X n не сходится к X , имеют вероятность 0 (см. Почти наверняка ). Используя вероятностное пространство и концепцию случайной величины как функции от Ω до R , это эквивалентно утверждению
Почти наверняка сходимость подразумевает сходимость по вероятности (по лемме Фату ), и, следовательно, подразумевает сходимость по распределению. Это понятие сходимости используется в усиленном законе больших чисел .
Понятие почти наверняка сходимости не исходит из топологии пространства случайных величин. Это означает, что не существует топологии пространства случайных величин, такой, что почти наверняка сходящиеся последовательности являются в точности сходящимися последовательностями относительно этой топологии. В частности, не существует метрики почти наверняка сходимости.
Контрпримеры
Рассмотрим последовательность независимых случайных величин, такую, что и . Для имеем что сходится к , следовательно, по вероятности.
Поскольку и события независимы, вторая лемма Бореля-Кантелли гарантирует, что, следовательно, последовательность не сходится к почти всюду (фактически множество, на котором эта последовательность не сходится к , имеет вероятность ).
Это понятие поточечной сходимости последовательности функций, расширенной до последовательности случайных величин . (Обратите внимание, что случайные величины сами по себе являются функциями).
При заданном действительном числе r ≥ 1 мы говорим, что последовательность X n сходится в r -м среднем значении (или в L r -норме ) к случайной величине X , если r -е абсолютные моменты (| X n | r ) и (| X | r ) величин X n и X существуют, и
где оператор E обозначает ожидаемое значение . Сходимость по r -му среднему говорит нам, что ожидание r -й степени разности между и сходится к нулю.
Этот тип конвергенции часто обозначается добавлением буквы L r над стрелкой, указывающей на конвергенцию:
4
Наиболее важными случаями сходимости в r -ом среднем являются:
Когда X n сходится в r -ом среднем к X при r = 1, мы говорим, что X n сходится в среднем к X .
Когда X n сходится в r -ом среднем к X при r = 2, мы говорим, что X n сходится в среднем квадратичном (или в среднем квадратичном ) к X .
Сходимость в r -ом среднем, для r ≥ 1, подразумевает сходимость по вероятности (по неравенству Маркова ). Более того, если r > s ≥ 1, сходимость в r -ом среднем подразумевает сходимость в s -ом среднем. Следовательно, сходимость в среднем квадратичном подразумевает сходимость в среднем.
Кроме того,
Обратное утверждение не обязательно верно, однако оно верно, если (по более общей версии леммы Шеффе ).
Характеристики
При условии, что вероятностное пространство является полным :
Если и , то (для любых действительных чисел a и b ) и .
Если и , то (для любых действительных чисел a и b ) и .
Если и , то (для любых действительных чисел a и b ).
Ни одно из вышеприведенных утверждений не является верным для конвергенции в распределении.
Цепочка импликаций между различными понятиями конвергенции отмечена в соответствующих разделах. Они, используя стрелочные обозначения:
Эти свойства, а также ряд других особых случаев, обобщены в следующем списке:
Почти наверняка сходимость подразумевает сходимость по вероятности: [8] [доказательство]
Сходимость по вероятности подразумевает, что существует подпоследовательность , которая почти наверняка сходится: [9]
Сходимость по вероятности подразумевает сходимость по распределению: [8] [доказательство]
Сходимость по среднему r -го порядка подразумевает сходимость по вероятности:
Сходимость в среднем r -го порядка подразумевает сходимость в среднем низшего порядка, предполагая, что оба порядка больше или равны единице:
при условии, что r ≥ s ≥ 1.
Если X n сходится по распределению к константе c , то X n сходится по вероятности к c : [8] [доказательство]
при условии, что c является константой.
Если X n сходится по распределению к X и разность между X n и Y n сходится по вероятности к нулю, то Y n также сходится по распределению к X : [8] [доказательство]
Если X n сходится по распределению к X , а Y n сходится по распределению к константе c , то совместный вектор ( X n , Y n ) сходится по распределению к : [8] [доказательство]
при условии, что c является константой.
Обратите внимание, что условие сходимости Y n к константе важно; если бы оно сходилось к случайной величине Y , то мы не смогли бы сделать вывод, что ( X n , Y n ) сходится к .
Если X n сходится по вероятности к X , а Y n сходится по вероятности к Y , то совместный вектор ( X n , Y n ) сходится по вероятности к ( X , Y ) : [8] [доказательство]
Если X n сходится по вероятности к X , и если P (| X n | ≤ b ) = 1 для всех n и некоторых b , то X n сходится в r -м среднем к X для всех r ≥ 1 . Другими словами, если X n сходится по вероятности к X и все случайные величины X n почти наверняка ограничены сверху и снизу, то X n сходится к X также в любом r -м среднем. [10]
Почти наверняка представление . Обычно сходимость по распределению не подразумевает сходимость почти наверняка. Однако для заданной последовательности { X n }, которая сходится по распределению к X 0 , всегда можно найти новое вероятностное пространство (Ω, F , P) и случайные величины { Y n , n = 0, 1, ...}, определенные на нем, такие, что Y n равно по распределению X n для каждого n ≥ 0 , а Y n сходится к Y 0 почти наверняка. [11] [12]
Если для всех ε > 0,
то мы говорим, что X n сходится почти полностью или почти по вероятности к X . Когда X n сходится почти полностью к X , то он также сходится почти наверняка к X . Другими словами, если X n сходится по вероятности к X достаточно быстро (т. е. указанная выше последовательность хвостовых вероятностей суммируема для всех ε > 0 ), то X n также сходится почти наверняка к X . Это прямое следствие из леммы Бореля–Кантелли .
Если S n представляет собой сумму n действительных независимых случайных величин:
тогда S n сходится почти наверняка тогда и только тогда, когда S n сходится по вероятности. Доказательство можно найти на странице 126 (теорема 5.3.4) книги Кай Лай Чуна . [13]
Однако для последовательности взаимно независимых случайных величин сходимость по вероятности не подразумевает почти надежную сходимость. [14]
Теорема о доминируемой сходимости дает достаточные условия для почти наверняка сходимости, чтобы подразумевать L 1 -сходимость:
5
Необходимым и достаточным условием сходимости L 1 является то, что последовательность ( X n ) равномерно интегрируема .
^ "реальный анализ - обобщение леммы Шеффе с использованием только сходимости по вероятности". Mathematics Stack Exchange . Получено 2022-03-12 .
Ссылки
Бикель, Питер Дж.; Клаассен, Крис А. Дж.; Ритов, Яаков; Веллнер, Джон А. (1998). Эффективная и адаптивная оценка для полупараметрических моделей . Нью-Йорк: Springer-Verlag. ISBN978-0-387-98473-5.
Биллингсли, Патрик (1986). Вероятность и мера . Wiley Series in Probability and Mathematical Statistics (2-е изд.). Wiley.
Дадли, Р. М. (2002). Реальный анализ и вероятность . Кембридж, Великобритания: Cambridge University Press. ISBN978-0-521-80972-6.
Фристедт, Берт; Грей, Лоуренс (1997). Современный подход к теории вероятностей . Нью-Йорк: Springer Science+Business Media. doi :10.1007/978-1-4899-2837-5. ISBN978-1-4899-2837-5.
Grimmett, GR; Stirzaker, DR (1992). Вероятность и случайные процессы (2-е изд.). Clarendon Press, Oxford. стр. 271–285 . ISBN978-0-19-853665-9.
Якобсен, М. (1992). Videregående Sandsynlighedsregning (Расширенная теория вероятностей) (3-е изд.). HCØ-tryk, Копенгаген. стр. 18–20 . ISBN.978-87-91180-71-2.