Доказательства сходимости случайных величин

Представлены разнообразные доказательства различных типов сходимости случайных величин.

Данная статья является дополнением к статье « Сходимость случайных величин » и содержит доказательства некоторых результатов.

Несколько результатов будут получены с использованием леммы о портманто : последовательность { X n } сходится по распределению к X тогда и только тогда, когда выполняется любое из следующих условий:

  1. E [ f ( X n ) ] E [ f ( X ) ] {\displaystyle \mathbb {E} [f(X_{n})]\to \mathbb {E} [f(X)]} для всех ограниченных непрерывных функций ; f {\displaystyle f}
  2. E [ f ( X n ) ] E [ f ( X ) ] {\displaystyle \mathbb {E} [f(X_{n})]\to \mathbb {E} [f(X)]} для всех ограниченных липшицевых функций ; f {\displaystyle f}
  3. lim sup Pr ( X n C ) Pr ( X C ) {\displaystyle \limsup \operatorname {Pr} (X_{n}\in C)\leq \operatorname {Pr} (X\in C)} для всех замкнутых множеств ; C {\displaystyle C}

Сходимость почти наверняка подразумевает сходимость по вероятности.

X n   a s   X X n   p   X {\displaystyle X_{n}\ {\overset {\mathrm {as} }{\rightarrow }}\ X\quad \Rightarrow \quad X_{n}\ {\overset {p}{\rightarrow }}\ X}

Доказательство: Если сходится к почти наверняка, то это означает, что множество точек имеет меру ноль. Теперь зафиксируем и рассмотрим последовательность множеств { X n } {\displaystyle \{X_{n}\}} X {\displaystyle X} O = { ω lim X n ( ω ) X ( ω ) } {\displaystyle O=\{\omega \mid \lim X_{n}(\omega )\neq X(\omega )\}} ε > 0 {\displaystyle \varepsilon >0}

A n = m n { | X m X | > ε } {\displaystyle A_{n}=\bigcup _{m\geq n}\left\{\left|X_{m}-X\right|>\varepsilon \right\}}

Эта последовательность множеств убывает ( ) по направлению к множеству A n A n + 1 {\displaystyle A_{n}\supseteq A_{n+1}\supseteq \ldots }

A = n 1 A n . {\displaystyle A_{\infty }=\bigcap _{n\geq 1}A_{n}.}

Вероятности этой последовательности также убывают, поэтому ; покажем теперь, что это число равно нулю. Теперь для любой точки вне имеем , что подразумевает, что для всех для некоторых . В частности, для таких точка не будет лежать в , и, следовательно, не будет лежать в . Следовательно, и поэтому . lim Pr ( A n ) = Pr ( A ) {\displaystyle \lim \operatorname {Pr} (A_{n})=\operatorname {Pr} (A_{\infty })} ω {\displaystyle \omega } O {\displaystyle O} lim X n ( ω ) = X ( ω ) {\displaystyle \lim X_{n}(\omega )=X(\omega )} | X n ( ω ) X ( ω ) | < ε {\displaystyle \left|X_{n}(\omega )-X(\omega )\right|<\varepsilon } n N {\displaystyle n\geq N} N {\displaystyle N} n {\displaystyle n} ω {\displaystyle \omega } A n {\displaystyle A_{n}} A {\displaystyle A_{\infty }} A O {\displaystyle A_{\infty }\subseteq O} Pr ( A ) = 0 {\displaystyle \operatorname {Pr} (A_{\infty })=0}

Наконец, по преемственности сверху,

Pr ( | X n X | > ε ) Pr ( A n )   n 0 , {\displaystyle \operatorname {Pr} \left(|X_{n}-X|>\varepsilon \right)\leq \operatorname {Pr} (A_{n})\ {\underset {n\to \infty }{\rightarrow }}0,}

что по определению означает, что сходится по вероятности к . X n {\displaystyle X_{n}} X {\displaystyle X}

Сходимость по вероятности не подразумевает почти наверняка сходимость в дискретном случае

Если X n — независимые случайные величины, принимающие значение единица с вероятностью 1/ n и ноль в противном случае, то X n сходится к нулю по вероятности, но не почти наверняка. Это можно проверить с помощью лемм Бореля–Кантелли .

Сходимость в вероятности подразумевает сходимость в распределении.

X n   p   X X n   d   X , {\displaystyle X_{n}\ {\xrightarrow {p}}\ X\quad \Rightarrow \quad X_{n}\ {\xrightarrow {d}}\ X,}

Доказательство для случая скалярных случайных величин

Лемма. Пусть X , Y — случайные величины, a — действительное число и ε > 0. Тогда

Pr ( Y a ) Pr ( X a + ε ) + Pr ( | Y X | > ε ) . {\displaystyle \operatorname {Pr} (Y\leq a)\leq \operatorname {Pr} (X\leq a+\varepsilon )+\operatorname {Pr} (|Y-X|>\varepsilon ).}

Доказательство леммы:

Pr ( Y a ) = Pr ( Y a ,   X a + ε ) + Pr ( Y a ,   X > a + ε ) Pr ( X a + ε ) + Pr ( Y X a X ,   a X < ε ) Pr ( X a + ε ) + Pr ( Y X < ε ) Pr ( X a + ε ) + Pr ( Y X < ε ) + Pr ( Y X > ε ) = Pr ( X a + ε ) + Pr ( | Y X | > ε ) {\displaystyle {\begin{aligned}\operatorname {Pr} (Y\leq a)&=\operatorname {Pr} (Y\leq a,\ X\leq a+\varepsilon )+\operatorname {Pr} (Y\leq a,\ X>a+\varepsilon )\\&\leq \operatorname {Pr} (X\leq a+\varepsilon )+\operatorname {Pr} (Y-X\leq a-X,\ a-X<-\varepsilon )\\&\leq \operatorname {Pr} (X\leq a+\varepsilon )+\operatorname {Pr} (Y-X<-\varepsilon )\\&\leq \operatorname {Pr} (X\leq a+\varepsilon )+\operatorname {Pr} (Y-X<-\varepsilon )+\operatorname {Pr} (Y-X>\varepsilon )\\&=\operatorname {Pr} (X\leq a+\varepsilon )+\operatorname {Pr} (|Y-X|>\varepsilon )\end{aligned}}}

Более короткое доказательство леммы:

У нас есть

{ Y a } { X a + ε } { | Y X | > ε } {\displaystyle {\begin{aligned}\{Y\leq a\}\subset \{X\leq a+\varepsilon \}\cup \{|Y-X|>\varepsilon \}\end{aligned}}}

ибо если и , то . Следовательно, по союзу связано, Y a {\displaystyle Y\leq a} | Y X | ε {\displaystyle |Y-X|\leq \varepsilon } X a + ε {\displaystyle X\leq a+\varepsilon }

Pr ( Y a ) Pr ( X a + ε ) + Pr ( | Y X | > ε ) . {\displaystyle {\begin{aligned}\operatorname {Pr} (Y\leq a)\leq \operatorname {Pr} (X\leq a+\varepsilon )+\operatorname {Pr} (|Y-X|>\varepsilon ).\end{aligned}}}

Доказательство теоремы: Напомним, что для доказательства сходимости по распределению нужно показать, что последовательность кумулятивных функций распределения сходится к F X в каждой точке, где F X непрерывна. Пусть a — такая точка. Для любого ε > 0, в силу предыдущей леммы, имеем:

Pr ( X n a ) Pr ( X a + ε ) + Pr ( | X n X | > ε ) Pr ( X a ε ) Pr ( X n a ) + Pr ( | X n X | > ε ) {\displaystyle {\begin{aligned}\operatorname {Pr} (X_{n}\leq a)&\leq \operatorname {Pr} (X\leq a+\varepsilon )+\operatorname {Pr} (|X_{n}-X|>\varepsilon )\\\operatorname {Pr} (X\leq a-\varepsilon )&\leq \operatorname {Pr} (X_{n}\leq a)+\operatorname {Pr} (|X_{n}-X|>\varepsilon )\end{aligned}}}

Итак, у нас есть

Pr ( X a ε ) Pr ( | X n X | > ε ) Pr ( X n a ) Pr ( X a + ε ) + Pr ( | X n X | > ε ) . {\displaystyle \operatorname {Pr} (X\leq a-\varepsilon )-\operatorname {Pr} \left(\left|X_{n}-X\right|>\varepsilon \right)\leq \operatorname {Pr} (X_{n}\leq a)\leq \operatorname {Pr} (X\leq a+\varepsilon )+\operatorname {Pr} \left(\left|X_{n}-X\right|>\varepsilon \right).}

Принимая предел при n → ∞, получаем:

F X ( a ε ) lim n Pr ( X n a ) F X ( a + ε ) , {\displaystyle F_{X}(a-\varepsilon )\leq \lim _{n\to \infty }\operatorname {Pr} (X_{n}\leq a)\leq F_{X}(a+\varepsilon ),}

где F X ( a ) = Pr( Xa ) — кумулятивная функция распределения X . Эта функция непрерывна в точке a по предположению, и поэтому как F X ( a −ε), так и F X ( a + ε) сходятся к F X ( a ) при ε → 0 + . Принимая этот предел, получаем

lim n Pr ( X n a ) = Pr ( X a ) , {\displaystyle \lim _{n\to \infty }\operatorname {Pr} (X_{n}\leq a)=\operatorname {Pr} (X\leq a),}

что означает, что { X n } сходится к X по распределению.

Доказательство для общего случая

Следствием этого является случайный вектор , если использовать это свойство, доказанное далее на этой странице, и взять X n = X в формулировке этого свойства.

Сходимость распределения к константе подразумевает сходимость вероятности.

X n   d   c X n   p   c , {\displaystyle X_{n}\ {\xrightarrow {d}}\ c\quad \Rightarrow \quad X_{n}\ {\xrightarrow {p}}\ c,} при условии, что c является константой.

Доказательство: Зафиксируем ε > 0. Пусть B ε ( c ) — открытый шар радиуса ε вокруг точки c , а B ε ( c ) c — его дополнение. Тогда

Pr ( | X n c | ε ) = Pr ( X n B ε ( c ) c ) . {\displaystyle \operatorname {Pr} \left(|X_{n}-c|\geq \varepsilon \right)=\operatorname {Pr} \left(X_{n}\in B_{\varepsilon }(c)^{c}\right).}

По лемме о портманто (часть C), если X n сходится по распределению к c , то предел последней вероятности должен быть меньше или равен Pr( cB ε ( c ) c ), что, очевидно, равно нулю. Следовательно,

lim n Pr ( | X n c | ε ) lim sup n Pr ( | X n c | ε ) = lim sup n Pr ( X n B ε ( c ) c ) Pr ( c B ε ( c ) c ) = 0 {\displaystyle {\begin{aligned}\lim _{n\to \infty }\operatorname {Pr} \left(\left|X_{n}-c\right|\geq \varepsilon \right)&\leq \limsup _{n\to \infty }\operatorname {Pr} \left(\left|X_{n}-c\right|\geq \varepsilon \right)\\&=\limsup _{n\to \infty }\operatorname {Pr} \left(X_{n}\in B_{\varepsilon }(c)^{c}\right)\\&\leq \operatorname {Pr} \left(c\in B_{\varepsilon }(c)^{c}\right)=0\end{aligned}}}

что по определению означает, что X n сходится к c по вероятности.

Сходимость по вероятности к последовательности, сходящейся по распределению, подразумевает сходимость к тому же распределению.

| Y n X n |   p   0 ,     X n   d   X   Y n   d   X {\displaystyle |Y_{n}-X_{n}|\ {\xrightarrow {p}}\ 0,\ \ X_{n}\ {\xrightarrow {d}}\ X\ \quad \Rightarrow \quad Y_{n}\ {\xrightarrow {d}}\ X}

Доказательство: Мы докажем эту теорему, используя лемму-портманто, часть B. Как требуется в этой лемме, рассмотрим любую ограниченную функцию f (т.е. | f ( x )| ≤ M ), которая также является липшицевой:

K > 0 , x , y : | f ( x ) f ( y ) | K | x y | . {\displaystyle \exists K>0,\forall x,y:\quad |f(x)-f(y)|\leq K|x-y|.}

Возьмем некоторое ε > 0 и мажорируем выражение |E[ f ( Y n )] − E[ f ( X n )]| как

| E [ f ( Y n ) ] E [ f ( X n ) ] | E [ | f ( Y n ) f ( X n ) | ] = E [ | f ( Y n ) f ( X n ) | 1 { | Y n X n | < ε } ] + E [ | f ( Y n ) f ( X n ) | 1 { | Y n X n | ε } ] E [ K | Y n X n | 1 { | Y n X n | < ε } ] + E [ 2 M 1 { | Y n X n | ε } ] K ε Pr ( | Y n X n | < ε ) + 2 M Pr ( | Y n X n | ε ) K ε + 2 M Pr ( | Y n X n | ε ) {\displaystyle {\begin{aligned}\left|\operatorname {E} \left[f(Y_{n})\right]-\operatorname {E} \left[f(X_{n})\right]\right|&\leq \operatorname {E} \left[\left|f(Y_{n})-f(X_{n})\right|\right]\\&=\operatorname {E} \left[\left|f(Y_{n})-f(X_{n})\right|\mathbf {1} _{\left\{|Y_{n}-X_{n}|<\varepsilon \right\}}\right]+\operatorname {E} \left[\left|f(Y_{n})-f(X_{n})\right|\mathbf {1} _{\left\{|Y_{n}-X_{n}|\geq \varepsilon \right\}}\right]\\&\leq \operatorname {E} \left[K\left|Y_{n}-X_{n}\right|\mathbf {1} _{\left\{|Y_{n}-X_{n}|<\varepsilon \right\}}\right]+\operatorname {E} \left[2M\mathbf {1} _{\left\{|Y_{n}-X_{n}|\geq \varepsilon \right\}}\right]\\&\leq K\varepsilon \operatorname {Pr} \left(\left|Y_{n}-X_{n}\right|<\varepsilon \right)+2M\operatorname {Pr} \left(\left|Y_{n}-X_{n}\right|\geq \varepsilon \right)\\&\leq K\varepsilon +2M\operatorname {Pr} \left(\left|Y_{n}-X_{n}\right|\geq \varepsilon \right)\end{aligned}}}

(здесь 1 {...} обозначает индикаторную функцию ; математическое ожидание индикаторной функции равно вероятности соответствующего события). Следовательно,

| E [ f ( Y n ) ] E [ f ( X ) ] | | E [ f ( Y n ) ] E [ f ( X n ) ] | + | E [ f ( X n ) ] E [ f ( X ) ] | K ε + 2 M Pr ( | Y n X n | ε ) + | E [ f ( X n ) ] E [ f ( X ) ] | . {\displaystyle {\begin{aligned}\left|\operatorname {E} \left[f(Y_{n})\right]-\operatorname {E} \left[f(X)\right]\right|&\leq \left|\operatorname {E} \left[f(Y_{n})\right]-\operatorname {E} \left[f(X_{n})\right]\right|+\left|\operatorname {E} \left[f(X_{n})\right]-\operatorname {E} \left[f(X)\right]\right|\\&\leq K\varepsilon +2M\operatorname {Pr} \left(|Y_{n}-X_{n}|\geq \varepsilon \right)+\left|\operatorname {E} \left[f(X_{n})\right]-\operatorname {E} \left[f(X)\right]\right|.\end{aligned}}}

Если мы возьмем предел в этом выражении при n  → ∞, то второй член будет стремиться к нулю, поскольку { Y n −X n } сходится к нулю по вероятности; и третий член также будет сходиться к нулю, по лемме о портманто и тому факту, что X n сходится к X по распределению. Таким образом

lim n | E [ f ( Y n ) ] E [ f ( X ) ] | K ε . {\displaystyle \lim _{n\to \infty }\left|\operatorname {E} \left[f(Y_{n})\right]-\operatorname {E} \left[f(X)\right]\right|\leq K\varepsilon .}

Поскольку ε было произвольным, мы приходим к выводу, что предел должен быть фактически равен нулю, и, следовательно, E[ f ( Y n )] → E[ f ( X )], что снова по лемме о портманто означает, что { Y n } сходится к X по распределению. ЧТЭК.

Сходимость одной последовательности в распределении и другой к константе подразумевает совместную сходимость в распределении

X n   d   X ,     Y n   p   c   ( X n , Y n )   d   ( X , c ) {\displaystyle X_{n}\ {\xrightarrow {d}}\ X,\ \ Y_{n}\ {\xrightarrow {p}}\ c\ \quad \Rightarrow \quad (X_{n},Y_{n})\ {\xrightarrow {d}}\ (X,c)} при условии, что c является константой.

Доказательство: Мы докажем это утверждение, используя лемму о портманто, часть А.

Сначала мы хотим показать, что ( X n , c ) сходится по распределению к ( X , c ). По лемме о портманто это будет верно, если мы сможем показать, что E[ f ( X n , c )] → E[ f ( X , c )] для любой ограниченной непрерывной функции f ( x , y ). Итак, пусть f будет такой произвольной ограниченной непрерывной функцией. Теперь рассмотрим функцию одной переменной g ( x ) := f ( x , c ). Она, очевидно, также будет ограниченной и непрерывной, и поэтому по лемме о портманто для последовательности { X n }, сходящейся по распределению к X , мы будем иметь, что E[ g ( X n )] → E[ g ( X )]. Однако последнее выражение эквивалентно «E[ f ( X n , c )] → E[ f ( X , c )]», и поэтому теперь мы знаем, что ( X n , c ) сходится по распределению к ( X , c ).

Во-вторых, рассмотрим |( X n , Y n ) − ( X n , c )| = | Y nc |. Это выражение сходится по вероятности к нулю, поскольку Y n сходится по вероятности к c . Таким образом, мы продемонстрировали два факта:

{ | ( X n , Y n ) ( X n , c ) |   p   0 , ( X n , c )   d   ( X , c ) . {\displaystyle {\begin{cases}\left|(X_{n},Y_{n})-(X_{n},c)\right|\ {\xrightarrow {p}}\ 0,\\(X_{n},c)\ {\xrightarrow {d}}\ (X,c).\end{cases}}}

По доказанному ранее свойству эти два факта подразумевают, что ( X n , Y n ) сходятся по распределению к ( X , c ).

Сходимость двух последовательностей по вероятности подразумевает совместную сходимость по вероятности.

X n   p   X ,     Y n   p   Y   ( X n , Y n )   p   ( X , Y ) {\displaystyle X_{n}\ {\xrightarrow {p}}\ X,\ \ Y_{n}\ {\xrightarrow {p}}\ Y\ \quad \Rightarrow \quad (X_{n},Y_{n})\ {\xrightarrow {p}}\ (X,Y)}

Доказательство:

Pr ( | ( X n , Y n ) ( X , Y ) | ε ) Pr ( | X n X | + | Y n Y | ε ) Pr ( | X n X | ε / 2 ) + Pr ( | Y n Y | ε / 2 ) {\displaystyle {\begin{aligned}\operatorname {Pr} \left(\left|(X_{n},Y_{n})-(X,Y)\right|\geq \varepsilon \right)&\leq \operatorname {Pr} \left(|X_{n}-X|+|Y_{n}-Y|\geq \varepsilon \right)\\&\leq \operatorname {Pr} \left(|X_{n}-X|\geq \varepsilon /2\right)+\operatorname {Pr} \left(|Y_{n}-Y|\geq \varepsilon /2\right)\end{aligned}}}

где последний шаг следует принципу ящика и субаддитивности вероятностной меры. Каждая из вероятностей в правой части сходится к нулю при n → ∞ по определению сходимости { X n } и { Y n } по вероятности к X и Y соответственно. Принимая предел, мы заключаем, что левая часть также сходится к нулю, и, следовательно, последовательность {( X n , Y n )} сходится по вероятности к {( X , Y )}.

Смотрите также

Ссылки

Retrieved from "https://en.wikipedia.org/w/index.php?title=Proofs_of_convergence_of_random_variables&oldid=1246066773"