Многомерное t-распределение

Многомерное обобщение t-распределения Стьюдента
Многомерныйт
Обозначение т ν ( μ , Σ ) {\displaystyle t_{\nu }({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})}
Параметры μ = [ μ 1 , , μ п ] Т {\displaystyle {\boldsymbol {\mu }}=[\mu _{1},\dots,\mu _{p}]^{T}} местоположение ( действительный вектор ) масштабная матрица ( положительно-определенная действительная матрица ) (действительная) представляет степени свободы п × 1 {\displaystyle p\times 1}
Σ {\displaystyle {\boldsymbol {\Sigma }}} п × п {\displaystyle p\times p}
ν > 0 {\displaystyle \nu >0}
Поддерживать х Р п {\displaystyle \mathbf {x} \in \mathbb {R} ^{p}\!}
PDF Г [ ( ν + п ) / 2 ] Г ( ν / 2 ) ν п / 2 π п / 2 | Σ | 1 / 2 [ 1 + 1 ν ( х μ ) Т Σ 1 ( х μ ) ] ( ν + п ) / 2 {\displaystyle {\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\nu ^{p/2}\pi ^{p/2}\left|{\boldsymbol {\Sigma }}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {x} }-{\boldsymbol {\mu }})^{\rm {T}}{\boldsymbol {\Sigma }}^{-1}({\mathbf {x} }-{\boldsymbol {\mu }})\right]^{-(\nu +p)/2}}
СДФАналитическое выражение отсутствует, но смотрите текст для приближений
Иметь в виду μ {\displaystyle {\boldsymbol {\mu }}} если ; иначе не определено ν > 1 {\displaystyle \nu >1}
Медиана μ {\displaystyle {\boldsymbol {\mu }}}
Режим μ {\displaystyle {\boldsymbol {\mu }}}
Дисперсия ν ν 2 Σ {\displaystyle {\frac {\nu }{\nu -2}}{\boldsymbol {\Sigma }}} если ; иначе не определено ν > 2 {\displaystyle \nu >2}
Асимметрия0

В статистике многомерное t -распределение (или многомерное распределение Стьюдента ) — это многомерное распределение вероятностей . Это обобщение на случайные векторы t -распределения Стьюдента , которое является распределением, применимым к одномерным случайным величинам . В то время как случай случайной матрицы можно было бы рассматривать в рамках этой структуры, матричное t -распределение отличается и использует матричную структуру особым образом.

Определение

Один из распространенных методов построения многомерного t -распределения для случая измерений основан на наблюдении, что если и независимы и распределены как и (т.е. многомерное нормальное и хи-квадрат распределение ) соответственно, матрица представляет собой матрицу p  ×  p , а — постоянный вектор, то случайная величина имеет плотность [1] п {\displaystyle p} у {\displaystyle \mathbf {y} } ты {\displaystyle u} Н ( 0 , Σ ) {\displaystyle N({\mathbf {0} },{\boldsymbol {\Sigma }})} χ ν 2 {\displaystyle \chi _{\nu }^{2}} Σ {\displaystyle \mathbf {\Сигма } \,} μ {\displaystyle {\boldsymbol {\mu }}} х = у / ты / ν + μ {\textstyle {\mathbf {x} }={\mathbf {y} }/{\sqrt {u/\nu }}+{\boldsymbol {\mu }}}

Г [ ( ν + п ) / 2 ] Г ( ν / 2 ) ν п / 2 π п / 2 | Σ | 1 / 2 [ 1 + 1 ν ( х μ ) Т Σ 1 ( х μ ) ] ( ν + п ) / 2 {\displaystyle {\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\nu ^{p/2}\pi ^{p/2}\left|{\boldsymbol {\Sigma }}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {x} }-{\boldsymbol {\mu }})^{T}{\boldsymbol {\Sigma }}^{-1}({\mathbf {x} }-{\boldsymbol {\mu }})\right]^{-(\nu +p)/2}}

и считается распределенным как многомерное t -распределение с параметрами . Обратите внимание, что это не ковариационная матрица, поскольку ковариация задается выражением (для ). Σ , μ , ν {\displaystyle {\boldsymbol {\Sigma }}, {\boldsymbol {\mu }},\nu } Σ {\displaystyle \mathbf {\Сигма } } ν / ( ν 2 ) Σ {\displaystyle \nu /(\nu -2)\mathbf {\Sigma } } ν > 2 {\displaystyle \nu >2}

Конструктивное определение многомерного t -распределения одновременно служит алгоритмом выборки:

  1. Сгенерировать и , независимо. ты χ ν 2 {\displaystyle u\sim \chi _{\nu }^{2}} y N ( 0 , Σ ) {\displaystyle \mathbf {y} \sim N(\mathbf {0} ,{\boldsymbol {\Sigma }})}
  2. Вычислить . x y ν / u + μ {\displaystyle \mathbf {x} \gets \mathbf {y} {\sqrt {\nu /u}}+{\boldsymbol {\mu }}}

Эта формулировка приводит к иерархическому представлению многомерного t -распределения в виде масштабной смеси нормалей: где обозначает гамма-распределение с плотностью, пропорциональной , и условно следует за . u G a ( ν / 2 , ν / 2 ) {\displaystyle u\sim \mathrm {Ga} (\nu /2,\nu /2)} G a ( a , b ) {\displaystyle \mathrm {Ga} (a,b)} x a 1 e b x {\displaystyle x^{a-1}e^{-bx}} x u {\displaystyle \mathbf {x} \mid u} N ( μ , u 1 Σ ) {\displaystyle N({\boldsymbol {\mu }},u^{-1}{\boldsymbol {\Sigma }})}

В частном случае распределение представляет собой многомерное распределение Коши . ν = 1 {\displaystyle \nu =1}

Вывод

На самом деле существует много кандидатов на многомерное обобщение t -распределения Стьюдента . Обширный обзор этой области был дан Котцем и Надараджа (2004). Основная проблема заключается в определении функции плотности вероятности нескольких переменных, которая является подходящим обобщением формулы для одномерного случая. В одном измерении ( ), с и , мы имеем функцию плотности вероятности p = 1 {\displaystyle p=1} t = x μ {\displaystyle t=x-\mu } Σ = 1 {\displaystyle \Sigma =1}

f ( t ) = Γ [ ( ν + 1 ) / 2 ] ν π Γ [ ν / 2 ] ( 1 + t 2 / ν ) ( ν + 1 ) / 2 {\displaystyle f(t)={\frac {\Gamma [(\nu +1)/2]}{{\sqrt {\nu \pi \,}}\,\Gamma [\nu /2]}}(1+t^{2}/\nu )^{-(\nu +1)/2}}

и один из подходов заключается в использовании соответствующей функции нескольких переменных. Это основная идея теории эллиптического распределения , где записывается соответствующая функция переменных , которая заменяется квадратичной функцией всех . Ясно, что это имеет смысл только тогда, когда все маргинальные распределения имеют одинаковые степени свободы . При , есть простой выбор многомерной функции плотности p {\displaystyle p} t i {\displaystyle t_{i}} t 2 {\displaystyle t^{2}} t i {\displaystyle t_{i}} ν {\displaystyle \nu } A = Σ 1 {\displaystyle \mathbf {A} ={\boldsymbol {\Sigma }}^{-1}}

f ( t ) = Γ ( ( ν + p ) / 2 ) | A | 1 / 2 ν p π p Γ ( ν / 2 ) ( 1 + i , j = 1 p , p A i j t i t j / ν ) ( ν + p ) / 2 {\displaystyle f(\mathbf {t} )={\frac {\Gamma ((\nu +p)/2)\left|\mathbf {A} \right|^{1/2}}{{\sqrt {\nu ^{p}\pi ^{p}\,}}\,\Gamma (\nu /2)}}\left(1+\sum _{i,j=1}^{p,p}A_{ij}t_{i}t_{j}/\nu \right)^{-(\nu +p)/2}}

что является стандартным, но не единственным вариантом.

Важным частным случаем является стандартное двумерное t - распределение., р = 2:

f ( t 1 , t 2 ) = | A | 1 / 2 2 π ( 1 + i , j = 1 2 , 2 A i j t i t j / ν ) ( ν + 2 ) / 2 {\displaystyle f(t_{1},t_{2})={\frac {\left|\mathbf {A} \right|^{1/2}}{2\pi }}\left(1+\sum _{i,j=1}^{2,2}A_{ij}t_{i}t_{j}/\nu \right)^{-(\nu +2)/2}}

Обратите внимание, что . Γ ( ν + 2 2 ) π   ν Γ ( ν 2 ) = 1 2 π {\displaystyle {\frac {\Gamma \left({\frac {\nu +2}{2}}\right)}{\pi \ \nu \Gamma \left({\frac {\nu }{2}}\right)}}={\frac {1}{2\pi }}}

Теперь, если - единичная матрица, то плотность равна A {\displaystyle \mathbf {A} }

f ( t 1 , t 2 ) = 1 2 π ( 1 + ( t 1 2 + t 2 2 ) / ν ) ( ν + 2 ) / 2 . {\displaystyle f(t_{1},t_{2})={\frac {1}{2\pi }}\left(1+(t_{1}^{2}+t_{2}^{2})/\nu \right)^{-(\nu +2)/2}.}

Трудность со стандартным представлением раскрывается этой формулой, которая не факторизуется в произведение маргинальных одномерных распределений. Когда является диагональным, можно показать, что стандартное представление имеет нулевую корреляцию , но маргинальные распределения не являются статистически независимыми . Σ {\displaystyle \Sigma }

Примечательным спонтанным явлением эллиптического многомерного распределения является его формальное математическое проявление, когда методы наименьших квадратов применяются к многомерным нормальным данным, таким как классическое эконометрическое решение минимальной дисперсии Марковица для портфелей активов. [2]

Кумулятивная функция распределения

Определение кумулятивной функции распределения (cdf) в одном измерении можно расширить до нескольких измерений, определив следующую вероятность (здесь — действительный вектор): x {\displaystyle \mathbf {x} }

F ( x ) = P ( X x ) , where X t ν ( μ , Σ ) . {\displaystyle F(\mathbf {x} )=\mathbb {P} (\mathbf {X} \leq \mathbf {x} ),\quad {\textrm {where}}\;\;\mathbf {X} \sim t_{\nu }({\boldsymbol {\mu }},{\boldsymbol {\Sigma }}).}

Простой формулы для не существует , но ее можно аппроксимировать численно с помощью интегрирования Монте-Карло . [3] [4] [5] F ( x ) {\displaystyle F(\mathbf {x} )}

Условное распределение

Это было разработано Мьюирхедом [6] и Корнишем [7] , но позже получено с использованием более простого представления отношения хи-квадрат, представленного выше, Ротом [1] и Дином [8] . Пусть вектор следует многомерному распределению t и разбивается на два подвектора элементов: X {\displaystyle X} p 1 , p 2 {\displaystyle p_{1},p_{2}}

X p = [ X 1 X 2 ] t p ( μ p , Σ p × p , ν ) {\displaystyle X_{p}={\begin{bmatrix}X_{1}\\X_{2}\end{bmatrix}}\sim t_{p}\left(\mu _{p},\Sigma _{p\times p},\nu \right)}

где , известные средние векторы равны , а масштабная матрица равна . p 1 + p 2 = p {\displaystyle p_{1}+p_{2}=p} μ p = [ μ 1 μ 2 ] {\displaystyle \mu _{p}={\begin{bmatrix}\mu _{1}\\\mu _{2}\end{bmatrix}}} Σ p × p = [ Σ 11 Σ 12 Σ 21 Σ 22 ] {\displaystyle \Sigma _{p\times p}={\begin{bmatrix}\Sigma _{11}&\Sigma _{12}\\\Sigma _{21}&\Sigma _{22}\end{bmatrix}}}

Рот и Дин обнаружили, что условное распределение представляет собой новое t -распределение с измененными параметрами. p ( X 1 | X 2 ) {\displaystyle p(X_{1}|X_{2})}

X 1 | X 2 t p 1 ( μ 1 | 2 , ν + d 2 ν + p 2 Σ 11 | 2 , ν + p 2 ) {\displaystyle X_{1}|X_{2}\sim t_{p_{1}}\left(\mu _{1|2},{\frac {\nu +d_{2}}{\nu +p_{2}}}\Sigma _{11|2},\nu +p_{2}\right)}

Эквивалентное выражение у Котца и др. несколько менее лаконично.

Таким образом, условное распределение проще всего представить в виде двухшаговой процедуры. Сначала сформируем промежуточное распределение выше, затем, используя параметры ниже, явное условное распределение становится X 1 | X 2 t p 1 ( μ 1 | 2 , Ψ , ν ~ ) {\displaystyle X_{1}|X_{2}\sim t_{p_{1}}\left(\mu _{1|2},\Psi ,{\tilde {\nu }}\right)}

f ( X 1 | X 2 ) = Γ [ ( ν ~ + p 1 ) / 2 ] Γ ( ν ~ / 2 ) ( π ν ~ ) p 1 / 2 | Ψ | 1 / 2 [ 1 + 1 ν ~ ( X 1 μ 1 | 2 ) T Ψ 1 ( X 1 μ 1 | 2 ) ] ( ν ~ + p 1 ) / 2 {\displaystyle f(X_{1}|X_{2})={\frac {\Gamma \left[({\tilde {\nu }}+p_{1})/2\right]}{\Gamma ({\tilde {\nu }}/2)(\pi \,{\tilde {\nu }})^{p_{1}/2}\left|{\boldsymbol {\Psi }}\right|^{1/2}}}\left[1+{\frac {1}{\tilde {\nu }}}(X_{1}-\mu _{1|2})^{T}{\boldsymbol {\Psi }}^{-1}(X_{1}-\mu _{1|2})\right]^{-({\tilde {\nu }}+p_{1})/2}}

где

ν ~ = ν + p 2 {\displaystyle {\tilde {\nu }}=\nu +p_{2}} Эффективные степени свободы увеличиваются за счет числа неиспользуемых переменных . ν {\displaystyle \nu } p 2 {\displaystyle p_{2}}
μ 1 | 2 = μ 1 + Σ 12 Σ 22 1 ( X 2 μ 2 ) {\displaystyle \mu _{1|2}=\mu _{1}+\Sigma _{12}\Sigma _{22}^{-1}\left(X_{2}-\mu _{2}\right)} является условным средним значением x 1 {\displaystyle x_{1}}
Σ 11 | 2 = Σ 11 Σ 12 Σ 22 1 Σ 21 {\displaystyle \Sigma _{11|2}=\Sigma _{11}-\Sigma _{12}\Sigma _{22}^{-1}\Sigma _{21}} является дополнением Шура . Σ 22  in  Σ {\displaystyle \Sigma _{22}{\text{ in }}\Sigma }
d 2 = ( X 2 μ 2 ) T Σ 22 1 ( X 2 μ 2 ) {\displaystyle d_{2}=(X_{2}-\mu _{2})^{T}\Sigma _{22}^{-1}(X_{2}-\mu _{2})} это квадрат расстояния Махаланобиса от с матрицей масштаба X 2 {\displaystyle X_{2}} μ 2 {\displaystyle \mu _{2}} Σ 22 {\displaystyle \Sigma _{22}}
Ψ = ν + d 2 ν + p 2 Σ 11 | 2 {\displaystyle \Psi ={\frac {\nu +d_{2}}{\nu +p_{2}}}\Sigma _{11|2}} — условная ковариация для . ν ~ > 2 {\displaystyle {\tilde {\nu }}>2}

Копулы, основанные на многомерностит

Использование таких распределений вновь вызывает интерес в связи с их применением в финансовой математике , особенно благодаря использованию t- копулы Стьюдента . [9]

Эллиптическое представление

Построенное как эллиптическое распределение , [10] возьмем простейший централизованный случай со сферической симметрией и без масштабирования, тогда многомерная t -PDF примет вид Σ = I {\displaystyle \Sigma =\operatorname {I} \,}

f X ( X ) = g ( X T X ) = Γ ( 1 2 ( ν + p ) ) ( ν π ) p / 2 Γ ( 1 2 ν ) ( 1 + ν 1 X T X ) ( ν + p ) / 2 {\displaystyle f_{X}(X)=g(X^{T}X)={\frac {\Gamma {\big (}{\frac {1}{2}}(\nu +p)\,{\big )}}{(\nu \pi )^{\,p/2}\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}}{\bigg (}1+\nu ^{-1}X^{T}X{\bigg )}^{-(\nu +p)/2}}

где и = степени свободы, как определено в Muirhead [6] раздел 1.5. Ковариация равна X = ( x 1 , , x p ) T  is a  p -vector {\displaystyle X=(x_{1},\cdots ,x_{p})^{T}{\text{ is a }}p{\text{-vector}}} ν {\displaystyle \nu } X {\displaystyle X}

E ( X X T ) = f X ( x 1 , , x p ) X X T d x 1 d x p = ν ν 2 I {\displaystyle \operatorname {E} \left(XX^{T}\right)=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{X}(x_{1},\dots ,x_{p})XX^{T}\,dx_{1}\dots dx_{p}={\frac {\nu }{\nu -2}}\operatorname {I} }

Цель состоит в том, чтобы преобразовать декартову PDF в радиальную. Кибрия и Джоардер [11] определяют радиальную меру и, отмечая, что плотность зависит только от r 2 , мы получаем r 2 = R 2 = X T X p {\displaystyle r_{2}=R^{2}={\frac {X^{T}X}{p}}}

E [ r 2 ] = f X ( x 1 , , x p ) X T X p d x 1 d x p = ν ν 2 {\displaystyle \operatorname {E} [r_{2}]=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{X}(x_{1},\dots ,x_{p}){\frac {X^{T}X}{p}}\,dx_{1}\dots dx_{p}={\frac {\nu }{\nu -2}}}

что эквивалентно дисперсии вектора -элементов , рассматриваемого как одномерная случайная последовательность с тяжелым хвостом и нулевым средним с некоррелированными, но статистически зависимыми элементами. p {\displaystyle p} X {\displaystyle X}

Радиальное распределение

r 2 = X T X p {\displaystyle r_{2}={\frac {X^{T}X}{p}}} следует распределению Фишера-Снедекора : F {\displaystyle F}

r 2 f F ( p , ν ) = B ( p 2 , ν 2 ) 1 ( p ν ) p / 2 r 2 p / 2 1 ( 1 + p ν r 2 ) ( p + ν ) / 2 {\displaystyle r_{2}\sim f_{F}(p,\nu )=B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}{\bigg (}{\frac {p}{\nu }}{\bigg )}^{p/2}r_{2}^{p/2-1}{\bigg (}1+{\frac {p}{\nu }}r_{2}{\bigg )}^{-(p+\nu )/2}}

имеющие среднее значение . -распределения возникают естественным образом в тестах сумм квадратов выборочных данных после нормализации по стандартному отклонению выборки. E [ r 2 ] = ν ν 2 {\displaystyle \operatorname {E} [r_{2}]={\frac {\nu }{\nu -2}}} F {\displaystyle F}

Заменив случайную величину на в уравнении выше, сохранив -вектор , мы имеем и распределение вероятностей y = p ν r 2 = X T X ν {\displaystyle y={\frac {p}{\nu }}r_{2}={\frac {X^{T}X}{\nu }}} p {\displaystyle p} X {\displaystyle X} E [ y ] = f X ( X ) X T X ν d x 1 d x p = p ν 2 {\displaystyle \operatorname {E} [y]=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{X}(X){\frac {X^{T}X}{\nu }}\,dx_{1}\dots dx_{p}={\frac {p}{\nu -2}}}

f Y ( y | p , ν ) = | p ν | 1 B ( p 2 , ν 2 ) 1 ( p ν ) p / 2 ( p ν ) p / 2 1 y p / 2 1 ( 1 + y ) ( p + ν ) / 2 = B ( p 2 , ν 2 ) 1 y p / 2 1 ( 1 + y ) ( ν + p ) / 2 {\displaystyle {\begin{aligned}f_{Y}(y|\,p,\nu )&=\left|{\frac {p}{\nu }}\right|^{-1}B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}{\big (}{\frac {p}{\nu }}{\big )}^{\,p/2}{\big (}{\frac {p}{\nu }}{\big )}^{-p/2-1}y^{\,p/2-1}{\big (}1+y{\big )}^{-(p+\nu )/2}\\\\&=B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}y^{\,p/2-1}(1+y)^{-(\nu +p)/2}\end{aligned}}}

которое является регулярным бета-простым распределением, имеющим среднее значение . y β ( y ; p 2 , ν 2 ) {\displaystyle y\sim \beta \,'{\bigg (}y;{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}} 1 2 p 1 2 ν 1 = p ν 2 {\displaystyle {\frac {{\frac {1}{2}}p}{{\frac {1}{2}}\nu -1}}={\frac {p}{\nu -2}}}

Кумулятивное радиальное распределение

Учитывая бета-штриховое распределение, радиальная кумулятивная функция распределения известна: y {\displaystyle y}

F Y ( y ) I ( y 1 + y ; p 2 , ν 2 ) B ( p 2 , ν 2 ) 1 {\displaystyle F_{Y}(y)\sim I\,{\bigg (}{\frac {y}{1+y}};\,{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}}

где — неполная бета-функция , применимая при сферическом предположении. I {\displaystyle I} Σ {\displaystyle \Sigma }

В скалярном случае распределение эквивалентно Стьюденту -t с эквивалентностью , причем переменная t имеет двусторонние хвосты для целей CDF, т.е. «двухвостый t-тест». p = 1 {\displaystyle p=1} t 2 = y 2 σ 1 {\displaystyle t^{2}=y^{2}\sigma ^{-1}}

Радиальное распределение также может быть получено с помощью прямого преобразования координат из декартовых в сферические. Поверхность постоянного радиуса при с PDF является поверхностью изоплотности. При этом значении плотности квант вероятности на оболочке с площадью поверхности и толщиной при равен . R = ( X T X ) 1 / 2 {\displaystyle R=(X^{T}X)^{1/2}} p X ( X ) ( 1 + ν 1 R 2 ) ( ν + p ) / 2 {\displaystyle p_{X}(X)\propto {\bigg (}1+\nu ^{-1}R^{2}{\bigg )}^{-(\nu +p)/2}} A R {\displaystyle A_{R}} δ R {\displaystyle \delta R} R {\displaystyle R} δ P = p X ( R ) A R δ R {\displaystyle \delta P=p_{X}(R)\,A_{R}\delta R}

Заключенная сфера радиуса имеет площадь поверхности . Подстановка в показывает, что оболочка имеет элемент вероятности , который эквивалентен радиальной функции плотности p {\displaystyle p} R {\displaystyle R} A R = 2 π p / 2 R p 1 Γ ( p / 2 ) {\displaystyle A_{R}={\frac {2\pi ^{p/2}R^{\,p-1}}{\Gamma (p/2)}}} δ P {\displaystyle \delta P} δ P = p X ( R ) 2 π p / 2 R p 1 Γ ( p / 2 ) δ R {\displaystyle \delta P=p_{X}(R){\frac {2\pi ^{p/2}R^{p-1}}{\Gamma (p/2)}}\delta R}

f R ( R ) = Γ ( 1 2 ( ν + p ) ) ν p / 2 π p / 2 Γ ( 1 2 ν ) 2 π p / 2 R p 1 Γ ( p / 2 ) ( 1 + R 2 ν ) ( ν + p ) / 2 {\displaystyle f_{R}(R)={\frac {\Gamma {\big (}{\frac {1}{2}}(\nu +p)\,{\big )}}{\nu ^{\,p/2}\pi ^{\,p/2}\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}}{\frac {2\pi ^{p/2}R^{p-1}}{\Gamma (p/2)}}{\bigg (}1+{\frac {R^{2}}{\nu }}{\bigg )}^{-(\nu +p)/2}}

что еще больше упрощается до , где — бета-функция . f R ( R ) = 2 ν 1 / 2 B ( 1 2 p , 1 2 ν ) ( R 2 ν ) ( p 1 ) / 2 ( 1 + R 2 ν ) ( ν + p ) / 2 {\displaystyle f_{R}(R)={\frac {2}{\nu ^{1/2}B{\big (}{\frac {1}{2}}p,{\frac {1}{2}}\nu {\big )}}}{\bigg (}{\frac {R^{2}}{\nu }}{\bigg )}^{(p-1)/2}{\bigg (}1+{\frac {R^{2}}{\nu }}{\bigg )}^{-(\nu +p)/2}} B ( , ) {\displaystyle B(*,*)}

Изменение радиальной переменной на возвращает предыдущее распределение Beta Prime y = R 2 / ν {\displaystyle y=R^{2}/\nu }

f Y ( y ) = 1 B ( 1 2 p , 1 2 ν ) y p / 2 1 ( 1 + y ) ( ν + p ) / 2 {\displaystyle f_{Y}(y)={\frac {1}{B{\big (}{\frac {1}{2}}p,{\frac {1}{2}}\nu {\big )}}}y^{\,p/2-1}{\bigg (}1+y{\bigg )}^{-(\nu +p)/2}}

Чтобы масштабировать радиальные переменные без изменения функции радиальной формы, определите матрицу масштабирования , что даст 3-параметрическую декартову функцию плотности, т.е. вероятность в элементе объема равна Σ = α I {\displaystyle \Sigma =\alpha \operatorname {I} } Δ P {\displaystyle \Delta _{P}} d x 1 d x p {\displaystyle dx_{1}\dots dx_{p}}

Δ P ( f X ( X | α , p , ν ) ) = Γ ( 1 2 ( ν + p ) ) ( ν π ) p / 2 α p / 2 Γ ( 1 2 ν ) ( 1 + X T X α ν ) ( ν + p ) / 2 d x 1 d x p {\displaystyle \Delta _{P}{\big (}f_{X}(X\,|\alpha ,p,\nu ){\big )}={\frac {\Gamma {\big (}{\frac {1}{2}}(\nu +p)\,{\big )}}{(\nu \pi )^{\,p/2}\alpha ^{\,p/2}\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}}{\bigg (}1+{\frac {X^{T}X}{\alpha \nu }}{\bigg )}^{-(\nu +p)/2}\;dx_{1}\dots dx_{p}}

или, в терминах скалярной радиальной переменной , R {\displaystyle R}

f R ( R | α , p , ν ) = 2 α 1 / 2 ν 1 / 2 B ( 1 2 p , 1 2 ν ) ( R 2 α ν ) ( p 1 ) / 2 ( 1 + R 2 α ν ) ( ν + p ) / 2 {\displaystyle f_{R}(R\,|\alpha ,p,\nu )={\frac {2}{\alpha ^{1/2}\;\nu ^{1/2}B{\big (}{\frac {1}{2}}p,{\frac {1}{2}}\nu {\big )}}}{\bigg (}{\frac {R^{2}}{\alpha \,\nu }}{\bigg )}^{(p-1)/2}{\bigg (}1+{\frac {R^{2}}{\alpha \,\nu }}{\bigg )}^{-(\nu +p)/2}}

Радиальные моменты

Моменты всех радиальных переменных , при предположении сферического распределения, могут быть выведены из распределения Beta Prime. Если , то , известный результат. Таким образом, для переменной имеем Z β ( a , b ) {\displaystyle Z\sim \beta '(a,b)} E ( Z m ) = B ( a + m , b m ) B ( a , b ) {\displaystyle \operatorname {E} (Z^{m})={\frac {B(a+m,b-m)}{B(a,b)}}} y = p ν R 2 {\displaystyle y={\frac {p}{\nu }}R^{2}}

E ( y m ) = B ( 1 2 p + m , 1 2 ν m ) B ( 1 2 p , 1 2 ν ) = Γ ( 1 2 p + m ) Γ ( 1 2 ν m ) Γ ( 1 2 p ) Γ ( 1 2 ν ) , ν / 2 > m {\displaystyle \operatorname {E} (y^{m})={\frac {B({\frac {1}{2}}p+m,{\frac {1}{2}}\nu -m)}{B({\frac {1}{2}}p,{\frac {1}{2}}\nu )}}={\frac {\Gamma {\big (}{\frac {1}{2}}p+m{\big )}\;\Gamma {\big (}{\frac {1}{2}}\nu -m{\big )}}{\Gamma {\big (}{\frac {1}{2}}p{\big )}\;\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}},\;\nu /2>m}

Моменты есть r 2 = ν y {\displaystyle r_{2}=\nu \,y}

E ( r 2 m ) = ν m E ( y m ) {\displaystyle \operatorname {E} (r_{2}^{m})=\nu ^{m}\operatorname {E} (y^{m})}

при этом введение масштабной матрицы дает α I {\displaystyle \alpha \operatorname {I} }

E ( r 2 m | α ) = α m ν m E ( y m ) {\displaystyle \operatorname {E} (r_{2}^{m}|\alpha )=\alpha ^{m}\nu ^{m}\operatorname {E} (y^{m})}

Моменты, относящиеся к радиальной переменной, находятся путем установки и после чего R {\displaystyle R} R = ( α ν y ) 1 / 2 {\displaystyle R=(\alpha \nu y)^{1/2}} M = 2 m {\displaystyle M=2m}

E ( R M ) = E ( ( α ν y ) 1 / 2 ) 2 m = ( α ν ) M / 2 E ( y M / 2 ) = ( α ν ) M / 2 B ( 1 2 ( p + M ) , 1 2 ( ν M ) ) B ( 1 2 p , 1 2 ν ) {\displaystyle \operatorname {E} (R^{M})=\operatorname {E} {\big (}(\alpha \nu y)^{1/2}{\big )}^{2m}=(\alpha \nu )^{M/2}\operatorname {E} (y^{M/2})=(\alpha \nu )^{M/2}{\frac {B{\big (}{\frac {1}{2}}(p+M),{\frac {1}{2}}(\nu -M){\big )}}{B({\frac {1}{2}}p,{\frac {1}{2}}\nu )}}}

Линейные комбинации и аффинное преобразование

Полное преобразование ранга

Это тесно связано с многомерным нормальным методом и описано в Kotz и Nadarajah, Kibria и Joarder, Roth и Cornish. Начиная с несколько упрощенной версии центральной MV-t pdf: , где — константа, а — произвольная, но фиксированная, пусть — матрица полного ранга и вектор формы . Затем, путем прямой замены переменных f X ( X ) = K | Σ | 1 / 2 ( 1 + ν 1 X T Σ 1 X ) ( ν + p ) / 2 {\displaystyle f_{X}(X)={\frac {\mathrm {K} }{\left|\Sigma \right|^{1/2}}}\left(1+\nu ^{-1}X^{T}\Sigma ^{-1}X\right)^{-\left(\nu +p\right)/2}} K {\displaystyle \mathrm {K} } ν {\displaystyle \nu } Θ R p × p {\displaystyle \Theta \in \mathbb {R} ^{p\times p}} Y = Θ X {\displaystyle Y=\Theta X}

f Y ( Y ) = K | Σ | 1 / 2 ( 1 + ν 1 Y T Θ T Σ 1 Θ 1 Y ) ( ν + p ) / 2 | Y X | 1 {\displaystyle f_{Y}(Y)={\frac {\mathrm {K} }{\left|\Sigma \right|^{1/2}}}\left(1+\nu ^{-1}Y^{T}\Theta ^{-T}\Sigma ^{-1}\Theta ^{-1}Y\right)^{-\left(\nu +p\right)/2}\left|{\frac {\partial Y}{\partial X}}\right|^{-1}}

Матрица частных производных равна и якобиан становится . Таким образом Y i X j = Θ i , j {\displaystyle {\frac {\partial Y_{i}}{\partial X_{j}}}=\Theta _{i,j}} | Y X | = | Θ | {\displaystyle \left|{\frac {\partial Y}{\partial X}}\right|=\left|\Theta \right|}

f Y ( Y ) = K | Σ | 1 / 2 | Θ | ( 1 + ν 1 Y T Θ T Σ 1 Θ 1 Y ) ( ν + p ) / 2 {\displaystyle f_{Y}(Y)={\frac {\mathrm {K} }{\left|\Sigma \right|^{1/2}\left|\Theta \right|}}\left(1+\nu ^{-1}Y^{T}\Theta ^{-T}\Sigma ^{-1}\Theta ^{-1}Y\right)^{-\left(\nu +p\right)/2}}

Знаменатель уменьшается до

| Σ | 1 / 2 | Θ | = | Σ | 1 / 2 | Θ | 1 / 2 | Θ T | 1 / 2 = | Θ Σ Θ T | 1 / 2 {\displaystyle \left|\Sigma \right|^{1/2}\left|\Theta \right|=\left|\Sigma \right|^{1/2}\left|\Theta \right|^{1/2}\left|\Theta ^{T}\right|^{1/2}=\left|\Theta \Sigma \Theta ^{T}\right|^{1/2}}

Полностью:

f Y ( Y ) = Γ [ ( ν + p ) / 2 ] Γ ( ν / 2 ) ( ν π ) p / 2 | Θ Σ Θ T | 1 / 2 ( 1 + ν 1 Y T ( Θ Σ Θ T ) 1 Y ) ( ν + p ) / 2 {\displaystyle f_{Y}(Y)={\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,p/2}\left|\Theta \Sigma \Theta ^{T}\right|^{1/2}}}\left(1+\nu ^{-1}Y^{T}\left(\Theta \Sigma \Theta ^{T}\right)^{-1}Y\right)^{-\left(\nu +p\right)/2}}

что является обычным распределением MV -t .

В общем случае, если и имеет полный ранг , то X t p ( μ , Σ , ν ) {\displaystyle X\sim t_{p}(\mu ,\Sigma ,\nu )} Θ p × p {\displaystyle \Theta ^{p\times p}} p {\displaystyle p}

Θ X + c t p ( Θ μ + c , Θ Σ Θ T , ν ) {\displaystyle \Theta X+c\sim t_{p}(\Theta \mu +c,\Theta \Sigma \Theta ^{T},\nu )}

Предельные распределения

Это частный случай линейного преобразования, уменьшающего ранг, представленного ниже. Коц определяет маргинальные распределения следующим образом. Разбиение на два подвектора элементов: X t ( p , μ , Σ , ν ) {\displaystyle X\sim t(p,\mu ,\Sigma ,\nu )} p 1 , p 2 {\displaystyle p_{1},p_{2}}

X p = [ X 1 X 2 ] t ( p 1 + p 2 , μ p , Σ p × p , ν ) {\displaystyle X_{p}={\begin{bmatrix}X_{1}\\X_{2}\end{bmatrix}}\sim t\left(p_{1}+p_{2},\mu _{p},\Sigma _{p\times p},\nu \right)}

с , означает , масштабная матрица p 1 + p 2 = p {\displaystyle p_{1}+p_{2}=p} μ p = [ μ 1 μ 2 ] {\displaystyle \mu _{p}={\begin{bmatrix}\mu _{1}\\\mu _{2}\end{bmatrix}}} Σ p × p = [ Σ 11 Σ 12 Σ 21 Σ 22 ] {\displaystyle \Sigma _{p\times p}={\begin{bmatrix}\Sigma _{11}&\Sigma _{12}\\\Sigma _{21}&\Sigma _{22}\end{bmatrix}}}

тогда , такой что X 1 t ( p 1 , μ 1 , Σ 11 , ν ) {\displaystyle X_{1}\sim t\left(p_{1},\mu _{1},\Sigma _{11},\nu \right)} X 2 t ( p 2 , μ 2 , Σ 22 , ν ) {\displaystyle X_{2}\sim t\left(p_{2},\mu _{2},\Sigma _{22},\nu \right)}

f ( X 1 ) = Γ [ ( ν + p 1 ) / 2 ] Γ ( ν / 2 ) ( ν π ) p 1 / 2 | Σ 11 | 1 / 2 [ 1 + 1 ν ( X 1 μ 1 ) T Σ 11 1 ( X 1 μ 1 ) ] ( ν + p 1 ) / 2 {\displaystyle f(X_{1})={\frac {\Gamma \left[(\nu +p_{1})/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,p_{1}/2}\left|{{\boldsymbol {\Sigma }}_{11}}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {X} _{1}}-{{\boldsymbol {\mu }}_{1}})^{T}{\boldsymbol {\Sigma }}_{11}^{-1}({\mathbf {X} _{1}}-{{\boldsymbol {\mu }}_{1}})\right]^{-(\nu \,+\,p_{1})/2}}
f ( X 2 ) = Γ [ ( ν + p 2 ) / 2 ] Γ ( ν / 2 ) ( ν π ) p 2 / 2 | Σ 22 | 1 / 2 [ 1 + 1 ν ( X 2 μ 2 ) T Σ 22 1 ( X 2 μ 2 ) ] ( ν + p 2 ) / 2 {\displaystyle f(X_{2})={\frac {\Gamma \left[(\nu +p_{2})/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,p_{2}/2}\left|{{\boldsymbol {\Sigma }}_{22}}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {X} _{2}}-{{\boldsymbol {\mu }}_{2}})^{T}{\boldsymbol {\Sigma }}_{22}^{-1}({\mathbf {X} _{2}}-{{\boldsymbol {\mu }}_{2}})\right]^{-(\nu \,+\,p_{2})/2}}

Если преобразование построено в виде

Θ p 1 × p = [ 1 0 0 0 0 0 0 1 0 ] {\displaystyle \Theta _{p_{1}\times \,p}={\begin{bmatrix}1&\cdots &0&\cdots &0\\0&\ddots &0&\cdots &0\\0&\cdots &1&\cdots &0\end{bmatrix}}}

тогда вектор , как обсуждается ниже, имеет то же распределение, что и предельное распределение . Y = Θ X {\displaystyle Y=\Theta X} X 1 {\displaystyle X_{1}}

Линейное преобразование, уменьшающее ранг

В случае линейного преобразования, если — прямоугольная матрица , ранга результатом является уменьшение размерности. Здесь якобиан, по-видимому, прямоугольный, но значение в знаменателе pdf, тем не менее, верно. Обсуждение определителей произведения прямоугольных матриц есть в Aitken. [12] В общем случае, если и имеет полный ранг , то Θ {\displaystyle \Theta } Θ R m × p , m < p {\displaystyle \Theta \in \mathbb {R} ^{m\times p},m<p} m {\displaystyle m} | Θ | {\displaystyle \left|\Theta \right|} | Θ Σ Θ T | 1 / 2 {\displaystyle \left|\Theta \Sigma \Theta ^{T}\right|^{1/2}} X t ( p , μ , Σ , ν ) {\displaystyle X\sim t(p,\mu ,\Sigma ,\nu )} Θ m × p {\displaystyle \Theta ^{m\times p}} m {\displaystyle m}

Y = Θ X + c t ( m , Θ μ + c , Θ Σ Θ T , ν ) {\displaystyle Y=\Theta X+c\sim t(m,\Theta \mu +c,\Theta \Sigma \Theta ^{T},\nu )}
f Y ( Y ) = Γ [ ( ν + m ) / 2 ] Γ ( ν / 2 ) ( ν π ) m / 2 | Θ Σ Θ T | 1 / 2 [ 1 + 1 ν ( Y c 1 ) T ( Θ Σ Θ T ) 1 ( Y c 1 ) ] ( ν + m ) / 2 , c 1 = Θ μ + c {\displaystyle f_{Y}(Y)={\frac {\Gamma \left[(\nu +m)/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,m/2}\left|\Theta \Sigma \Theta ^{T}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}(Y-c_{1})^{T}(\Theta \Sigma \Theta ^{T})^{-1}(Y-c_{1})\right]^{-(\nu \,+\,m)/2},\;c_{1}=\Theta \mu +c}

В крайнем случае , если m = 1 и становится вектором-строкой, то скаляр Y следует одномерному двухстороннему распределению Стьюдента-t, определяемому с теми же степенями свободы. Кибрия и др. используют аффинное преобразование для нахождения маргинальных распределений, которые также являются MV- t . Θ {\displaystyle \Theta } t 2 = Y 2 / σ 2 {\displaystyle t^{2}=Y^{2}/\sigma ^{2}} ν {\displaystyle \nu }

  • При аффинных преобразованиях переменных с эллиптическими распределениями все векторы в конечном итоге должны вытекать из одного исходного изотропного сферического вектора , элементы которого остаются «запутанными» и не являются статистически независимыми. Z {\displaystyle Z}
  • Вектор независимых выборок Стьюдента t не согласуется с многомерным t- распределением.
  • Добавление двух выборочных многомерных t -векторов, сгенерированных с независимыми выборками хи-квадрат и различными значениями: не приведет к получению внутренне согласованных распределений, хотя и приведет к проблеме Беренса-Фишера . [13] ν {\displaystyle \nu } 1 / u 1 / ν 1 , 1 / u 2 / ν 2 {\textstyle {1}/{\sqrt {u_{1}/\nu _{1}}},\;\;{1}/{\sqrt {u_{2}/\nu _{2}}}}
  • Талеб сравнивает множество примеров эллиптических распределений с толстым хвостом и неэллиптических многомерных распределений
  • В одномерной статистике t -критерий Стьюдента использует t -распределение Стьюдента.
  • Эллиптическое многомерное t- распределение возникает спонтанно в линейно ограниченных решениях наименьших квадратов, включающих многомерные нормальные исходные данные, например, решение Марковица с глобальной минимальной дисперсией в финансовом портфельном анализе. [14] [15] [2] которое рассматривает ансамбль нормальных случайных векторов или случайную матрицу. Оно не возникает в обычных наименьших квадратах (OLS) или множественной регрессии с фиксированными зависимыми и независимыми переменными, проблема которых имеет тенденцию производить хорошо себя ведущие нормальные вероятности ошибок.
  • Распределение T -квадрат Хотеллинга — это распределение, возникающее в многомерной статистике.
  • Матричное t -распределение представляет собой распределение случайных величин, организованных в матричную структуру .

Смотрите также

Ссылки

  1. ^ ab Roth, Michael (17 апреля 2013 г.). "On the Multivariate t Distribution" (PDF) . Группа автоматического управления. Университет Линчёпина, Швеция . Архивировано (PDF) из оригинала 31 июля 2022 г. . Получено 1 июня 2022 г. .
  2. ^ ab Bodnar, T; Okhrin, Y (2008). "Свойства сингулярного, обратного и обобщенного обратного распределения Уишарта" (PDF) . Журнал многомерного анализа . 99 (Eqn.20): 2389– 2405. doi :10.1016/j.jmva.2008.02.024.
  3. ^ Ботев, З.; Чен, Ю.-Л. (2022). «Глава 4: Усеченные многомерные вычисления Стьюдента посредством экспоненциального наклона». В Ботеве, Здравко; Келлер, Александр; Лемье, Кристиан; Таффин, Бруно (ред.). Достижения в моделировании и симуляции: Festschrift для Пьера Л'Экуйера . Спрингер. стр.  65–87 . doi :10.1007/978-3-031-10193-9_4. ISBN 978-3-031-10192-2.
  4. ^ Botev, ZI; L'Ecuyer, P. (6 декабря 2015 г.). «Эффективная оценка вероятности и моделирование усеченного многомерного распределения Стьюдента-t». Зимняя конференция по моделированию 2015 г. (WSC) . Хантингтон-Бич, Калифорния, США: IEEE. стр.  380–391 . doi :10.1109/WSC.2015.7408180.
  5. ^ Генц, Алан (2009). Вычисление многомерных нормальных и t-вероятностей. Конспект лекций по статистике. Том 195. Springer. doi :10.1007/978-3-642-01689-9. ISBN 978-3-642-01689-9. Архивировано из оригинала 2022-08-27 . Получено 2017-09-05 .
  6. ^ ab Muirhead, Robb (1982). Аспекты многомерной статистической теории . США: Wiley. стр. 32–36 Теорема 1.5.4. ISBN 978-0-47 1-76985-9.
  7. ^ Корниш, EA (1954). «Многомерное t-распределение, связанное с набором отклонений нормальной выборки». Australian Journal of Physics . 7 : 531–542 . doi : 10.1071/PH550193 .
  8. ^ Дин, Пэн (2016). «Об условном распределении многомерного t-распределения». Американский статистик . 70 (3): 293–295 . arXiv : 1604.00561 . doi : 10.1080/00031305.2016.1164756. S2CID  55842994.
  9. ^ Демарта, Стефано; Макнил, Александр (2004). «Связка t и родственные связки» (PDF) . Risknet .
  10. ^ Осевальски, Яцек; Стил, Марк (1996). «Апостериорные моменты масштабных параметров в эллиптических моделях выборки». Байесовский анализ в статистике и эконометрике . Wiley. стр.  323–335 . ISBN 0-471-11856-7.
  11. ^ Kibria, KMG; Joarder, AH (январь 2006 г.). "Краткий обзор многомерного t-распределения" (PDF) . Журнал статистических исследований . 40 (1): 59–72 . doi :10.1007/s42979-021-00503-0. S2CID  232163198.
  12. ^ Эйткен, А.С. - (1948). Определители и матрицы (5-е изд.). Эдинбург: Оливер и Бойд. стр. Глава IV, раздел 36.
  13. ^ Хирон, Хавьер; дель Кастильо, Кармен (2010). «Многомерное распределение Беренса–Фишера». Журнал многомерного анализа . 101 (9): 2091– 2102. doi : 10.1016/j.jmva.2010.04.008 .
  14. ^ Охрин, Y; Шмид, W (2006). «Распределительные свойства весов портфеля». Журнал эконометрики . 134 : 235–256 . doi :10.1016/j.jeconom.2005.06.022.
  15. ^ Боднар, Т; Дмитрив, С; Пароля, Н; Шмид, В (2019). «Тесты для весов глобального минимального дисперсионного портфеля в многомерной обстановке». IEEE Trans. On Signal Processing . 67 (17): 4479– 4493. arXiv : 1710.09587 . Bibcode :2019ITSP...67.4479B. doi :10.1109/TSP.2019.2929964.

Литература

  • Kotz, Samuel; Nadarajah, Saralees (2004). Многомерные распределения t и их применение . Cambridge University Press. ISBN 978-0521826549.
  • Керубини, Умберто; Лучано, Элиза; Веккиато, Уолтер (2004). Копульные методы в финансах . Джон Уайли и сыновья. ISBN 978-0470863442.
  • Талеб, Нассим Николас (2023). Статистические последствия толстых хвостов (1-е изд.). Academic Press. ISBN 979-8218248031.
  • Методы копулы против канонических многомерных распределений: многомерное распределение Стьюдента T с общими степенями свободы
  • Многомерное распределение Стьюдента
Retrieved from "https://en.wikipedia.org/w/index.php?title=Multivariate_t-distribution&oldid=1269708623"