Матрица t-распределения

Матрицат
Обозначение Т н , п ( ν , М , Σ , Ω ) {\displaystyle {\rm {T}}_{n,p}(\nu ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})}
Параметры

М {\displaystyle \mathbf {М} } местоположение ( действительная матрица ) масштаб ( положительно-определенная действительная матрица ) масштаб ( положительно-определенная действительная матрица ) н × п {\displaystyle n\times p}
Ω {\displaystyle {\boldsymbol {\Омега }}} п × п {\displaystyle p\times p}
Σ {\displaystyle {\boldsymbol {\Sigma }}} н × н {\displaystyle n\times n}

ν > 0 {\displaystyle \nu >0} степени свободы (реальные)
Поддерживать Х Р н × п {\displaystyle \mathbf {X} \in \mathbb {R} ^{n\times p}}
PDF

Г п ( ν + н + п 1 2 ) ( π ) н п 2 Г п ( ν + п 1 2 ) | Ω | н 2 | Σ | п 2 {\displaystyle {\frac {\Gamma _{p}\left({\frac {\nu +n+p-1}{2}}\right)}{(\pi )^{\frac {np}{2}}\Gamma _{p}\left({\frac {\nu +p-1}{2}}\right)}}|{\boldsymbol {\Omega }}|^{-{\frac {n}{2}}}|{\boldsymbol {\Sigma }}|^{-{\frac {p}{2}}}}

× | я н + Σ 1 ( Х М ) Ω 1 ( Х М ) Т | ν + н + п 1 2 {\displaystyle \times \left|\mathbf {I} _{n}+{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right|^{-{\frac {\nu +n+p-1}{2}}}}
СДФНет аналитического выражения
Иметь в виду M {\displaystyle \mathbf {M} } если , иначе не определено ν > 1 {\displaystyle \nu >1}
Режим M {\displaystyle \mathbf {M} }
Дисперсия c o v ( v e c ( X ) ) = Σ Ω ν 2 {\displaystyle \mathrm {cov} (\mathrm {vec} (\mathbf {X} ))={\frac {{\boldsymbol {\Sigma }}\otimes {\boldsymbol {\Omega }}}{\nu -2}}} если , иначе не определено ν > 2 {\displaystyle \nu >2}
CFсм. ниже

В статистике матричное t -распределение (или матричное вариативное t -распределение ) является обобщением многомерного t - распределения с векторов на матрицы . [1] [2]

Матричное t -распределение имеет те же отношения с многомерным t -распределением, что и матричное нормальное распределение с многомерным нормальным распределением : если матрица имеет только одну строку или только один столбец, распределения становятся эквивалентными соответствующему (векторному) многомерному распределению. Матричное t -распределение представляет собой составное распределение , которое получается из бесконечной смеси матричного нормального распределения с обратным распределением Уишарта, помещенным над любой из его ковариационных матриц, [1] и многомерное t -распределение может быть сгенерировано аналогичным образом. [2]

В байесовском анализе многомерной линейной регрессионной модели, основанной на матричном нормальном распределении, матричное t -распределение является апостериорным предсказательным распределением . [3]

Определение

Для матричного t -распределения функция плотности вероятности в точке пространства равна X {\displaystyle \mathbf {X} } n × p {\displaystyle n\times p}

f ( X ; ν , M , Σ , Ω ) = K × | I n + Σ 1 ( X M ) Ω 1 ( X M ) T | ν + n + p 1 2 , {\displaystyle f(\mathbf {X} ;\nu ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})=K\times \left|\mathbf {I} _{n}+{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right|^{-{\frac {\nu +n+p-1}{2}}},}

где константа интегрирования K определяется выражением

K = Γ p ( ν + n + p 1 2 ) ( π ) n p 2 Γ p ( ν + p 1 2 ) | Ω | n 2 | Σ | p 2 . {\displaystyle K={\frac {\Gamma _{p}\left({\frac {\nu +n+p-1}{2}}\right)}{(\pi )^{\frac {np}{2}}\Gamma _{p}\left({\frac {\nu +p-1}{2}}\right)}}|{\boldsymbol {\Omega }}|^{-{\frac {n}{2}}}|{\boldsymbol {\Sigma }}|^{-{\frac {p}{2}}}.}

Вот многомерная гамма-функция . Γ p {\displaystyle \Gamma _{p}}

Характеристики

Если , то мы имеем следующие свойства [2] : X T n × p ( ν , M , Σ , Ω ) {\displaystyle \mathbf {X} \sim {\mathcal {T}}_{n\times p}(\nu ,\mathbf {M} ,\mathbf {\Sigma } ,\mathbf {\Omega } )}

Ожидаемые значения

Среднее или ожидаемое значение равно, если : ν > 1 {\displaystyle \nu >1}

E [ X ] = M {\displaystyle E[\mathbf {X} ]=\mathbf {M} }

и мы имеем следующие ожидания второго порядка, если : ν > 2 {\displaystyle \nu >2}

E [ ( X M ) ( X M ) T ] = Σ tr ( Ω ) ν 2 {\displaystyle E[(\mathbf {X} -\mathbf {M} )(\mathbf {X} -\mathbf {M} )^{T}]={\frac {\mathbf {\Sigma } \operatorname {tr} (\mathbf {\Omega } )}{\nu -2}}}
E [ ( X M ) T ( X M ) ] = Ω tr ( Σ ) ν 2 {\displaystyle E[(\mathbf {X} -\mathbf {M} )^{T}(\mathbf {X} -\mathbf {M} )]={\frac {\mathbf {\Omega } \operatorname {tr} (\mathbf {\Sigma } )}{\nu -2}}}

где обозначает след . tr {\displaystyle \operatorname {tr} }

В более общем случае, для матриц A , B , C соответствующего размера :

E [ ( X M ) A ( X M ) T ] = Σ tr ( A T Ω ) ν 2 E [ ( X M ) T B ( X M ) ] = Ω tr ( B T Σ ) ν 2 E [ ( X M ) C ( X M ) ] = Σ C T Ω ν 2 {\displaystyle {\begin{aligned}E[(\mathbf {X} -\mathbf {M} )\mathbf {A} (\mathbf {X} -\mathbf {M} )^{T}]&={\frac {\mathbf {\Sigma } \operatorname {tr} (\mathbf {A} ^{T}\mathbf {\Omega } )}{\nu -2}}\\E[(\mathbf {X} -\mathbf {M} )^{T}\mathbf {B} (\mathbf {X} -\mathbf {M} )]&={\frac {\mathbf {\Omega } \operatorname {tr} (\mathbf {B} ^{T}\mathbf {\Sigma } )}{\nu -2}}\\E[(\mathbf {X} -\mathbf {M} )\mathbf {C} (\mathbf {X} -\mathbf {M} )]&={\frac {\mathbf {\Sigma } \mathbf {C} ^{T}\mathbf {\Omega } }{\nu -2}}\end{aligned}}}

Трансформация

Транспонирование преобразований:

X T T p × n ( ν , M T , Ω , Σ ) {\displaystyle \mathbf {X} ^{T}\sim {\mathcal {T}}_{p\times n}(\nu ,\mathbf {M} ^{T},\mathbf {\Omega } ,\mathbf {\Sigma } )}

Линейное преобразование: пусть A ( r -by- n ) имеет полный ранг r ≤ n и B ( p -by- s ) имеет полный ранг s ≤ p , тогда:

A X B T r × s ( ν , A M B , A Σ A T , B T Ω B ) {\displaystyle \mathbf {AXB} \sim {\mathcal {T}}_{r\times s}(\nu ,\mathbf {AMB} ,\mathbf {A\Sigma A} ^{T},\mathbf {B} ^{T}\mathbf {\Omega B} )}

Характеристическая функция и различные другие свойства могут быть выведены из перепараметризованной формулировки (см. ниже).

Перепараметризованная матрицат-распределение

Перепараметризованная матрица t
Обозначение T n , p ( α , β , M , Σ , Ω ) {\displaystyle {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})}
Параметры

M {\displaystyle \mathbf {M} } местоположение ( действительная матрица ) масштаб ( положительно-определенная действительная матрица ) масштаб ( положительно-определенная действительная матрица ) параметр формы n × p {\displaystyle n\times p}
Ω {\displaystyle {\boldsymbol {\Omega }}} p × p {\displaystyle p\times p}
Σ {\displaystyle {\boldsymbol {\Sigma }}} n × n {\displaystyle n\times n}
α > ( p 1 ) / 2 {\displaystyle \alpha >(p-1)/2}

β > 0 {\displaystyle \beta >0} параметр масштаба
Поддерживать X R n × p {\displaystyle \mathbf {X} \in \mathbb {R} ^{n\times p}}
PDF

Γ p ( α + n / 2 ) ( 2 π / β ) n p 2 Γ p ( α ) | Ω | n 2 | Σ | p 2 {\displaystyle {\frac {\Gamma _{p}(\alpha +n/2)}{(2\pi /\beta )^{\frac {np}{2}}\Gamma _{p}(\alpha )}}|{\boldsymbol {\Omega }}|^{-{\frac {n}{2}}}|{\boldsymbol {\Sigma }}|^{-{\frac {p}{2}}}}

× | I n + β 2 Σ 1 ( X M ) Ω 1 ( X M ) T | ( α + n / 2 ) {\displaystyle \times \left|\mathbf {I} _{n}+{\frac {\beta }{2}}{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right|^{-(\alpha +n/2)}}
СДФНет аналитического выражения
Иметь в виду M {\displaystyle \mathbf {M} } если , иначе не определено α > p / 2 {\displaystyle \alpha >p/2}
Дисперсия 2 ( Σ Ω ) β ( 2 α p 1 ) {\displaystyle {\frac {2({\boldsymbol {\Sigma }}\otimes {\boldsymbol {\Omega }})}{\beta (2\alpha -p-1)}}} если , иначе не определено α > ( p + 1 ) / 2 {\displaystyle \alpha >(p+1)/2}
CFсм. ниже

Альтернативная параметризация матрицы t - распределения использует два параметра и вместо . [3] α {\displaystyle \alpha } β {\displaystyle \beta } ν {\displaystyle \nu }

Эта формулировка сводится к стандартному матричному t -распределению с β = 2 , α = ν + p 1 2 . {\displaystyle \beta =2,\alpha ={\frac {\nu +p-1}{2}}.}

Эту формулировку матричного t -распределения можно вывести как составное распределение , которое является результатом бесконечной смеси матричного нормального распределения с обратным многомерным гамма-распределением, помещенным над любой из его ковариационных матриц.

Характеристики

Если тогда [2] [3] X T n , p ( α , β , M , Σ , Ω ) {\displaystyle \mathbf {X} \sim {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})}

X T T p , n ( α , β , M T , Ω , Σ ) . {\displaystyle \mathbf {X} ^{\rm {T}}\sim {\rm {T}}_{p,n}(\alpha ,\beta ,\mathbf {M} ^{\rm {T}},{\boldsymbol {\Omega }},{\boldsymbol {\Sigma }}).}

Вышеуказанное свойство вытекает из теоремы Сильвестра об определителях :

det ( I n + β 2 Σ 1 ( X M ) Ω 1 ( X M ) T ) = {\displaystyle \det \left(\mathbf {I} _{n}+{\frac {\beta }{2}}{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right)=}
det ( I p + β 2 Ω 1 ( X T M T ) Σ 1 ( X T M T ) T ) . {\displaystyle \det \left(\mathbf {I} _{p}+{\frac {\beta }{2}}{\boldsymbol {\Omega }}^{-1}(\mathbf {X} ^{\rm {T}}-\mathbf {M} ^{\rm {T}}){\boldsymbol {\Sigma }}^{-1}(\mathbf {X} ^{\rm {T}}-\mathbf {M} ^{\rm {T}})^{\rm {T}}\right).}

Если и и — невырожденные матрицы , то [2] [3] X T n , p ( α , β , M , Σ , Ω ) {\displaystyle \mathbf {X} \sim {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})} A ( n × n ) {\displaystyle \mathbf {A} (n\times n)} B ( p × p ) {\displaystyle \mathbf {B} (p\times p)}

A X B T n , p ( α , β , A M B , A Σ A T , B T Ω B ) . {\displaystyle \mathbf {AXB} \sim {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {AMB} ,\mathbf {A} {\boldsymbol {\Sigma }}\mathbf {A} ^{\rm {T}},\mathbf {B} ^{\rm {T}}{\boldsymbol {\Omega }}\mathbf {B} ).}

Характеристическая функция [3 ]

ϕ T ( Z ) = exp ( t r ( i Z M ) ) | Ω | α Γ p ( α ) ( 2 β ) α p | Z Σ Z | α B α ( 1 2 β Z Σ Z Ω ) , {\displaystyle \phi _{T}(\mathbf {Z} )={\frac {\exp({\rm {tr}}(i\mathbf {Z} '\mathbf {M} ))|{\boldsymbol {\Omega }}|^{\alpha }}{\Gamma _{p}(\alpha )(2\beta )^{\alpha p}}}|\mathbf {Z} '{\boldsymbol {\Sigma }}\mathbf {Z} |^{\alpha }B_{\alpha }\left({\frac {1}{2\beta }}\mathbf {Z} '{\boldsymbol {\Sigma }}\mathbf {Z} {\boldsymbol {\Omega }}\right),}

где

B δ ( W Z ) = | W | δ S > 0 exp ( t r ( S W S 1 Z ) ) | S | δ 1 2 ( p + 1 ) d S , {\displaystyle B_{\delta }(\mathbf {WZ} )=|\mathbf {W} |^{-\delta }\int _{\mathbf {S} >0}\exp \left({\rm {tr}}(-\mathbf {SW} -\mathbf {S^{-1}Z} )\right)|\mathbf {S} |^{-\delta -{\frac {1}{2}}(p+1)}d\mathbf {S} ,}

и где - функция Бесселя второго типа Герца [ необходимо разъяснение ] матричного аргумента. B δ {\displaystyle B_{\delta }}

Смотрите также

Примечания

  1. ^ ab Zhu, Shenghuo и Kai Yu и Yihong Gong (2007). "Предсказательные матрично-вариантные t-модели". В JC Platt, D. Koller, Y. Singer и S. Roweis, редакторы, NIPS '07: Advances in Neural Information Processing Systems 20, страницы 1721–1728. MIT Press, Cambridge, MA, 2008. В этой статье обозначения немного изменены для соответствия статье о матричном нормальном распределении .
  2. ^ abcde Гупта, Арджун К и Нагар, Дайя К (1999). Матричные распределения переменных . CRC Press. стр. Глава 4.{{cite book}}: CS1 maint: multiple names: authors list (link)
  3. ^ abcde Iranmanesh, Anis, M. Arashi и SMM Tabatabaey (2010). «Об условных применениях матричного нормального распределения». Iranian Journal of Mathematical Sciences and Informatics , 5:2, стр. 33–43.
  • Библиотека C++ для генератора случайных матриц


Retrieved from "https://en.wikipedia.org/w/index.php?title=Matrix_t-distribution&oldid=1255969334"