Матрицат Обозначение Т н , п ( ν , М , Σ , Ω ) {\displaystyle {\rm {T}}_{n,p}(\nu ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})} Параметры М {\displaystyle \mathbf {М} } местоположение ( действительная матрица ) масштаб ( положительно-определенная действительная матрица ) масштаб ( положительно-определенная действительная матрица ) н × п {\displaystyle n\times p} Ω {\displaystyle {\boldsymbol {\Омега }}} п × п {\displaystyle p\times p} Σ {\displaystyle {\boldsymbol {\Sigma }}} н × н {\displaystyle n\times n}
ν > 0 {\displaystyle \nu >0} степени свободы (реальные)Поддерживать Х ∈ Р н × п {\displaystyle \mathbf {X} \in \mathbb {R} ^{n\times p}} PDF Г п ( ν + н + п − 1 2 ) ( π ) н п 2 Г п ( ν + п − 1 2 ) | Ω | − н 2 | Σ | − п 2 {\displaystyle {\frac {\Gamma _{p}\left({\frac {\nu +n+p-1}{2}}\right)}{(\pi )^{\frac {np}{2}}\Gamma _{p}\left({\frac {\nu +p-1}{2}}\right)}}|{\boldsymbol {\Omega }}|^{-{\frac {n}{2}}}|{\boldsymbol {\Sigma }}|^{-{\frac {p}{2}}}}
× | я н + Σ − 1 ( Х − М ) Ω − 1 ( Х − М ) Т | − ν + н + п − 1 2 {\displaystyle \times \left|\mathbf {I} _{n}+{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right|^{-{\frac {\nu +n+p-1}{2}}}} СДФ Нет аналитического выражения Иметь в виду M {\displaystyle \mathbf {M} } если , иначе не определено ν > 1 {\displaystyle \nu >1} Режим M {\displaystyle \mathbf {M} } Дисперсия c o v ( v e c ( X ) ) = Σ ⊗ Ω ν − 2 {\displaystyle \mathrm {cov} (\mathrm {vec} (\mathbf {X} ))={\frac {{\boldsymbol {\Sigma }}\otimes {\boldsymbol {\Omega }}}{\nu -2}}} если , иначе не определено ν > 2 {\displaystyle \nu >2} CF см. ниже
В статистике матричное t -распределение (или матричное вариативное t -распределение ) является обобщением многомерного t - распределения с векторов на матрицы . [1] [2]
Матричное t -распределение имеет те же отношения с многомерным t -распределением, что и матричное нормальное распределение с многомерным нормальным распределением : если матрица имеет только одну строку или только один столбец, распределения становятся эквивалентными соответствующему (векторному) многомерному распределению. Матричное t -распределение представляет собой составное распределение , которое получается из бесконечной смеси матричного нормального распределения с обратным распределением Уишарта, помещенным над любой из его ковариационных матриц, [1] и многомерное t -распределение может быть сгенерировано аналогичным образом. [2]
В байесовском анализе многомерной линейной регрессионной модели, основанной на матричном нормальном распределении, матричное t -распределение является апостериорным предсказательным распределением . [3]
Определение Для матричного t -распределения функция плотности вероятности в точке пространства равна X {\displaystyle \mathbf {X} } n × p {\displaystyle n\times p}
f ( X ; ν , M , Σ , Ω ) = K × | I n + Σ − 1 ( X − M ) Ω − 1 ( X − M ) T | − ν + n + p − 1 2 , {\displaystyle f(\mathbf {X} ;\nu ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})=K\times \left|\mathbf {I} _{n}+{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right|^{-{\frac {\nu +n+p-1}{2}}},} где константа интегрирования K определяется выражением
K = Γ p ( ν + n + p − 1 2 ) ( π ) n p 2 Γ p ( ν + p − 1 2 ) | Ω | − n 2 | Σ | − p 2 . {\displaystyle K={\frac {\Gamma _{p}\left({\frac {\nu +n+p-1}{2}}\right)}{(\pi )^{\frac {np}{2}}\Gamma _{p}\left({\frac {\nu +p-1}{2}}\right)}}|{\boldsymbol {\Omega }}|^{-{\frac {n}{2}}}|{\boldsymbol {\Sigma }}|^{-{\frac {p}{2}}}.} Вот многомерная гамма-функция . Γ p {\displaystyle \Gamma _{p}}
Характеристики Если , то мы имеем следующие свойства [2] : X ∼ T n × p ( ν , M , Σ , Ω ) {\displaystyle \mathbf {X} \sim {\mathcal {T}}_{n\times p}(\nu ,\mathbf {M} ,\mathbf {\Sigma } ,\mathbf {\Omega } )}
Ожидаемые значения Среднее или ожидаемое значение равно, если : ν > 1 {\displaystyle \nu >1}
E [ X ] = M {\displaystyle E[\mathbf {X} ]=\mathbf {M} } и мы имеем следующие ожидания второго порядка, если : ν > 2 {\displaystyle \nu >2}
E [ ( X − M ) ( X − M ) T ] = Σ tr ( Ω ) ν − 2 {\displaystyle E[(\mathbf {X} -\mathbf {M} )(\mathbf {X} -\mathbf {M} )^{T}]={\frac {\mathbf {\Sigma } \operatorname {tr} (\mathbf {\Omega } )}{\nu -2}}} E [ ( X − M ) T ( X − M ) ] = Ω tr ( Σ ) ν − 2 {\displaystyle E[(\mathbf {X} -\mathbf {M} )^{T}(\mathbf {X} -\mathbf {M} )]={\frac {\mathbf {\Omega } \operatorname {tr} (\mathbf {\Sigma } )}{\nu -2}}} где обозначает след . tr {\displaystyle \operatorname {tr} }
В более общем случае, для матриц A , B , C соответствующего размера :
E [ ( X − M ) A ( X − M ) T ] = Σ tr ( A T Ω ) ν − 2 E [ ( X − M ) T B ( X − M ) ] = Ω tr ( B T Σ ) ν − 2 E [ ( X − M ) C ( X − M ) ] = Σ C T Ω ν − 2 {\displaystyle {\begin{aligned}E[(\mathbf {X} -\mathbf {M} )\mathbf {A} (\mathbf {X} -\mathbf {M} )^{T}]&={\frac {\mathbf {\Sigma } \operatorname {tr} (\mathbf {A} ^{T}\mathbf {\Omega } )}{\nu -2}}\\E[(\mathbf {X} -\mathbf {M} )^{T}\mathbf {B} (\mathbf {X} -\mathbf {M} )]&={\frac {\mathbf {\Omega } \operatorname {tr} (\mathbf {B} ^{T}\mathbf {\Sigma } )}{\nu -2}}\\E[(\mathbf {X} -\mathbf {M} )\mathbf {C} (\mathbf {X} -\mathbf {M} )]&={\frac {\mathbf {\Sigma } \mathbf {C} ^{T}\mathbf {\Omega } }{\nu -2}}\end{aligned}}}
Транспонирование преобразований:
X T ∼ T p × n ( ν , M T , Ω , Σ ) {\displaystyle \mathbf {X} ^{T}\sim {\mathcal {T}}_{p\times n}(\nu ,\mathbf {M} ^{T},\mathbf {\Omega } ,\mathbf {\Sigma } )} Линейное преобразование: пусть A ( r -by- n ) имеет полный ранг r ≤ n и B ( p -by- s ) имеет полный ранг s ≤ p , тогда:
A X B ∼ T r × s ( ν , A M B , A Σ A T , B T Ω B ) {\displaystyle \mathbf {AXB} \sim {\mathcal {T}}_{r\times s}(\nu ,\mathbf {AMB} ,\mathbf {A\Sigma A} ^{T},\mathbf {B} ^{T}\mathbf {\Omega B} )} Характеристическая функция и различные другие свойства могут быть выведены из перепараметризованной формулировки (см. ниже).
Перепараметризованная матрицат -распределение Перепараметризованная матрица t Обозначение T n , p ( α , β , M , Σ , Ω ) {\displaystyle {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})} Параметры M {\displaystyle \mathbf {M} } местоположение ( действительная матрица ) масштаб ( положительно-определенная действительная матрица ) масштаб ( положительно-определенная действительная матрица ) параметр формы n × p {\displaystyle n\times p} Ω {\displaystyle {\boldsymbol {\Omega }}} p × p {\displaystyle p\times p} Σ {\displaystyle {\boldsymbol {\Sigma }}} n × n {\displaystyle n\times n} α > ( p − 1 ) / 2 {\displaystyle \alpha >(p-1)/2}
β > 0 {\displaystyle \beta >0} параметр масштаба Поддерживать X ∈ R n × p {\displaystyle \mathbf {X} \in \mathbb {R} ^{n\times p}} PDF Γ p ( α + n / 2 ) ( 2 π / β ) n p 2 Γ p ( α ) | Ω | − n 2 | Σ | − p 2 {\displaystyle {\frac {\Gamma _{p}(\alpha +n/2)}{(2\pi /\beta )^{\frac {np}{2}}\Gamma _{p}(\alpha )}}|{\boldsymbol {\Omega }}|^{-{\frac {n}{2}}}|{\boldsymbol {\Sigma }}|^{-{\frac {p}{2}}}}
× | I n + β 2 Σ − 1 ( X − M ) Ω − 1 ( X − M ) T | − ( α + n / 2 ) {\displaystyle \times \left|\mathbf {I} _{n}+{\frac {\beta }{2}}{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right|^{-(\alpha +n/2)}} СДФ Нет аналитического выражения Иметь в виду M {\displaystyle \mathbf {M} } если , иначе не определено α > p / 2 {\displaystyle \alpha >p/2} Дисперсия 2 ( Σ ⊗ Ω ) β ( 2 α − p − 1 ) {\displaystyle {\frac {2({\boldsymbol {\Sigma }}\otimes {\boldsymbol {\Omega }})}{\beta (2\alpha -p-1)}}} если , иначе не определено α > ( p + 1 ) / 2 {\displaystyle \alpha >(p+1)/2} CF см. ниже
Альтернативная параметризация матрицы t - распределения использует два параметра и вместо . [3] α {\displaystyle \alpha } β {\displaystyle \beta } ν {\displaystyle \nu }
Эта формулировка сводится к стандартному матричному t -распределению с β = 2 , α = ν + p − 1 2 . {\displaystyle \beta =2,\alpha ={\frac {\nu +p-1}{2}}.}
Эту формулировку матричного t -распределения можно вывести как составное распределение , которое является результатом бесконечной смеси матричного нормального распределения с обратным многомерным гамма-распределением, помещенным над любой из его ковариационных матриц.
Характеристики Если тогда [2] [3] X ∼ T n , p ( α , β , M , Σ , Ω ) {\displaystyle \mathbf {X} \sim {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})}
X T ∼ T p , n ( α , β , M T , Ω , Σ ) . {\displaystyle \mathbf {X} ^{\rm {T}}\sim {\rm {T}}_{p,n}(\alpha ,\beta ,\mathbf {M} ^{\rm {T}},{\boldsymbol {\Omega }},{\boldsymbol {\Sigma }}).} Вышеуказанное свойство вытекает из теоремы Сильвестра об определителях :
det ( I n + β 2 Σ − 1 ( X − M ) Ω − 1 ( X − M ) T ) = {\displaystyle \det \left(\mathbf {I} _{n}+{\frac {\beta }{2}}{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right)=} det ( I p + β 2 Ω − 1 ( X T − M T ) Σ − 1 ( X T − M T ) T ) . {\displaystyle \det \left(\mathbf {I} _{p}+{\frac {\beta }{2}}{\boldsymbol {\Omega }}^{-1}(\mathbf {X} ^{\rm {T}}-\mathbf {M} ^{\rm {T}}){\boldsymbol {\Sigma }}^{-1}(\mathbf {X} ^{\rm {T}}-\mathbf {M} ^{\rm {T}})^{\rm {T}}\right).} Если и и — невырожденные матрицы , то [2] [3] X ∼ T n , p ( α , β , M , Σ , Ω ) {\displaystyle \mathbf {X} \sim {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})} A ( n × n ) {\displaystyle \mathbf {A} (n\times n)} B ( p × p ) {\displaystyle \mathbf {B} (p\times p)}
A X B ∼ T n , p ( α , β , A M B , A Σ A T , B T Ω B ) . {\displaystyle \mathbf {AXB} \sim {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {AMB} ,\mathbf {A} {\boldsymbol {\Sigma }}\mathbf {A} ^{\rm {T}},\mathbf {B} ^{\rm {T}}{\boldsymbol {\Omega }}\mathbf {B} ).} Характеристическая функция [3 ]
ϕ T ( Z ) = exp ( t r ( i Z ′ M ) ) | Ω | α Γ p ( α ) ( 2 β ) α p | Z ′ Σ Z | α B α ( 1 2 β Z ′ Σ Z Ω ) , {\displaystyle \phi _{T}(\mathbf {Z} )={\frac {\exp({\rm {tr}}(i\mathbf {Z} '\mathbf {M} ))|{\boldsymbol {\Omega }}|^{\alpha }}{\Gamma _{p}(\alpha )(2\beta )^{\alpha p}}}|\mathbf {Z} '{\boldsymbol {\Sigma }}\mathbf {Z} |^{\alpha }B_{\alpha }\left({\frac {1}{2\beta }}\mathbf {Z} '{\boldsymbol {\Sigma }}\mathbf {Z} {\boldsymbol {\Omega }}\right),} где
B δ ( W Z ) = | W | − δ ∫ S > 0 exp ( t r ( − S W − S − 1 Z ) ) | S | − δ − 1 2 ( p + 1 ) d S , {\displaystyle B_{\delta }(\mathbf {WZ} )=|\mathbf {W} |^{-\delta }\int _{\mathbf {S} >0}\exp \left({\rm {tr}}(-\mathbf {SW} -\mathbf {S^{-1}Z} )\right)|\mathbf {S} |^{-\delta -{\frac {1}{2}}(p+1)}d\mathbf {S} ,} и где - функция Бесселя второго типа Герца [ необходимо разъяснение ] матричного аргумента. B δ {\displaystyle B_{\delta }}
Смотрите также
Примечания ^ ab Zhu, Shenghuo и Kai Yu и Yihong Gong (2007). "Предсказательные матрично-вариантные t-модели". В JC Platt, D. Koller, Y. Singer и S. Roweis, редакторы, NIPS '07: Advances in Neural Information Processing Systems 20, страницы 1721–1728. MIT Press, Cambridge, MA, 2008. В этой статье обозначения немного изменены для соответствия статье о матричном нормальном распределении . ^ abcde Гупта, Арджун К и Нагар, Дайя К (1999). Матричные распределения переменных . CRC Press. стр. Глава 4. {{cite book }}
: CS1 maint: multiple names: authors list (link )^ abcde Iranmanesh, Anis, M. Arashi и SMM Tabatabaey (2010). «Об условных применениях матричного нормального распределения». Iranian Journal of Mathematical Sciences and Informatics , 5:2, стр. 33–43.
Внешние ссылки Библиотека C++ для генератора случайных матриц