Один из распространенных методов построения многомерного t -распределения для случая измерений основан на наблюдении, что если и независимы и распределены как и (т.е. многомерное нормальное и хи-квадрат распределение ) соответственно, матрица представляет собой матрицу p × p , а — постоянный вектор, то случайная величина имеет плотность [1]
и считается распределенным как многомерное t -распределение с параметрами . Обратите внимание, что это не ковариационная матрица, поскольку ковариация задается выражением (для ).
Конструктивное определение многомерного t -распределения одновременно служит алгоритмом выборки:
Сгенерировать и , независимо.
Вычислить .
Эта формулировка приводит к иерархическому представлению многомерного t -распределения в виде масштабной смеси нормалей: где обозначает гамма-распределение с плотностью, пропорциональной , и условно следует за .
На самом деле существует много кандидатов на многомерное обобщение t -распределения Стьюдента . Обширный обзор этой области был дан Котцем и Надараджа (2004). Основная проблема заключается в определении функции плотности вероятности нескольких переменных, которая является подходящим обобщением формулы для одномерного случая. В одном измерении ( ), с и , мы имеем функцию плотности вероятности
и один из подходов заключается в использовании соответствующей функции нескольких переменных. Это основная идея теории эллиптического распределения , где записывается соответствующая функция переменных , которая заменяется квадратичной функцией всех . Ясно, что это имеет смысл только тогда, когда все маргинальные распределения имеют одинаковые степени свободы . При , есть простой выбор многомерной функции плотности
что является стандартным, но не единственным вариантом.
Важным частным случаем является стандартное двумерное t - распределение., р = 2:
Обратите внимание, что .
Теперь, если - единичная матрица, то плотность равна
Трудность со стандартным представлением раскрывается этой формулой, которая не факторизуется в произведение маргинальных одномерных распределений. Когда является диагональным, можно показать, что стандартное представление имеет нулевую корреляцию , но маргинальные распределения не являются статистически независимыми .
Примечательным спонтанным явлением эллиптического многомерного распределения является его формальное математическое проявление, когда методы наименьших квадратов применяются к многомерным нормальным данным, таким как классическое эконометрическое решение минимальной дисперсии Марковица для портфелей активов. [2]
Кумулятивная функция распределения
Определение кумулятивной функции распределения (cdf) в одном измерении можно расширить до нескольких измерений, определив следующую вероятность (здесь — действительный вектор):
Простой формулы для не существует , но ее можно аппроксимировать численно с помощью интегрирования Монте-Карло . [3] [4] [5]
Условное распределение
Это было разработано Мьюирхедом [6] и Корнишем [7] , но позже получено с использованием более простого представления отношения хи-квадрат, представленного выше, Ротом [1] и Дином [8] . Пусть вектор следует многомерному распределению t и разбивается на два подвектора элементов:
где , известные средние векторы равны , а масштабная матрица равна .
Рот и Дин обнаружили, что условное распределение представляет собой новое t -распределение с измененными параметрами.
Эквивалентное выражение у Котца и др. несколько менее лаконично.
Таким образом, условное распределение проще всего представить в виде двухшаговой процедуры. Сначала сформируем промежуточное распределение выше, затем, используя параметры ниже, явное условное распределение становится
где
Эффективные степени свободы увеличиваются за счет числа неиспользуемых переменных .
Построенное как эллиптическое распределение , [10] возьмем простейший централизованный случай со сферической симметрией и без масштабирования, тогда многомерная t -PDF примет вид
где и = степени свободы, как определено в Muirhead [6] раздел 1.5. Ковариация равна
Цель состоит в том, чтобы преобразовать декартову PDF в радиальную. Кибрия и Джоардер [11] определяют радиальную меру и, отмечая, что плотность зависит только от r 2 , мы получаем
что эквивалентно дисперсии вектора -элементов , рассматриваемого как одномерная случайная последовательность с тяжелым хвостом и нулевым средним с некоррелированными, но статистически зависимыми элементами.
имеющие среднее значение . -распределения возникают естественным образом в тестах сумм квадратов выборочных данных после нормализации по стандартному отклонению выборки.
Заменив случайную величину на в уравнении выше, сохранив -вектор , мы имеем и распределение вероятностей
Учитывая бета-штриховое распределение, радиальная кумулятивная функция распределения известна:
где — неполная бета-функция , применимая при сферическом предположении.
В скалярном случае распределение эквивалентно Стьюденту -t с эквивалентностью , причем переменная t имеет двусторонние хвосты для целей CDF, т.е. «двухвостый t-тест».
Радиальное распределение также может быть получено с помощью прямого преобразования координат из декартовых в сферические. Поверхность постоянного радиуса при с PDF является поверхностью изоплотности. При этом значении плотности квант вероятности на оболочке с площадью поверхности и толщиной при равен .
Заключенная сфера радиуса имеет площадь поверхности . Подстановка в показывает, что оболочка имеет элемент вероятности , который эквивалентен радиальной функции плотности
что еще больше упрощается до , где — бета-функция .
Изменение радиальной переменной на возвращает предыдущее распределение Beta Prime
Чтобы масштабировать радиальные переменные без изменения функции радиальной формы, определите матрицу масштабирования , что даст 3-параметрическую декартову функцию плотности, т.е. вероятность в элементе объема равна
или, в терминах скалярной радиальной переменной ,
Радиальные моменты
Моменты всех радиальных переменных , при предположении сферического распределения, могут быть выведены из распределения Beta Prime. Если , то , известный результат. Таким образом, для переменной имеем
Моменты есть
при этом введение масштабной матрицы дает
Моменты, относящиеся к радиальной переменной, находятся путем установки и после чего
Линейные комбинации и аффинное преобразование
Полное преобразование ранга
Это тесно связано с многомерным нормальным методом и описано в Kotz и Nadarajah, Kibria и Joarder, Roth и Cornish. Начиная с несколько упрощенной версии центральной MV-t pdf: , где — константа, а — произвольная, но фиксированная, пусть — матрица полного ранга и вектор формы . Затем, путем прямой замены переменных
Матрица частных производных равна и якобиан становится . Таким образом
Знаменатель уменьшается до
Полностью:
что является обычным распределением MV -t .
В общем случае, если и имеет полный ранг , то
Предельные распределения
Это частный случай линейного преобразования, уменьшающего ранг, представленного ниже. Коц определяет маргинальные распределения следующим образом. Разбиение на два подвектора элементов:
с , означает , масштабная матрица
тогда , такой что
Если преобразование построено в виде
тогда вектор , как обсуждается ниже, имеет то же распределение, что и предельное распределение .
Линейное преобразование, уменьшающее ранг
В случае линейного преобразования, если — прямоугольная матрица , ранга результатом является уменьшение размерности. Здесь якобиан, по-видимому, прямоугольный, но значение в знаменателе pdf, тем не менее, верно. Обсуждение определителей произведения прямоугольных матриц есть в Aitken. [12] В общем случае, если и имеет полный ранг , то
В крайнем случае , если m = 1 и становится вектором-строкой, то скаляр Y следует одномерному двухстороннему распределению Стьюдента-t, определяемому с теми же степенями свободы. Кибрия и др. используют аффинное преобразование для нахождения маргинальных распределений, которые также являются MV- t .
При аффинных преобразованиях переменных с эллиптическими распределениями все векторы в конечном итоге должны вытекать из одного исходного изотропного сферического вектора , элементы которого остаются «запутанными» и не являются статистически независимыми.
Вектор независимых выборок Стьюдента t не согласуется с многомерным t- распределением.
Добавление двух выборочных многомерных t -векторов, сгенерированных с независимыми выборками хи-квадрат и различными значениями: не приведет к получению внутренне согласованных распределений, хотя и приведет к проблеме Беренса-Фишера . [13]
Талеб сравнивает множество примеров эллиптических распределений с толстым хвостом и неэллиптических многомерных распределений
Эллиптическое многомерное t- распределение возникает спонтанно в линейно ограниченных решениях наименьших квадратов, включающих многомерные нормальные исходные данные, например, решение Марковица с глобальной минимальной дисперсией в финансовом портфельном анализе. [14] [15] [2] которое рассматривает ансамбль нормальных случайных векторов или случайную матрицу. Оно не возникает в обычных наименьших квадратах (OLS) или множественной регрессии с фиксированными зависимыми и независимыми переменными, проблема которых имеет тенденцию производить хорошо себя ведущие нормальные вероятности ошибок.
^ ab Roth, Michael (17 апреля 2013 г.). "On the Multivariate t Distribution" (PDF) . Группа автоматического управления. Университет Линчёпина, Швеция . Архивировано (PDF) из оригинала 31 июля 2022 г. . Получено 1 июня 2022 г. .
^ ab Bodnar, T; Okhrin, Y (2008). "Свойства сингулярного, обратного и обобщенного обратного распределения Уишарта" (PDF) . Журнал многомерного анализа . 99 (Eqn.20): 2389– 2405. doi :10.1016/j.jmva.2008.02.024.
^ Ботев, З.; Чен, Ю.-Л. (2022). «Глава 4: Усеченные многомерные вычисления Стьюдента посредством экспоненциального наклона». В Ботеве, Здравко; Келлер, Александр; Лемье, Кристиан; Таффин, Бруно (ред.). Достижения в моделировании и симуляции: Festschrift для Пьера Л'Экуйера . Спрингер. стр. 65–87 . doi :10.1007/978-3-031-10193-9_4. ISBN978-3-031-10192-2.
^ Botev, ZI; L'Ecuyer, P. (6 декабря 2015 г.). «Эффективная оценка вероятности и моделирование усеченного многомерного распределения Стьюдента-t». Зимняя конференция по моделированию 2015 г. (WSC) . Хантингтон-Бич, Калифорния, США: IEEE. стр. 380–391 . doi :10.1109/WSC.2015.7408180.
^ Генц, Алан (2009). Вычисление многомерных нормальных и t-вероятностей. Конспект лекций по статистике. Том 195. Springer. doi :10.1007/978-3-642-01689-9. ISBN978-3-642-01689-9. Архивировано из оригинала 2022-08-27 . Получено 2017-09-05 .
^ ab Muirhead, Robb (1982). Аспекты многомерной статистической теории . США: Wiley. стр. 32–36 Теорема 1.5.4. ISBN978-0-47 1-76985-9.
^ Корниш, EA (1954). «Многомерное t-распределение, связанное с набором отклонений нормальной выборки». Australian Journal of Physics . 7 : 531–542 . doi : 10.1071/PH550193 .