Статистика Хотеллинга t-квадрат тогда определяется как: [ 6]
что пропорционально расстоянию Махаланобиса между средним значением выборки и . В связи с этим следует ожидать, что статистика будет принимать низкие значения, если , и высокие значения, если они различны.
Чтобы вычислить p -значение (не связанное здесь с переменной p ), обратите внимание, что распределение эквивалентно подразумевает, что
Затем используйте величину слева, чтобы оценить p -значение, соответствующее выборке, которое получается из F -распределения. Доверительную область также можно определить с использованием аналогичной логики.
быть n независимыми одинаково распределенными (iid) случайными величинами , которые могут быть представлены как векторы-столбцы действительных чисел. Определить
Каждая положительно-полуопределенная симметричная матрица имеет положительно-полуопределенный симметричный квадратный корень , а если она невырожденная, то ее обратная матрица имеет положительно-определенный квадратный корень .
Так как , то имеем
Следовательно
и это просто сумма квадратов независимых стандартных нормальных случайных величин. Таким образом, ее распределение
В качестве альтернативы можно использовать функции плотности и характеристические функции следующим образом.
Доказательство
Чтобы показать это, воспользуемся тем фактом, что
и выведем характеристическую функцию случайной величины . Как обычно, обозначим определитель аргумента, как в .
По определению характеристической функции имеем: [8]
Внутри интеграла есть две экспоненты, поэтому, умножая экспоненты, мы складываем показатели степеней, получая:
Теперь выньте член из интеграла и умножьте все на тождество , подставив одно из них под интеграл:
Но член внутри интеграла — это как раз функция плотности вероятности многомерного нормального распределения с ковариационной матрицей и средним значением , поэтому при интегрировании по всем она должна давать согласно аксиомам вероятности . [ необходимо разъяснение ] Таким образом, мы получаем:
где — единичная матрица размерности . Наконец, вычисляя определитель, получаем:
где — вектор разности между средними значениями совокупности.
В случае двух переменных формула значительно упрощается, позволяя оценить, как корреляция между переменными влияет на . Если мы определим
и
затем
Таким образом, если разности в двух строках вектора имеют одинаковый знак, в общем случае становится меньше, так как становится более положительным. Если разности имеют противоположный знак, становится больше, так как становится более положительным.
В литературе были предложены более надежные и мощные тесты, чем двухвыборочный тест Хотеллинга, например, тесты, основанные на межточечном расстоянии, которые можно применять также, когда количество переменных сопоставимо с количеством субъектов или даже превышает его. [9] [10]
F -распределение (обычно представлено в виде таблицы или доступно в библиотеках программного обеспечения и, следовательно, используется для проверки статистики T -квадрат с использованием приведенного выше соотношения)
^ Джонсон, РА; Вихерн, Д.В. (2002). Прикладной многомерный статистический анализ . Том 5. Prentice hall.
^ Эрик В. Вайсштейн, MathWorld
^ ab Mardia, KV; Kent, JT; Bibby, JM (1979). Многомерный анализ . Academic Press. ISBN978-0-12-471250-8.
^ Фогельмарк, Карл; Ломхольт, Михаэль; Ирбек, Андерс; Амбьёрнссон, Тобиас (3 мая 2018 г.). «Подгонка функции к зависящим от времени усредненным ансамблевым данным». Scientific Reports . 8 (1): 6984. doi :10.1038/s41598-018-24983-y. PMC 5934400 . Получено 19 августа 2024 г. .
^ "6.5.4.3. T-квадрат Хотеллинга".
↑ Конец главы 4.2 Джонсона, Р.А. и Вихерна, Д.В. (2002)
^ Биллингсли, П. (1995). "26. Характеристические функции". Вероятность и мера (3-е изд.). Wiley. ISBN978-0-471-00710-4.
^ Мароцци, М. (2016). «Многомерные тесты, основанные на межточечных расстояниях с применением к магнитно-резонансной томографии». Статистические методы в медицинских исследованиях . 25 (6): 2593– 2610. doi :10.1177/0962280214529104. PMID 24740998.
^ Мароцци, М. (2015). «Многомерные многомерные тесты для многомерных исследований случай-контроль с малым размером выборки». Статистика в медицине . 34 (9): 1511– 1526. doi :10.1002/sim.6418. PMID 25630579.