ANOVA по рангам

В статистике одной из целей дисперсионного анализа (ANOVA) является анализ различий в средних значениях между группами. Тестовая статистика F предполагает независимость наблюдений, однородные дисперсии и нормальность популяции . ANOVA на рангах — это статистика, разработанная для ситуаций, когда предположение о нормальности нарушено.

ЛогикаФтест на средства

Статистика F — это отношение числителя к знаменателю. Рассмотрим случайно выбранных субъектов, которые впоследствии случайным образом распределяются по группам A, B и C. При истинности нулевой гипотезы изменчивость (или сумма квадратов) оценок по некоторой зависимой переменной будет одинаковой в каждой группе. При делении на степени свободы (т. е. на основе количества субъектов в группе) получается знаменатель отношения F.

Обработайте среднее значение для каждой группы как оценку и вычислите изменчивость (опять же, сумму квадратов) этих трех оценок. При делении на степени свободы (т. е. на основе числа групп) получается числитель коэффициента F.

При истинности нулевой гипотезы выборочное распределение F-коэффициента зависит от степеней свободы числителя и знаменателя.

Смоделируйте лечение, применяемое к группе A путем увеличения каждого балла на X. (Эта модель поддерживает базовое предположение об однородных дисперсиях. На практике редко — если не невозможно — происходит увеличение X в среднем значении группы за счет увеличения балла каждого члена на X.) Это сместит распределение X единиц в положительном направлении, но не окажет никакого влияния на изменчивость внутри группы. Однако изменчивость между средними баллами трех групп теперь увеличится. Если полученное отношение F повышает значение до такой степени, что оно превышает порог того, что составляет редкое событие (называемое уровнем альфа), говорят, что тест Anova F отвергает нулевую гипотезу о равных средних значениях между тремя группами в пользу альтернативной гипотезы о том, что по крайней мере одна из групп имеет большее среднее значение (которое в этом примере является группой A).

Борьба с нарушением нормального состояния населения

Ранжирование — одна из многих процедур, используемых для преобразования данных, которые не соответствуют предположениям о нормальности . Коновер и Иман представили обзор четырех основных типов ранговых преобразований (RT). [1] Один метод заменяет каждое исходное значение данных его рангом (от 1 для наименьшего до N для наибольшего). Эта основанная на ранге процедура была рекомендована как устойчивая к ненормальным ошибкам, устойчивая к выбросам и высокоэффективная для многих распределений. Она может привести к известной статистике (например, в двух независимых результатах ранжирования макета выборки в сумме рангов Вилкоксона / U-критерии Манна–Уитни ) и обеспечивает желаемую надежность и повышенную статистическую мощность , которые искомые. Например, исследования Монте-Карло показали, что ранговое преобразование в схеме t-теста для двух независимых выборок может быть успешно распространено на однофакторный независимый дисперсионный анализ (ANOVA) и многомерные схемы Хотеллинга T 2 для двух независимых выборок [2]. Коммерческие статистические программные пакеты (например, SAS) сопровождались рекомендациями аналитикам данных о необходимости пропускать свои наборы данных через процедуру ранжирования (например, PROC RANK) перед проведением стандартных анализов с использованием параметрических процедур. [3] [4] [5]

Неудача ранжирования в факторном ANOVA и других сложных схемах

ANOVA на рангах означает, что стандартный дисперсионный анализ рассчитывается на основе преобразованных по рангу данных. Было также предложено проведение факторного ANOVA на рангах исходных оценок. [6] [7] [8] Однако исследования Монте-Карло, [9] [ 10] [11] [12] и последующие асимптотические исследования [13] [14] обнаружили, что преобразование рангов не подходит для тестирования эффектов взаимодействия в факторном дизайне 4x3 и 2x2x2. По мере того, как количество эффектов (т. е. основных, взаимодействия) становится ненулевым, и по мере увеличения величины ненулевых эффектов увеличивается ошибка первого рода , что приводит к полному отказу статистики с вероятностью принятия ложноположительного решения вплоть до 100%. Аналогичным образом было обнаружено, что преобразование рангов все чаще терпит неудачу в двух зависимых выборках по мере увеличения корреляции между предтестовыми и посттестовыми оценками. [15] Также было обнаружено, что проблема частоты ошибок типа I обострилась в контексте анализа ковариации, особенно по мере увеличения корреляции между ковариатом и зависимой переменной. [16]

Трансформация рядов

Вариантом преобразования рангов является «нормализация квантилей», при которой к рангам применяется дальнейшее преобразование, так что результирующие значения имеют определенное распределение (часто нормальное распределение с заданным средним значением и дисперсией). Дальнейший анализ данных, нормализованных квантилями, может затем предполагать это распределение для вычисления значений значимости. Однако было показано, что два конкретных типа вторичных преобразований, преобразование случайных нормальных оценок и ожидаемых нормальных оценок, значительно увеличивают ошибки типа I и существенно снижают статистическую мощность. [17]

Нарушение гомоскедастичности

ANOVA для рангов никогда не рекомендовался, когда базовое предположение об однородности дисперсий было нарушено, либо само по себе, либо в сочетании с нарушением предположения о нормальности популяции. [ необходима ссылка ] В целом, статистики на основе рангов становятся неустойчивыми в отношении ошибок типа I для отклонений от гомоскедастичности даже быстрее, чем параметрические аналоги, которые разделяют то же предположение. [ необходима ссылка ]

Дополнительная информация

Кепнер и Вакерли подвели итоги литературы, отметив, что «к концу 1980-х годов объем литературы по методам ОТ быстро расширялся, поскольку были получены новые знания, как положительные, так и отрицательные, относительно полезности метода. Обеспокоенные тем, что методы ОТ могут быть использованы не по назначению, Савиловски и др. (1989, стр. 255) предостерегали практиков от использования этих тестов «за исключением тех конкретных ситуаций, когда характеристики тестов хорошо понятны». [18] По словам Хеттманспергера и Маккина, [19] «Савиловски (1990) [20] дает превосходный обзор непараметрических подходов к тестированию на взаимодействие» в ANOVA.

Примечания

  1. ^ Conover, WJ; Iman, RL (1981). «Ранговые преобразования как мост между параметрической и непараметрической статистикой». American Statistician . 35 (3): 124– 129. doi :10.2307/2683975. JSTOR  2683975. Архивировано из оригинала 2011-03-02.
  2. ^ Нанна, М. Дж. (2002). «T2 Хотелинга против рангового преобразования с реальными данными Лайкерта». Журнал современных прикладных статистических методов . 1 : 83–99 . doi : 10.22237/jmasm/1020255180 .
  3. ^ Институт SAS. (1985). Руководство SAS/stat для персональных компьютеров (5-е изд.). Кэри, Северная Каролина: Автор.
  4. ^ Институт SAS. (1987). Руководство SAS/stat для персональных компьютеров (6-е изд.). Кэри, Северная Каролина: Автор.
  5. ^ *Институт SAS. (2008). Руководство пользователя SAS/STAT 9.2: Введение в непараметрический анализ. Кэри, Северная Каролина. Автор.
  6. ^ Conover, WJ; Iman, RL (1976). «О некоторых альтернативных процедурах с использованием рангов для анализа экспериментальных планов». Communications in Statistics - Theory and Methods . A5 (14): 1349– 1368. doi :10.1080/03610927608827447.
  7. ^ Иман, Р. Л. (1974). «Исследование мощности рангового преобразования для двухфакторной модели классификации, когда могут присутствовать взаимодействия». Канадский журнал статистики . 2 (2): 227– 239. doi :10.2307/3314695. JSTOR  3314695.
  8. ^ Иман, Р. Л. и Коновер, У. Дж. (1976). Сравнение нескольких ранговых тестов для двухсторонней компоновки (SAND76-0631). Альбукерке, Нью-Мексико: Sandia Laboratories.
  9. ^ Sawilowsky, S. (1985). Надежный и мощный анализ 2x2x2 ANOVA, преобразование ранга, случайные нормальные баллы и ожидаемые нормальные баллы . Неопубликованная докторская диссертация, Университет Южной Флориды.
  10. ^ Sawilowsky, S.; Blair, RC & Higgins, JJ (1989). "Исследование ошибок типа I и свойств мощности процедуры рангового преобразования в факторном ANOVA". Журнал образовательной статистики . 14 (3): 255– 267. doi :10.2307/1165018. JSTOR  1165018.
  11. ^ Блэр, RC; Савиловски, SS и Хиггинс, JJ (1987). «Ограничения статистики преобразования ранга в тестах на взаимодействия». Communications in Statistics - Simulation and Computation . B16 (4): 1133– 1145. doi :10.1080/03610918708812642.
  12. ^ Sawilowsky, S. (1990). «Непараметрические тесты взаимодействия в экспериментальном дизайне». Review of Educational Research . 60 (1): 91– 126. doi :10.3102/00346543060001091. S2CID  146336002.
  13. ^ Томпсон, GL (1991). «Заметка о ранговом преобразовании для взаимодействий». Biometrika . 78 (3): 697– 701. doi :10.1093/biomet/78.3.697.
  14. ^ Томпсон, GL; Амманн, LP (1989). «Эффективность рангового преобразования в двухфакторных моделях без взаимодействия». Журнал Американской статистической ассоциации . 84 (405): 325–330 . doi :10.1080/01621459.1989.10478773.
  15. ^ Блэр, RC; Хиггинс, JJ (1985). «Сравнение мощности статистики преобразования рангов парных выборок с мощностью статистики знаковых рангов Уилкоксона». Журнал образовательной и поведенческой статистики . 10 (4): 368– 383. doi :10.3102/10769986010004368. S2CID  121958144.
  16. ^ Хедрик, TC (1997). Ошибка типа I и ковариационный анализ с использованием преобразования мощности ранга (ANCOVA) в факторной разметке 3 x 4. Неопубликованная докторская диссертация, Университет Южной Флориды.
  17. ^ Sawilowsky, S. (1985). «Сравнение случайных нормальных результатов теста при распределениях F и хи-квадрат с тестом ANOVA 2x2x2». Florida Journal of Educational Research . 27 : 83–97 . doi :10.62798/DHLQ6308.
  18. ^ Кепнер, Джеймс Л.; Вакерли, Деннис Д. (1996). «О методах преобразования рангов для сбалансированных неполных планов с повторными измерениями». Журнал Американской статистической ассоциации . 91 (436): 1619– 1625. doi :10.1080/01621459.1996.10476730. JSTOR  2291588.
  19. ^ Хеттманспергер, TP; МакКин, JW (1998). Надежные непараметрические статистические методы . Библиотека статистики Кендалла. Т. 5 (Первое издание). Лондон: Эдвард Арнольд. С. xiv+467 с. ISBN 0-340-54937-8. МР  1604954.
  20. ^ Sawilowsky, S. (1990). «Непараметрические тесты взаимодействия в экспериментальном дизайне». Review of Educational Research . 60 : 91– 126. doi :10.3102/00346543060001091. S2CID  146336002.
Получено с "https://en.wikipedia.org/w/index.php?title=ANOVA_on_ranks&oldid=1268922016"