Многомерный ковариационный анализ ( MANCOVA ) — это расширение методов ковариационного анализа ( ANCOVA ) для охвата случаев, когда имеется более одной зависимой переменной и когда требуется контроль сопутствующих непрерывных независимых переменных — ковариатов . Наиболее заметным преимуществом плана MANCOVA по сравнению с простым MANOVA является «вынесение за скобки» шума или ошибки, которые были введены ковариантом. [1] Обычно используемой многомерной версией F-статистики ANOVA является лямбда Уилкса (Λ), которая представляет собой отношение между дисперсией ошибки (или ковариацией) и дисперсией эффекта (или ковариацией). [1]
Цели
Подобно всем тестам в семействе ANOVA , основной целью MANCOVA является проверка значимых различий между средними значениями групп. [1] Процесс характеристики ковариата в источнике данных позволяет уменьшить величину ошибки, представленной в дизайне MANCOVA как ошибка MS . Впоследствии общая лямбда Уилкса станет больше и с большей вероятностью будет охарактеризована как значимая. [1] Это дает исследователю больше статистической мощности для обнаружения различий в данных. Многомерный аспект MANCOVA позволяет характеризовать различия в средних значениях групп в отношении линейной комбинации нескольких зависимых переменных, одновременно контролируя ковариаты.
Пример ситуации, когда MANCOVA уместен:
Предположим, что ученый заинтересован в тестировании двух новых препаратов на предмет их влияния на показатели депрессии и тревожности. Также предположим, что у ученого есть информация, касающаяся общей чувствительности к препаратам для каждого пациента; учет этого ковариата придаст тесту более высокую чувствительность при определении влияния каждого препарата на обе зависимые переменные.
Предположения
Для правильного использования MANCOVA необходимо соблюсти некоторые допущения:
Нормальность : для каждой группы каждая зависимая переменная должна представлять нормальное распределение оценок. Кроме того, любая линейная комбинация зависимых переменных должна быть нормально распределена. Преобразование или удаление выбросов может помочь обеспечить выполнение этого предположения. [2] Нарушение этого предположения может привести к увеличению частоты ошибок типа I. [3]
Независимость наблюдений : каждое наблюдение должно быть независимым от всех других наблюдений; это предположение может быть выполнено путем использования методов случайной выборки . Нарушение этого предположения может привести к увеличению частоты ошибок типа I. [3]
Однородность дисперсий : каждая зависимая переменная должна демонстрировать схожие уровни дисперсии по каждой независимой переменной. Нарушение этого предположения можно концептуализировать как корреляцию, существующую между дисперсиями и средними значениями зависимых переменных. Это нарушение часто называют « гетероскедастичностью » [4] и его можно проверить с помощью теста Левена . [5]
Однородность ковариаций : матрица интеркорреляции между зависимыми переменными должна быть одинаковой на всех уровнях независимой переменной. Нарушение этого предположения может привести к увеличению частоты ошибок типа I, а также к снижению статистической мощности . [3]
Логика MANOVA
Вдохновленный ANOVA , MANOVA основан на обобщении суммы квадратов, объясняемых моделью , и обратной суммы квадратов, не объясняемых моделью . Наиболее распространенные [6] [7] статистики — это сводки, основанные на корнях (или собственных значениях ) матрицы .
Наибольший корень Роя (также называется наибольшим корнем Роя ),
Ковариаты
В статистике ковариата представляет собой источник вариации, который не контролируется в эксперименте и, как полагают, влияет на зависимую переменную. [8] Целью таких методов, как ANCOVA, является устранение эффектов такой неконтролируемой вариации для увеличения статистической мощности и обеспечения точного измерения истинной связи между независимыми и зависимыми переменными. [8]
Примером может служить анализ тренда уровня моря, проведенный Вудвортом (1987). [9] Здесь зависимой переменной (и переменной, представляющей наибольший интерес) был среднегодовой уровень моря в заданном месте, для которого был доступен ряд годовых значений. Основной независимой переменной было «время». Использовался «ковариат», состоящий из годовых значений среднегодового атмосферного давления на уровне моря. Результаты показали, что включение ковариата позволило получить улучшенные оценки тренда во времени по сравнению с анализами, в которых ковариат не учитывался.