Ожидаемые средние квадраты

В статистике ожидаемые средние квадраты (EMS) — это ожидаемые значения определенных статистик, возникающих при разбиении сумм квадратов в дисперсионном анализе (ANOVA). Их можно использовать для определения того, какая статистика должна появиться в знаменателе в F-тесте для проверки нулевой гипотезы об отсутствии определенного эффекта.

Определение

Когда общая скорректированная сумма квадратов в ANOVA разбивается на несколько компонентов, каждый из которых приписывается эффекту определенной предикторной переменной, каждая из сумм квадратов в этом разбиении является случайной величиной, которая имеет ожидаемое значение . Это ожидаемое значение, деленное на соответствующее число степеней свободы, является ожидаемым средним квадратом для этой предикторной переменной.

Пример

Следующий пример взят из книги Дональда Хедекера и Роберта Д. Гиббонса «Анализ продольных данных» . [1]

Каждое из s видов лечения (одно из которых может быть плацебо) назначается выборке из (заглавных) N случайно выбранных пациентов, у которых в каждый из (строчных) n указанных моментов времени наблюдаются определенные измерения, для (таким образом, количество пациентов, получающих различные виды лечения, может различаться), и Мы предполагаем, что наборы пациентов, получающих различные виды лечения, не пересекаются, поэтому пациенты вложены в виды лечения и не пересекаются с видами лечения. Мы имеем И час я дж {\textstyle Y_{hij}} час = 1 , , с , я = 1 , , Н час {\textstyle h=1,\ldots ,s,\quad i=1,\ldots ,N_{h}} дж = 1 , , н . {\textstyle j=1,\ldots ,n.}

И час я дж = μ + γ час + τ дж + ( γ τ ) час дж + π я ( час ) + ε час я дж {\displaystyle Y_{hij}=\mu +\gamma _{h}+\tau _{j}+(\gamma \tau )_{hj}+\pi _{i(h)}+\varepsilon _{ привет}}

где

  • μ {\displaystyle \мю} = большое среднее, (фиксированное)
  • γ час {\displaystyle \гамма _{h}} = эффект лечения , (фиксированный) час {\displaystyle ч}
  • τ дж {\displaystyle \tau _{j}} = эффект времени , (фиксированный) дж {\displaystyle j}
  • ( γ τ ) час дж {\displaystyle (\гамма \тау )_{hj}} = эффект взаимодействия лечения и времени , (фиксированный) час {\displaystyle ч} дж {\displaystyle j}
  • π я ( час ) {\displaystyle \пи _{i(h)}} = индивидуальный эффект различия для пациента, вложенного в лечение , (случайный) я {\displaystyle я} час {\displaystyle ч}
  • ε час я дж {\displaystyle \varepsilon _ {hij}} = ошибка для пациента, находящегося на лечении в момент времени . (случайная) я {\displaystyle я} час {\displaystyle ч} дж {\displaystyle j}
  • σ π 2 {\displaystyle \sigma _ {\pi }^{2}} = дисперсия случайного эффекта пациентов, включенных в лечение,
  • σ ε {\displaystyle \sigma _ {\varepsilon }} = дисперсия ошибки.

Общая скорректированная сумма квадратов равна

час я дж ( И час я дж И ¯ ) 2 где  И ¯ = 1 н час я дж И час я дж . {\displaystyle \sum _{hij}(Y_{hij}-{\overline {Y}})^{2}\quad {\text{where }}{\overline {Y}}={\frac {1} {n}}\sum _{hij}Y_{hij}.}

Таблица ANOVA ниже разделяет сумму квадратов (где ): Н = час Н час {\textstyle N=\сумма _{ч}N_{ч}}

источник изменчивостистепени свободысумма квадратовсредний квадратожидаемый средний квадрат
уход с 1 {\displaystyle s-1} SS Тр = н час = 1 с Н час ( И ¯ час И ¯ ) 2 {\displaystyle {\text{SS}}_{\text{Tr}}=n\sum _{h=1}^{s}N_{h}({\overline {Y}}_{h\cdot \cdot }-{\overline {Y}}_{\cdot \cdot \cdot })^{2}} SS Тр с 1 {\displaystyle {\dfrac {{\text{SS}}_{\text{Tr}}}{s-1}}} σ ε 2 + н σ π 2 + Д Тр {\displaystyle \сигма _{\varepsilon}^{2}+n\сигма _{\пи}^{2}+D_{\text{Tr}}}
время н 1 {\displaystyle n-1} SS Т = Н дж = 1 н ( И ¯ дж И ¯ ) 2 {\displaystyle {\text{SS}}_{\text{T}}=N\sum _{j=1}^{n}({\overline {Y}}_{\cdot \cdot j}-{\overline {Y}}_{\cdot \cdot \cdot })^{2}} SS Т н 1 {\displaystyle {\dfrac {{\text{SS}}_{\text{T}}}{n-1}}} σ ε 2 + Д Т {\displaystyle \сигма _{\varepsilon}^{2}+D_{\text{T}}}
лечение × время ( с 1 ) ( н 1 ) {\displaystyle (с-1)(н-1)} SS Тр Т = час = 1 с дж = 1 н Н час ( И ¯ час дж И ¯ час И ¯ дж + И ¯ ) 2 {\displaystyle {\text{SS}}_{\text{Tr T}}=\sum _{h=1}^{s}\sum _{j=1}^{n}N_{h}({\overline {Y}}_{h\cdot j}-{\overline {Y}}_{h\cdot \cdot }-{\overline {Y}}_{\cdot \cdot j}+{\overline {Y}}_{\cdot \cdot \cdot })^{2}} SS Тр Т ( н 1 ) ( с 1 ) {\displaystyle {\dfrac {{\text{SS}}_{\text{Tr T}}}{(n-1)(s-1)}}} σ ε 2 + Д Тр Т {\displaystyle \sigma _{\varepsilon }^{2}+D_{\text{Tr T}}}
пациенты в рамках лечения Н с {\displaystyle Нс} SS С ( Тр ) = н час = 1 с я = 1 Н час ( И ¯ час я И ¯ час ) 2 {\displaystyle {\text{SS}}_{{\text{S}}({\text{Tr}})}=n\sum _{h=1}^{s}\sum _{i=1}^{N_{h}}({\overline {Y}}_{hi\cdot }-{\overline {Y}}_{h\cdot \cdot })^{2}} SS С ( Тр ) Н с {\displaystyle {\dfrac {{\text{SS}}_{{\text{S}}({\text{Tr}})}}{Ns}}} σ ε 2 + н σ π 2 {\displaystyle \sigma _{\varepsilon }^{2}+n\sigma _{\pi }^{2}}
ошибка ( Н с ) ( н 1 ) {\displaystyle (Ns)(n-1)} SS Э = час = 1 с я = 1 Н час дж = 1 н ( И час я дж И ¯ час дж И ¯ час я + И ¯ час ) 2 {\displaystyle {\text{SS}}_{\text{E}}=\sum _{h=1}^{s}\sum _{i=1}^{N_{h}}\sum _{j=1}^{n}(Y_{hij}-{\overline {Y}}_{h\cdot j}-{\overline {Y}}_{hi\cdot }+{\overline {Y}}_{h\cdot \cdot })^{2}} SS E ( N s ) ( n 1 ) {\displaystyle {\dfrac {{\text{SS}}_{\text{E}}}{(N-s)(n-1)}}} σ ε 2 {\displaystyle \sigma _{\varepsilon }^{2}}

Использование в F-тестах

Нулевая гипотеза, представляющая интерес, заключается в том, что нет никакой разницы между эффектами различных видов лечения, а значит, нет никакой разницы между средними величинами видов лечения. Это можно выразить, сказав (с обозначениями, используемыми в таблице выше). Согласно этой нулевой гипотезе, ожидаемый средний квадрат для эффектов видов лечения равен D Tr = 0 , {\textstyle D_{\text{Tr}}=0,} σ ε 2 + n σ π 2 . {\textstyle \sigma _{\varepsilon }^{2}+n\sigma _{\pi }^{2}.}

Числитель в F-статистике для проверки этой гипотезы — это среднеквадратичное значение из-за различий между вариантами лечения, т. е. оно равно Знаменатель, однако, не равен Причина в том, что случайная величина ниже, хотя при нулевой гипотезе она имеет F-распределение , не является наблюдаемой — она не является статистикой — поскольку ее значение зависит от ненаблюдаемых параметров и SS Tr / ( s 1 ) . {\textstyle \left.{\text{SS}}_{\text{Tr}}\right/(s-1).} SS E / ( ( N s ) ( n 1 ) ) . {\textstyle \left.{\text{SS}}_{\text{E}}\right/{\big (}(N-s)(n-1){\big )}.} σ π 2 {\textstyle \sigma _{\pi }^{2}} σ ε 2 . {\textstyle \sigma _{\varepsilon }^{2}.}

SS Tr σ ε 2 + n σ π 2 / ( s 1 ) SS E σ ε 2 / ( ( N s ) ( n 1 ) ) SS Tr / ( s 1 ) SS E / ( ( N s ) ( n 1 ) ) {\displaystyle {\frac {\left.{\frac {{\text{SS}}_{\text{Tr}}}{\sigma _{\varepsilon }^{2}+n\sigma _{\pi }^{2}}}\right/(s-1)}{\left.{\frac {{\text{SS}}_{\text{E}}}{\sigma _{\varepsilon }^{2}}}\right/{\big (}(N-s)(n-1){\big )}}}\neq {\frac {{\text{SS}}_{\text{Tr}}/(s-1)}{{\text{SS}}_{\text{E}}/{\big (}(N-s)(n-1){\big )}}}}

Вместо этого в качестве тестовой статистики используется следующая случайная величина, которая не определена в терминах : SS E {\textstyle {\text{SS}}_{\text{E}}}

F = SS Tr σ ε 2 + n σ π 2 / ( s 1 ) SS S ( Tr ) σ ε 2 + n σ π 2 / ( N s ) = SS Tr / ( s 1 ) SS S(Tr) / ( N s ) {\displaystyle F={\frac {\left.{\frac {{\text{SS}}_{\text{Tr}}}{\sigma _{\varepsilon }^{2}+n\sigma _{\pi }^{2}}}\right/(s-1)}{\left.{\frac {{\text{SS}}_{{\text{S}}({\text{Tr}})}}{\sigma _{\varepsilon }^{2}+n\sigma _{\pi }^{2}}}\right/(N-s)}}={\frac {\left.{\text{SS}}_{\text{Tr}}\right/(s-1)}{\left.{\text{SS}}_{\text{S(Tr)}}\right/(N-s)}}}

Примечания и ссылки

  1. ^ Дональд Хедекер, Роберт Д. Гиббонс. Анализ продольных данных. Wiley Interscience. 2006. С. 21–24.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Expected_mean_squares&oldid=1207619308"