Метод Холма–Бонферрони

Статистический метод

В статистике метод Холма–Бонферрони [ 1], также называемый методом Холма или методом Бонферрони–Холма , используется для противодействия проблеме множественных сравнений . Он предназначен для контроля частоты ошибок по семействам (FWER) и предлагает простой тест, равномерно более мощный, чем поправка Бонферрони . Он назван в честь Стуре Холма, который кодифицировал метод, и Карло Эмилио Бонферрони .

Мотивация

При рассмотрении нескольких гипотез возникает проблема множественности : чем больше гипотез проверяется, тем выше вероятность получения ошибок типа I ( ложноположительных результатов ). Метод Холма–Бонферрони является одним из многих подходов для контроля FWER, т. е. вероятности того, что произойдет одна или несколько ошибок типа I, путем корректировки критерия отклонения для каждой из отдельных гипотез. [ необходима цитата ]

Формулировка

Метод следующий:

  • Предположим, у вас есть p-значения , отсортированные в порядке от наименьшего к наибольшему , и соответствующие им гипотезы (нулевые гипотезы). Вы хотите, чтобы FWER не превышал определенного заранее заданного уровня значимости . м {\displaystyle м} П 1 , , П м {\displaystyle P_{1},\ldots ,P_{m}} ЧАС 1 , , ЧАС м {\displaystyle H_{1},\ldots ,H_{м}} α {\displaystyle \альфа}
  • Если да , отклонить и перейти к следующему шагу, в противном случае ВЫЙТИ. П 1 α / м {\displaystyle P_{1}\leq \альфа /м} ЧАС 1 {\displaystyle H_{1}}
  • Если да , то также отклонить и перейти к следующему шагу, в противном случае ВЫЙТИ. П 2 α / ( м 1 ) {\displaystyle P_{2}\leq \альфа /(м-1)} ЧАС 2 {\displaystyle H_{2}}
  • И так далее: для каждого значения P проверить, является ли . Если да, отклонить и продолжить проверку больших значений P, в противном случае ВЫЙТИ. П к α м + 1 к {\displaystyle P_{k}\leq {\frac {\alpha }{m+1-k}}} ЧАС к {\displaystyle H_{k}}

Этот метод гарантирует, что FWER не превышает , в сильном смысле. α {\displaystyle \альфа}

Обоснование

Простая поправка Бонферрони отклоняет только нулевые гипотезы со значением p, меньшим или равным , чтобы гарантировать, что FWER, т. е. риск отклонения одной или нескольких истинных нулевых гипотез (т. е. совершения одной или нескольких ошибок типа I), не превышает . Цена этой защиты от ошибок типа I — повышенный риск не отклонения одной или нескольких ложных нулевых гипотез (т. е. совершения одной или нескольких ошибок типа II). α м {\displaystyle {\frac {\alpha}{м}}} α {\displaystyle \альфа}

Метод Холма–Бонферрони также контролирует FWER при , но с меньшим увеличением риска ошибки типа II, чем классический метод Бонферрони. Метод Холма–Бонферрони сортирует p -значения от наименьшего к наибольшему и сравнивает их с номинальными альфа-уровнями от до (соответственно), а именно значениями . α {\displaystyle \альфа} α м {\displaystyle {\frac {\alpha}{м}}} α {\displaystyle \альфа} α м , α м 1 , , α 2 , α 1 {\displaystyle {\frac {\alpha }{m}},{\frac {\alpha }{m-1}},\ldots ,{\frac {\alpha }{2}},{\frac {\alpha }{1}}}

  • Индекс определяет первое значение p , которое недостаточно низко для подтверждения отклонения. Таким образом, нулевые гипотезы отклоняются, в то время как нулевые гипотезы не отклоняются. k {\displaystyle k} H ( 1 ) , , H ( k 1 ) {\displaystyle H_{(1)},\ldots ,H_{(k-1)}} H ( k ) , . . . , H ( m ) {\displaystyle H_{(k)},...,H_{(m)}}
  • Если ни одно p -значение не оказалось достаточно низким для отклонения, то ни одна нулевая гипотеза не отклоняется. k = 1 {\displaystyle k=1}
  • Если такой индекс не найден, то все p -значения достаточно низки для отклонения, поэтому все нулевые гипотезы отклоняются (ни одна не принимается). k {\displaystyle k}

Доказательство

Пусть — семейство гипотез, отсортированное по их p-значениям . Пусть — множество индексов, соответствующих (неизвестным) истинным нулевым гипотезам, имеющее членов. H ( 1 ) H ( m ) {\displaystyle H_{(1)}\ldots H_{(m)}} P ( 1 ) P ( 2 ) P ( m ) {\displaystyle P_{(1)}\leq P_{(2)}\leq \cdots \leq P_{(m)}} I 0 {\displaystyle I_{0}} m 0 {\displaystyle m_{0}}

Утверждение : Если мы ошибочно отвергаем некоторую истинную гипотезу, то существует истинная гипотеза , для которой не более . H ( ) {\displaystyle H_{(\ell )}} P ( ) {\displaystyle P_{(\ell )}} α m 0 {\displaystyle {\frac {\alpha }{m_{0}}}}

Сначала отметим, что в этом случае существует по крайней мере одна истинная гипотеза, поэтому . Пусть будет таким, что — первая отвергнутая истинная гипотеза. Тогда — все отвергнутые ложные гипотезы. Отсюда следует, что и, следовательно, (1). Поскольку отвергается, то должно быть по определению процедуры тестирования. Используя (1), заключаем, что , как и требовалось. m 0 1 {\displaystyle m_{0}\geq 1} {\displaystyle \ell } H ( ) {\displaystyle H_{(\ell )}} H ( 1 ) , , H ( 1 ) {\displaystyle H_{(1)},\ldots ,H_{(\ell -1)}} 1 m m 0 {\displaystyle \ell -1\leq m-m_{0}} 1 m + 1 1 m 0 {\displaystyle {\frac {1}{m-\ell +1}}\leq {\frac {1}{m_{0}}}} H ( ) {\displaystyle H_{(\ell )}} P ( ) α m + 1 {\displaystyle P_{(\ell )}\leq {\frac {\alpha }{m-\ell +1}}} P ( ) α m 0 {\displaystyle P_{(\ell )}\leq {\frac {\alpha }{m_{0}}}}

Итак, давайте определим случайное событие . Обратите внимание, что для , поскольку — истинная нулевая гипотеза, то имеем, что . Субаддитивность меры вероятности подразумевает, что . Следовательно, вероятность отвергнуть истинную гипотезу не превышает . A = i I 0 { P i α m 0 } {\displaystyle A=\bigcup _{i\in I_{0}}\left\{P_{i}\leq {\frac {\alpha }{m_{0}}}\right\}} i I o {\displaystyle i\in I_{o}} H i {\displaystyle H_{i}} P ( { P i α m 0 } ) = α m 0 {\displaystyle P\left(\left\{P_{i}\leq {\frac {\alpha }{m_{0}}}\right\}\right)={\frac {\alpha }{m_{0}}}} Pr ( A ) i I 0 P ( { P i α m 0 } ) = i I 0 α m 0 = α {\displaystyle \Pr(A)\leq \sum _{i\in I_{0}}P\left(\left\{P_{i}\leq {\frac {\alpha }{m_{0}}}\right\}\right)=\sum _{i\in I_{0}}{\frac {\alpha }{m_{0}}}=\alpha } α {\displaystyle \alpha }

Альтернативное доказательство

Метод Холма–Бонферрони можно рассматривать как закрытую процедуру тестирования [2] с поправкой Бонферрони, применяемой локально на каждом из пересечений нулевых гипотез.

Принцип замыкания гласит, что гипотеза в семействе гипотез отвергается — при контроле FWER на уровне — тогда и только тогда, когда все подсемейства пересечений с отвергаются на уровне . H i {\displaystyle H_{i}} H 1 , , H m {\displaystyle H_{1},\ldots ,H_{m}} α {\displaystyle \alpha } H i {\displaystyle H_{i}} α {\displaystyle \alpha }

Метод Холма–Бонферрони является сокращенной процедурой , поскольку он делает или меньше сравнений, в то время как число всех пересечений нулевых гипотез, которые должны быть проверены, имеет порядок . Он контролирует FWER в сильном смысле. m {\displaystyle m} 2 m {\displaystyle 2^{m}}

В процедуре Холма–Бонферрони мы сначала проверяем . Если он не отвергается, то пересечение всех нулевых гипотез также не отвергается, так что существует по крайней мере одна гипотеза пересечения для каждой из элементарных гипотез , которая не отвергается, таким образом, мы не отвергаем ни одну из элементарных гипотез. H ( 1 ) {\displaystyle H_{(1)}} i = 1 m H i {\displaystyle \bigcap \nolimits _{i=1}^{m}H_{i}} H 1 , , H m {\displaystyle H_{1},\ldots ,H_{m}}

Если отвергается на уровне , то все подсемейства пересечений, которые его содержат, также отвергаются, таким образом, отвергается. Это происходит потому, что является наименьшим в каждом из подсемейств пересечений, а размер подсемейств не превышает , так что порог Бонферрони больше . H ( 1 ) {\displaystyle H_{(1)}} α / m {\displaystyle \alpha /m} H ( 1 ) {\displaystyle H_{(1)}} P ( 1 ) {\displaystyle P_{(1)}} m {\displaystyle m} α / m {\displaystyle \alpha /m}

То же самое обоснование применимо к . Однако, поскольку уже отклонено, достаточно отклонить все подсемейства пересечений без . Как только выполняется, все пересечения, содержащие , отклоняются. H ( 2 ) {\displaystyle H_{(2)}} H ( 1 ) {\displaystyle H_{(1)}} H ( 2 ) {\displaystyle H_{(2)}} H ( 1 ) {\displaystyle H_{(1)}} P ( 2 ) α / ( m 1 ) {\displaystyle P_{(2)}\leq \alpha /(m-1)} H ( 2 ) {\displaystyle H_{(2)}}

То же самое относится к каждому . 1 i m {\displaystyle 1\leq i\leq m}

Пример

Рассмотрим четыре нулевые гипотезы с нескорректированными p-значениями , и , которые необходимо проверить на уровне значимости . Поскольку процедура является пошаговой, мы сначала проверяем , которая имеет наименьшее p-значение . P-значение сравнивается с , нулевая гипотеза отклоняется, и мы переходим к следующей. Поскольку мы также отклоняем и продолжаем. Следующая гипотеза не отклоняется, поскольку . Мы прекращаем проверку и приходим к выводу, что и отклоняются и и не отклоняются, контролируя при этом частоту ошибок по семейству на уровне . Обратите внимание, что даже если применяется, не отклоняется. Это связано с тем, что процедура тестирования останавливается, как только происходит отказ от отклонения. H 1 , , H 4 {\displaystyle H_{1},\ldots ,H_{4}} p 1 = 0.01 {\displaystyle p_{1}=0.01} p 2 = 0.04 {\displaystyle p_{2}=0.04} p 3 = 0.03 {\displaystyle p_{3}=0.03} p 4 = 0.005 {\displaystyle p_{4}=0.005} α = 0.05 {\displaystyle \alpha =0.05} H 4 = H ( 1 ) {\displaystyle H_{4}=H_{(1)}} p 4 = p ( 1 ) = 0.005 {\displaystyle p_{4}=p_{(1)}=0.005} α / 4 = 0.0125 {\displaystyle \alpha /4=0.0125} p 1 = p ( 2 ) = 0.01 < 0.0167 = α / 3 {\displaystyle p_{1}=p_{(2)}=0.01<0.0167=\alpha /3} H 1 = H ( 2 ) {\displaystyle H_{1}=H_{(2)}} H 3 {\displaystyle H_{3}} p 3 = p ( 3 ) = 0.03 > 0.025 = α / 2 {\displaystyle p_{3}=p_{(3)}=0.03>0.025=\alpha /2} H 1 {\displaystyle H_{1}} H 4 {\displaystyle H_{4}} H 2 {\displaystyle H_{2}} H 3 {\displaystyle H_{3}} α = 0.05 {\displaystyle \alpha =0.05} p 2 = p ( 4 ) = 0.04 < 0.05 = α {\displaystyle p_{2}=p_{(4)}=0.04<0.05=\alpha } H 2 {\displaystyle H_{2}}

Расширения

Метод Хольма–Шидака

Если проверки гипотез не являются отрицательно зависимыми, можно заменить на: α m , α m 1 , , α 1 {\displaystyle {\frac {\alpha }{m}},{\frac {\alpha }{m-1}},\ldots ,{\frac {\alpha }{1}}}

1 ( 1 α ) 1 / m , 1 ( 1 α ) 1 / ( m 1 ) , , 1 ( 1 α ) 1 {\displaystyle 1-(1-\alpha )^{1/m},1-(1-\alpha )^{1/(m-1)},\ldots ,1-(1-\alpha )^{1}}

в результате тест получился немного более мощным.

Утяжеленная версия

Пусть будут упорядоченными нескорректированными p-значениями. Пусть , соответствуют . Отклонить до тех пор, пока P ( 1 ) , , P ( m ) {\displaystyle P_{(1)},\ldots ,P_{(m)}} H ( i ) {\displaystyle H_{(i)}} 0 w ( i ) {\displaystyle 0\leq w_{(i)}} P ( i ) {\displaystyle P_{(i)}} H ( i ) {\displaystyle H_{(i)}}

P ( j ) w ( j ) k = j m w ( k ) α , j = 1 , , i {\displaystyle P_{(j)}\leq {\frac {w_{(j)}}{\sum _{k=j}^{m}w_{(k)}}}\alpha ,\quad j=1,\ldots ,i}

Скорректированоп-ценности

Скорректированные p -значения для метода Холма–Бонферрони составляют:

p ~ ( i ) = max j i { ( m j + 1 ) p ( j ) } 1 ,  where  { x } 1 min ( x , 1 ) . {\displaystyle {\widetilde {p}}_{(i)}=\max _{j\leq i}\left\{(m-j+1)p_{(j)}\right\}_{1},{\text{ where }}\{x\}_{1}\equiv \min(x,1).}

В предыдущем примере скорректированные p -значения равны , и . Только гипотезы и отклоняются на уровне . p ~ 1 = 0.03 {\displaystyle {\widetilde {p}}_{1}=0.03} p ~ 2 = 0.06 {\displaystyle {\widetilde {p}}_{2}=0.06} p ~ 3 = 0.06 {\displaystyle {\widetilde {p}}_{3}=0.06} p ~ 4 = 0.02 {\displaystyle {\widetilde {p}}_{4}=0.02} H 1 {\displaystyle H_{1}} H 4 {\displaystyle H_{4}} α = 0.05 {\displaystyle \alpha =0.05}

Аналогичные скорректированные p -значения для метода Холма-Шидака можно определить рекурсивно как , где . Из-за неравенства для метод Холма-Шидака будет более мощным, чем метод Холма-Бонферрони. p ~ ( i ) = max { p ~ ( i 1 ) , 1 ( 1 p ( i ) ) m i + 1 } {\displaystyle {\widetilde {p}}_{(i)}=\max \left\{{\widetilde {p}}_{(i-1)},1-(1-p_{(i)})^{m-i+1}\right\}} p ~ ( 1 ) = 1 ( 1 p ( 1 ) ) m {\displaystyle {\widetilde {p}}_{(1)}=1-(1-p_{(1)})^{m}} 1 ( 1 α ) 1 / n < α / n {\displaystyle 1-(1-\alpha )^{1/n}<\alpha /n} n 2 {\displaystyle n\geq 2}

Взвешенные скорректированные p -значения: [ необходима ссылка ]

p ~ ( i ) = max j i { k = j m w ( k ) w ( j ) p ( j ) } 1 ,  where  { x } 1 min ( x , 1 ) . {\displaystyle {\widetilde {p}}_{(i)}=\max _{j\leq i}\left\{{\frac {\sum _{k=j}^{m}{w_{(k)}}}{w_{(j)}}}p_{(j)}\right\}_{1},{\text{ where }}\{x\}_{1}\equiv \min(x,1).}

Гипотеза отклоняется на уровне α тогда и только тогда, когда ее скорректированное p -значение меньше α. В предыдущем примере с использованием равных весов скорректированные p -значения составляют 0,03, 0,06, 0,06 и 0,02. Это еще один способ увидеть, что при использовании α = 0,05 только гипотезы один и четыре отклоняются этой процедурой.

Альтернативы и использование

Метод Холма–Бонферрони «равномерно» более эффективен, чем классическая поправка Бонферрони , то есть он всегда по крайней мере столь же эффективен.

Существуют и другие методы управления FWER, которые являются более мощными, чем процедура Холма–Бонферрони. Например, в процедуре Хохберга отклонение производится после нахождения максимального индекса, такого что . Таким образом, процедура Хохберга равномерно более мощна, чем процедура Холма. Однако процедура Хохберга требует, чтобы гипотезы были независимыми или находились под определенными формами положительной зависимости, тогда как процедура Холма–Бонферрони может применяться без таких предположений. Аналогичная процедура повышения уровня — это процедура Хоммеля, которая равномерно более мощна, чем процедура Хохберга. [3] H ( 1 ) H ( k ) {\displaystyle H_{(1)}\ldots H_{(k)}} k {\displaystyle k} P ( k ) α m + 1 k {\displaystyle P_{(k)}\leq {\frac {\alpha }{m+1-k}}}

Нейминг

Карло Эмилио Бонферрони не принимал участия в изобретении метода, описанного здесь. Первоначально Холм назвал метод «последовательно отвергающим тестом Бонферрони», и только спустя некоторое время он стал известен как тест Холма–Бонферрони. Мотивы, по которым Холм назвал свой метод в честь Бонферрони, объясняются в оригинальной статье: «Использование неравенства Буля в теории множественного вывода обычно называют методом Бонферрони, и по этой причине мы будем называть наш тест последовательно отвергающим тестом Бонферрони».

Ссылки

  1. ^ Холм, С. (1979). «Простая последовательно отклоняющая множественная процедура тестирования». Scandinavian Journal of Statistics . 6 (2): 65–70 . JSTOR  4615733. MR  0538597.
  2. ^ Маркус, Р.; Периц, Э.; Габриэль, К. Р. (1976). «О закрытых процедурах тестирования с особым упором на упорядоченный дисперсионный анализ». Biometrika . 63 (3): 655– 660. doi :10.1093/biomet/63.3.655.
  3. ^ Хоммель, Г. (1988). «Поэтапная процедура множественного теста с отклонением, основанная на модифицированном тесте Бонферрони». Biometrika . 75 (2): 383–386 . doi :10.1093/biomet/75.2.383. hdl : 2027.42/149272 . ISSN  0006-3444.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Holm–Bonferroni_method&oldid=1260493498"