тест Граббса

Статистический тест

В статистике тест Граббса или тест Граббса (названный в честь Фрэнка Э. Граббса , который опубликовал тест в 1950 году [1] ), также известный как тест максимального нормализованного остатка или тест экстремального стьюдентизированного отклонения , представляет собой тест, используемый для обнаружения выбросов в одномерном наборе данных, предположительно полученном из нормально распределенной совокупности.

Определение

Тест Граббса основан на предположении нормальности . То есть, прежде чем применять тест Граббса, следует убедиться, что данные можно разумно аппроксимировать нормальным распределением. [2]

Тест Граббса обнаруживает по одному выбросу за раз. Этот выброс удаляется из набора данных, и тест повторяется до тех пор, пока не будет обнаружено ни одного выброса. Однако многократные итерации изменяют вероятность обнаружения, и тест не следует использовать для выборок размером шесть или меньше, поскольку он часто помечает большинство точек как выбросы. [3]

Тест Граббса определен для следующих гипотез :

H 0 : В наборе данных нет выбросов
H a : В наборе данных есть только один выброс

Статистика теста Граббса определяется как

Г = макс я = 1 , , Н | И я И ¯ | с {\displaystyle G={\frac {\displaystyle \max _{i=1,\ldots ,N}\left\vert Y_{i}-{\bar {Y}}\right\vert }{s}}}

где и обозначают выборочное среднее и стандартное отклонение соответственно. Статистика теста Граббса — это наибольшее абсолютное отклонение от выборочного среднего в единицах выборочного стандартного отклонения. И ¯ {\displaystyle {\overline {Y}}} с {\displaystyle с}

Это двусторонний тест , в котором гипотеза об отсутствии выбросов отвергается на уровне значимости α, если

Г > Н 1 Н т α / ( 2 Н ) , Н 2 2 Н 2 + т α / ( 2 Н ) , Н 2 2 {\displaystyle G>{\frac {N-1}{\sqrt {N}}}{\sqrt {\frac {t_ {\alpha /(2N),N-2}^{2}}{N-2 +t_{\alpha /(2N),N-2}^{2}}}}}

где t α/(2 N ), N −2 обозначает верхнее критическое значение t-распределения с N  2 степенями свободы и уровнем значимости α/(2 N ).

Односторонний случай

Тест Граббса также можно определить как односторонний тест, заменив α/(2 N ) на α/ N . Чтобы проверить, является ли минимальное значение выбросом, тестовая статистика имеет вид

Г = И ¯ И мин с {\displaystyle G={\frac {{\bar {Y}}-Y_{\min }}{s}}}

где Y min обозначает минимальное значение. Чтобы проверить, является ли максимальное значение выбросом, тестовая статистика:

Г = И макс И ¯ с {\displaystyle G={\frac {Y_{\max }-{\bar {Y}}}{s}}}

где Y max обозначает максимальное значение.

Для обнаружения выбросов можно использовать несколько графических методов . Простой график последовательности запусков , диаграмма ящиков или гистограмма должны показывать любые явно выпадающие точки. Нормальный вероятностный график также может быть полезен.

Смотрите также

Ссылки

  1. ^ Граббс, Фрэнк Э. (1950). «Выборочные критерии для проверки выпадающих наблюдений». Annals of Mathematical Statistics . 21 (1): 27–58. doi : 10.1214/aoms/1177729885 . hdl : 2027.42/182780 .
  2. ^ Цитата из Справочника по инжинирингу и статистике , параграф 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
  3. ^ Adikaram, KKLB; Hussein, MA; Effenberger, M.; Becker, T. (2015-01-14). «Метод преобразования данных для улучшения мощности обнаружения выбросов теста Граббса для данных, которые, как ожидается, следуют линейной зависимости». Журнал прикладной математики . 2015 : 1–9. doi : 10.1155/2015/708948 .

Дальнейшее чтение

  • Граббс, Фрэнк (февраль 1969 г.). «Процедуры обнаружения выпадающих наблюдений в образцах». Технометрика . 11 (1). Технометрика, т. 11, № 1: 2–21. doi :10.2307/1266761. JSTOR  1266761.
  • Стефански, В. (1972). «Отклонение выбросов в факторных планах». Технометрика . 14 (2). Технометрика, т. 14, № 2: 469–479. doi :10.2307/1267436. JSTOR  1267436.

Общественное достояние В статье использованы материалы, являющиеся общественным достоянием Национального института стандартов и технологий.

Взято с "https://en.wikipedia.org/w/index.php?title=Grubbs%27s_test&oldid=1216594166"