В статистике тест Граббса или тест Граббса (названный в честь Фрэнка Э. Граббса , который опубликовал тест в 1950 году [1] ), также известный как тест максимального нормализованного остатка или тест экстремального стьюдентизированного отклонения , представляет собой тест, используемый для обнаружения выбросов в одномерном наборе данных, предположительно полученном из нормально распределенной совокупности.
Тест Граббса основан на предположении нормальности . То есть, прежде чем применять тест Граббса, следует убедиться, что данные можно разумно аппроксимировать нормальным распределением. [2]
Тест Граббса обнаруживает по одному выбросу за раз. Этот выброс удаляется из набора данных, и тест повторяется до тех пор, пока не будет обнаружено ни одного выброса. Однако многократные итерации изменяют вероятность обнаружения, и тест не следует использовать для выборок размером шесть или меньше, поскольку он часто помечает большинство точек как выбросы. [3]
Тест Граббса определен для следующих гипотез :
Статистика теста Граббса определяется как
где и обозначают выборочное среднее и стандартное отклонение соответственно. Статистика теста Граббса — это наибольшее абсолютное отклонение от выборочного среднего в единицах выборочного стандартного отклонения.
Это двусторонний тест , в котором гипотеза об отсутствии выбросов отвергается на уровне значимости α, если
где t α/(2 N ), N −2 обозначает верхнее критическое значение t-распределения с N − 2 степенями свободы и уровнем значимости α/(2 N ).
Тест Граббса также можно определить как односторонний тест, заменив α/(2 N ) на α/ N . Чтобы проверить, является ли минимальное значение выбросом, тестовая статистика имеет вид
где Y min обозначает минимальное значение. Чтобы проверить, является ли максимальное значение выбросом, тестовая статистика:
где Y max обозначает максимальное значение.
Для обнаружения выбросов можно использовать несколько графических методов . Простой график последовательности запусков , диаграмма ящиков или гистограмма должны показывать любые явно выпадающие точки. Нормальный вероятностный график также может быть полезен.
В статье использованы материалы, являющиеся общественным достоянием Национального института стандартов и технологий.