Тест Шапиро–Франсиа — статистический тест на нормальность популяции, основанный на выборочных данных. Он был введен SS Shapiro и RS Francia в 1972 году как упрощение теста Шапиро–Уилка . [1]
Пусть будет -th упорядоченным значением из нашей выборки размера-. Например, если выборка состоит из значений , , так как это второе наименьшее значение. Пусть будет средним значением статистики th порядка при создании независимых выборок из нормального распределения . Например, , что означает, что второе наименьшее значение в выборке из четырех выборок из нормального распределения обычно примерно на 0,297 стандартных отклонений ниже среднего. [2] Сформируйте коэффициент корреляции Пирсона между и :
При нулевой гипотезе о том, что данные получены из нормального распределения , эта корреляция будет сильной, поэтому значения будут группироваться чуть ниже 1, при этом пик будет становиться уже и ближе к 1 по мере увеличения. Если данные сильно отклоняются от нормального распределения, будет меньше. [1]
Этот тест представляет собой формализацию старой практики построения графика Q–Q для сравнения двух распределений, при этом играют роль точек квантиля выборочного распределения, а играют роль соответствующих точек квантиля нормального распределения .
По сравнению со статистикой теста Шапиро–Уилка , статистику теста Шапиро–Франчиа вычислить проще, поскольку для этого не требуется формировать и инвертировать матрицу ковариаций между порядковыми статистиками.
Не существует известного аналитического выражения в замкнутой форме для значений, требуемых тестом. Однако существует несколько приближений, которые подходят для большинства практических целей. [2]
Точная форма нулевого распределения известна только для . [1] Моделирование Монте-Карло показало, что преобразованная статистика распределена почти нормально, со значениями среднего и стандартного отклонения, которые медленно изменяются в легко параметризуемой форме. [3]
Сравнительные исследования пришли к выводу, что тесты корреляции порядковой статистики, такие как Шапиро–Франчиа и Шапиро–Уилка, являются одними из самых мощных из установленных статистических тестов на нормальность . [4] Можно было бы предположить, что ковариационно-скорректированное взвешивание различных порядковых статистик, используемых в тесте Шапиро–Уилка, должно сделать его немного лучше, но на практике варианты Шапиро–Уилка и Шапиро–Франчиа примерно одинаково хороши. Фактически, вариант Шапиро–Франчиа на самом деле демонстрирует большую мощность для различения некоторых альтернативных гипотез. [5]