Тест Шапиро-Франчиа

Тест Шапиро–Франсиастатистический тест на нормальность популяции, основанный на выборочных данных. Он был введен SS Shapiro и RS Francia в 1972 году как упрощение теста Шапиро–Уилка . [1]

Теория

Пусть будет -th упорядоченным значением из нашей выборки размера-. Например, если выборка состоит из значений , , так как это второе наименьшее значение. Пусть будет средним значением статистики th порядка при создании независимых выборок из нормального распределения . Например, , что означает, что второе наименьшее значение в выборке из четырех выборок из нормального распределения обычно примерно на 0,297 стандартных отклонений ниже среднего. [2] Сформируйте коэффициент корреляции Пирсона между и : х ( я ) {\displaystyle x_{(i)}} я {\displaystyle я} н {\displaystyle n} { 5.6 , 1.2 , 7.8 , 3.4 } {\displaystyle \left\{5.6,-1.2,7.8,3.4\right\}} х ( 2 ) = 3.4 {\displaystyle x_{(2)}=3,4} м я : н {\displaystyle m_{i:n}} я {\displaystyle я} н {\displaystyle n} м 2 : 4 0,297 {\displaystyle m_{2:4}\approx -0,297} х {\displaystyle x} м {\displaystyle м}

Вт = ков ( х , м ) σ х σ м = я = 1 н ( х ( я ) х ¯ ) ( м я м ¯ ) ( я = 1 н ( х ( я ) х ¯ ) 2 ) ( я = 1 н ( м я м ¯ ) 2 ) {\displaystyle W'={\frac {\operatorname {cov} (x,m)}{\sigma _{x}\sigma _{m}}}={\frac {\sum _{i=1}^{n}(x_{(i)}-{\bar {x}})(m_{i}-{\bar {m}})}{\sqrt {\left(\sum _{i=1}^{n}(x_{(i)}-{\bar {x}})^{2}\right)\left(\sum _{i=1}^{n}(m_{i}-{\bar {m}})^{2}\right)}}}}

При нулевой гипотезе о том, что данные получены из нормального распределения , эта корреляция будет сильной, поэтому значения будут группироваться чуть ниже 1, при этом пик будет становиться уже и ближе к 1 по мере увеличения. Если данные сильно отклоняются от нормального распределения, будет меньше. [1] Вт {\displaystyle W'} н {\displaystyle n} Вт {\displaystyle W'}

Этот тест представляет собой формализацию старой практики построения графика Q–Q для сравнения двух распределений, при этом играют роль точек квантиля выборочного распределения, а играют роль соответствующих точек квантиля нормального распределения . х {\displaystyle x} м {\displaystyle м}

По сравнению со статистикой теста Шапиро–Уилка , статистику теста Шапиро–Франчиа вычислить проще, поскольку для этого не требуется формировать и инвертировать матрицу ковариаций между порядковыми статистиками. Вт {\displaystyle W} Вт {\displaystyle W'}

Упражняться

Не существует известного аналитического выражения в замкнутой форме для значений, требуемых тестом. Однако существует несколько приближений, которые подходят для большинства практических целей. [2] м я : н {\displaystyle m_{i:n}}

Точная форма нулевого распределения известна только для . [1] Моделирование Монте-Карло показало, что преобразованная статистика распределена почти нормально, со значениями среднего и стандартного отклонения, которые медленно изменяются в легко параметризуемой форме. [3] Вт {\displaystyle W'} н = 3 {\displaystyle n=3} вн ( 1 Вт ) {\displaystyle \ln(1-W')} н {\displaystyle n}

Власть

Сравнительные исследования пришли к выводу, что тесты корреляции порядковой статистики, такие как Шапиро–Франчиа и Шапиро–Уилка, являются одними из самых мощных из установленных статистических тестов на нормальность . [4] Можно было бы предположить, что ковариационно-скорректированное взвешивание различных порядковых статистик, используемых в тесте Шапиро–Уилка, должно сделать его немного лучше, но на практике варианты Шапиро–Уилка и Шапиро–Франчиа примерно одинаково хороши. Фактически, вариант Шапиро–Франчиа на самом деле демонстрирует большую мощность для различения некоторых альтернативных гипотез. [5]

Ссылки

  1. ^ abc Шапиро, СС; Франсиа, Р.С. (1972-03-01). «Приблизительный анализ дисперсионного теста на нормальность». Журнал Американской статистической ассоциации . 67 (337). Американская статистическая ассоциация : 215– 216. doi : 10.2307/2284728. ISSN  1537-274X. JSTOR  2284728. OCLC  1480864.
  2. ^ ab Арнольд, Барри К.; Балакришнан, Нараянасвами; Нагараджа, Хайкади Н. (2008) [1992]. Первый курс по порядковой статистике . Классика прикладной математики. Том 54. Филадельфия, Пенсильвания: Общество промышленной и прикладной математики . ISBN 978-0-89871-648-1. LCCN  2008061100.
  3. ^ Ройстон, Патрик (1993). «Набор инструментов для проверки ненормальности в полных и цензурированных выборках». Статистик . 42 (1). Королевское статистическое общество : 37– 43. doi : 10.2307/2348109. JSTOR  2348109.
  4. ^ Разали, Норнадия Мохд; Вау, Яп Би (2011). «Сравнение мощности тестов Шапиро-Уилка, Колмогорова-Смирнова, Лиллифорса и Андерсона-Дарлинга». Журнал статистического моделирования и аналитики . 2 (1). Куала-Лумпур: Институт статистики Малайзии: 21–33 . ISBN. 978-967-363-157-5.
  5. ^ Ахмад, Фиаз; Хан, Рехан Ахмад (2015). «Сравнение мощности различных тестов на нормальность». Pakistan Journal of Statistics and Operation Research . 11 (3). Лахор, Пакистан: Колледж статистических и актуарных наук , Университет Пенджаба : 331– 345. doi : 10.18187/pjsor.v11i3.845 . ISSN  2220-5810.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Shapiro–Francia_test&oldid=1204918428"