Обобщенное p-значение

Концепция статистики

В статистике обобщенное p -значение представляет собой расширенную версию классического p -значения , которое , за исключением ограниченного числа приложений, дает только приближенные решения.

Традиционные статистические методы не дают точных решений многих статистических проблем, таких как те, которые возникают в смешанных моделях и MANOVA , особенно когда проблема включает в себя ряд мешающих параметров . В результате практики часто прибегают к приближенным статистическим методам или асимптотическим статистическим методам , которые действительны только при большом размере выборки. При малых выборках такие методы часто имеют низкую производительность. [1] Использование приближенных и асимптотических методов может привести к вводящим в заблуждение выводам или может не обнаружить действительно значимых результатов экспериментов .

Тесты, основанные на обобщенных p -значениях, являются точными статистическими методами, поскольку они основаны на точных вероятностных утверждениях. В то время как обычные статистические методы не дают точных решений таких проблем, как тестирование компонентов дисперсии или ANOVA при неравных дисперсиях, точные тесты для таких проблем могут быть получены на основе обобщенных p -значений. [1] [2]

Чтобы преодолеть недостатки классических p -значений, Цуй и Вираханди [2] расширили классическое определение так, чтобы можно было получить точные решения для таких проблем, как проблема Беренса–Фишера и тестирование компонентов дисперсии. Это достигается путем разрешения тестовым переменным зависеть от наблюдаемых случайных векторов, а также от их наблюдаемых значений, как в байесовском подходе к проблеме, но без необходимости рассматривать постоянные параметры как случайные величины.

Пример

Чтобы описать идею обобщенных p -значений на простом примере, рассмотрим ситуацию выборки из нормальной популяции со средним значением и дисперсией . Пусть и будут средним значением выборки и дисперсией выборки. Выводы обо всех неизвестных параметрах могут быть основаны на результатах распределения μ {\displaystyle \мю} σ 2 {\displaystyle \сигма ^{2}} Х ¯ {\displaystyle {\overline {X}}} С 2 {\displaystyle S^{2}}

З = н ( Х ¯ μ ) / σ Н ( 0 , 1 ) {\displaystyle Z={\sqrt {n}}({\overline {X}}-\mu )/\sigma \sim N(0,1)}

и

У = н С 2 / σ 2 χ н 1 2 . {\displaystyle U=nS^{2}/\sigma ^{2}\sim \chi _{n-1}^{2}.}

Теперь предположим, что нам нужно проверить коэффициент вариации, . Хотя эта задача нетривиальна с обычными p -значениями, ее можно легко выполнить на основе обобщенной тестовой переменной ρ = μ / σ {\displaystyle \rho =\mu /\sigma }

Р = х ¯ С с σ Х ¯ μ σ = х ¯ с У н     З н , {\displaystyle R={\frac {{\overline {x}}S}{s\sigma }}-{\frac {{\overline {X}}-\mu }{\sigma }}={\frac {\overline {x}}{s}}{\frac {\sqrt {U}}{\sqrt {n}}}~-~{\frac {Z}{\sqrt {n}}},}

где — наблюдаемое значение , а — наблюдаемое значение . Обратите внимание, что распределение и его наблюдаемое значение не содержат мешающих параметров. Поэтому проверка гипотезы с односторонней альтернативой, такой как , может быть основана на обобщенном p -значении , количестве, которое можно легко оценить с помощью моделирования Монте-Карло или с использованием нецентрального t-распределения. х ¯ {\displaystyle {\overline {x}}} Х ¯ {\displaystyle {\overline {X}}} с {\displaystyle с} С {\displaystyle S} Р {\displaystyle R} ЧАС А : ρ < ρ 0 {\displaystyle H_{A}:\rho <\rho _{0}} п = П г ( Р ρ 0 ) {\displaystyle p=Pr(R\geq \rho _{0})}

Примечания

  1. ^ ab Weerahandi (1995)
  2. ^ ab Tsui & Weerahandi (1989)

Ссылки

  • Gamage J, Mathew T и Weerahandi S. (2013). Обобщенные интервалы прогнозирования для BLUP в смешанных моделях, Журнал многомерного анализа}, 220, 226-233.
  • Хамада, М. и Вираханди, С. (2000). Оценка системы измерения с помощью обобщенного вывода. Журнал технологий качества, 32, 241-253.
  • Кришнамурти, К. и Тиан, Л. (2007), «Выводы об отношении средних значений двух обратных гауссовых распределений: подход обобщенной переменной», Журнал статистического планирования и выводов, том 138, выпуск 7, 1, страницы 2082-2089.
  • Ли, С., Ван Дж., Лян Х. (2011). Сравнение нескольких средних: подход, основанный на фидуциальных данных. Вычислительная статистика и анализ данных, 55, 1993-2002.
  • Мэтью, Т. и Уэбб, Д. В. (2005). Обобщенные p-значения и доверительные интервалы для компонентов дисперсии: приложения к армейским испытаниям и оценке, Технометрика, 47, 312-322.
  • Ву, Дж. и Хамада, М.С. (2009) Эксперименты: планирование, анализ и оптимизация. Wiley, Хобокен, Нью-Джерси.
  • Чжоу, Л. и Мэтью, Т. (1994). Некоторые тесты для компонентов дисперсии с использованием обобщенных p-значений, Технометрика, 36, 394-421.
  • Тянь, Л. и У, Цзяньжун (2006) «Выводы об общем среднем значении нескольких логнормальных популяций: обобщенный подход к переменным», Биометрический журнал.
  • Цуй, К. и Вираханди, С. (1989): «Обобщенные p-значения при проверке значимости гипотез в присутствии мешающих параметров». Журнал Американской статистической ассоциации , 84, 602–607
  • Вираханди, С. (1995) Точные статистические методы анализа данных Springer-Verlag, Нью-Йорк. ISBN  978-0-387-40621-3
  • XPro, Бесплатный программный пакет для точной параметрической статистики
Получено с "https://en.wikipedia.org/w/index.php?title=Обобщенное_значение_p&oldid=1228040409"