Метод CLs (физика элементарных частиц)

В физике элементарных частиц CL [ 1] представляет собой статистический метод для установки верхних пределов (также называемых пределами исключения [2] ) для параметров модели , конкретную форму интервальной оценки, используемую для параметров, которые могут принимать только неотрицательные значения. Хотя говорят, что CL относятся к уровням доверия , «название метода ... вводит в заблуждение, поскольку область исключения CL не является доверительным интервалом ». [3] Он был впервые введен физиками, работающими над экспериментом LEP в ЦЕРНе , и с тех пор использовался во многих экспериментах по физике высоких энергий . Это частотный метод в том смысле, что свойства предела определяются с помощью вероятностей ошибок , однако он отличается от стандартных доверительных интервалов тем, что заявленный уровень доверия интервала не равен его вероятности покрытия . Причина этого отклонения заключается в том, что стандартные верхние пределы, основанные на самом мощном тесте, обязательно производят пустые интервалы с некоторой фиксированной вероятностью, когда значение параметра равно нулю, и это свойство считается нежелательным большинством физиков и статистиков. [4]

Верхние пределы, полученные с помощью метода CLs, всегда содержат нулевое значение параметра, и, следовательно, вероятность покрытия в этой точке всегда равна 100%. Определение CLs не следует из какой-либо точной теоретической структуры статистического вывода и поэтому иногда описывается как ad hoc . Однако оно имеет близкое сходство с концепциями статистических доказательств [5], предложенными статистиком Алланом Бирнбаумом .

Определение

Пусть Xслучайная выборка из распределения вероятностей с действительным неотрицательным параметром . Верхний предел CL для параметра θ с уровнем достоверности — это статистика (т.е. наблюдаемая случайная величина ), которая обладает свойством: θ [ 0 , ) {\displaystyle \theta \in [0,\infty )} 1 α {\displaystyle 1-\альфа '} θ ты п ( Х ) {\displaystyle \theta _{up}(X)}

Неравенство используется в определении для учета случаев, когда распределение X дискретно и равенство не может быть достигнуто точно. Если распределение X непрерывно , то это должно быть заменено равенством. Обратите внимание, что определение подразумевает, что вероятность покрытия всегда больше . П ( θ ты п ( Х ) θ | θ ) {\displaystyle \mathbb {P} (\theta _{up}(X)\geq \theta |\theta )} 1 α {\displaystyle 1-\альфа '}

Эквивалентное определение можно сделать, рассмотрев проверку гипотезы нулевой гипотезы против альтернативы . Тогда числитель в ( 1 ), при оценке в , соответствует вероятности ошибки типа I ( ) теста (т.е. отклоняется, когда ), а знаменатель — степени ( ) . Таким образом, критерий отклонения требует, чтобы отношение было меньше . Это можно интуитивно интерпретировать как то, что исключается, поскольку менее вероятно наблюдать такой экстремальный результат, как X , когда верно, чем когда верна альтернатива . ЧАС 0 : θ = θ 0 {\displaystyle H_{0}:\theta =\theta _{0}} ЧАС 1 : θ = 0 {\displaystyle H_{1}:\theta =0} θ 0 {\displaystyle \тета _{0}} α {\displaystyle \альфа} θ 0 {\displaystyle \тета _{0}} θ ты п ( Х ) < θ 0 {\displaystyle \theta _{up}(X)<\theta _{0}} 1 β {\displaystyle 1-\бета} ЧАС 0 {\displaystyle H_{0}} α / ( 1 β ) {\displaystyle \альфа /(1-\бета)} α {\displaystyle \альфа '} θ 0 {\displaystyle \тета _{0}} α {\displaystyle \альфа '} θ 0 {\displaystyle \тета _{0}} θ = 0 {\displaystyle \тета =0}

Расчет верхнего предела обычно выполняется путем построения тестовой статистики и нахождения значения, для которого д θ ( Х ) {\displaystyle q_{\theta }(X)} θ {\displaystyle \тета}

П ( д θ ( Х ) д θ | θ ) П ( д θ ( Х ) д θ | 0 ) = α . {\displaystyle {\frac {\mathbb {P} (q_{\theta }(X)\geq q_{\theta }^{*}|\theta )}{\mathbb {P} (q_{\theta }(X)\geq q_{\theta }^{*}|0)}}=\alpha '.}

где - наблюдаемый результат эксперимента. д θ {\displaystyle q_{\theta}^{*}}

Использование в физике высоких энергий

Верхние пределы, основанные на методе CLs, использовались в многочисленных публикациях экспериментальных результатов, полученных в экспериментах на ускорителях частиц, таких как LEP , Tevatron и LHC , наиболее заметных в поисках новых частиц.

Источник

Первоначальная мотивация для CL была основана на условном вероятностном расчете, предложенном физиком Г. Цехом [6] для эксперимента по подсчету событий. Предположим, что эксперимент состоит из измерения событий, происходящих от сигнальных и фоновых процессов, оба из которых описываются распределениями Пуассона с соответствующими скоростями и , а именно . предполагается известным и является параметром, который должен быть оценен экспериментом. Стандартная процедура установления верхнего предела для данного экспериментального результата состоит в исключении значений для которых , что гарантирует по крайней мере покрытие. Рассмотрим, например, случай, когда наблюдаются и события, тогда обнаруживается, что исключается с 95%-ным уровнем достоверности. Но это подразумевает, что исключается, а именно все возможные значения . Такой результат трудно интерпретировать, поскольку эксперимент не может по существу отличить очень малые значения от гипотезы только о фоне, и, таким образом, заявление о том, что такие малые значения исключены (в пользу гипотезы только о фоне), кажется неуместным. Чтобы преодолеть эту трудность, Цех предложил обусловить вероятность того, что на наблюдении , что , где — (неизмеримое) количество фоновых событий. Обоснование этого заключается в том, что когда мало, процедура с большей вероятностью даст ошибку (т. е. интервал, который не охватывает истинное значение), чем когда велико, и распределение само по себе не зависит от . То есть, следует сообщать не общую вероятность ошибки, а условную вероятность, учитывая имеющиеся знания о количестве фоновых событий в выборке. Эта условная вероятность равна н {\displaystyle n} с {\displaystyle с} б {\displaystyle б} н Пуасс ( с + б ) {\displaystyle n\sim {\text{Пуасс}}(s+b)} б {\displaystyle б} с {\displaystyle с} с {\displaystyle с} н {\displaystyle n^{*}} с {\displaystyle с} П ( н н | с + б ) α {\displaystyle \mathbb {P} (n\leq n^{*}|s+b)\leq \alpha } 1 α {\displaystyle 1-\альфа} б = 3 {\displaystyle b=3} н = 0 {\displaystyle n^{*}=0} с + б 3 {\displaystyle s+b\geq 3} с 0 {\displaystyle s\geq 0} с {\displaystyle с} с {\displaystyle с} н н {\displaystyle n\leq n^{*}} н б н {\displaystyle n_{b}\leq n^{*}} н б {\displaystyle n_{b}} н б {\displaystyle n_{b}} н б {\displaystyle n_{b}} н б {\displaystyle n_{b}} с {\displaystyle с}

П ( н н | н б н , с + б ) = П ( н н , н б н | с + б ) П ( н б н | с + б ) = П ( н н | с + б ) П ( н н | б ) . {\displaystyle \mathbb {P} (n\leq n^{*}|n_{b}\leq n^{*},s+b) = {\frac {\mathbb {P} (n\leq n^ {*},n_{b}\leq n^{*}|s+b)}{\mathbb {P} (n_{b}\leq n^{*}|s+b)}}={\frac {\mathbb {P} (n\leq n^{*}|s+b)}{\mathbb {P} (n\leq n^{*}|b)}}.}

которые соответствуют приведенному выше определению CL. Первое равенство просто использует определение условной вероятности , а второе равенство исходит из того факта, что если и количество фоновых событий по определению не зависит от силы сигнала. н н н б н {\displaystyle n\leq n^{*}\Rightarrow n_{b}\leq n^{*}}

Обобщение условного аргумента

Условный аргумент Зеха можно формально распространить на общий случай. Предположим, что это тестовая статистика , из которой выводится доверительный интервал, и пусть д ( Х ) {\displaystyle q(X)}

п θ = П ( д ( Х ) > д | θ ) {\displaystyle p_{\theta }=\mathbb {P} (q(X)>q^{*}|\theta )}

где — результат, наблюдаемый в ходе эксперимента. Тогда можно рассматривать как неизмеримую (поскольку неизвестна) случайную величину, распределение которой равномерно между 0 и 1 независимо от . Если тест непредвзят, то результат подразумевает д {\displaystyle д*} п θ {\displaystyle p_{\theta }} θ {\displaystyle \тета} θ {\displaystyle \тета} д {\displaystyle д*}

п θ П ( д ( Х ) > д | 0 ) п 0 {\displaystyle p_{\theta}\leq \mathbb {P} (q(X)>q^{*}|0)\equiv p_{0}^{*}}

откуда, аналогично обусловливанию в предыдущем случае, получаем н б {\displaystyle n_{b}}

П ( д ( Х ) д | п θ п 0 , θ ) = П ( д ( Х ) д | θ ) П ( п θ п 0 | θ ) = П ( д ( Х ) д | θ ) п 0 = П ( д ( Х ) д | θ ) П ( д ( Х ) > д | 0 ) . {\displaystyle \mathbb {P} (q(X)\geq q^{*}|p_{\theta }\leq p_{0}^{*},\theta )={\frac {\mathbb {P} (q(X)\geq q^{*}|\theta )}{\mathbb {P} (p_{\theta }\leq p_{0}^{*}|\theta )}}={\frac {\mathbb {P} (q(X)\geq q^{*}|\theta )}{p_{0}^{*}}}={\frac {\mathbb {P} (q(X)\geq q^{*}|\theta )}{\mathbb {P} (q(X)>q^{*}|0)}}.}

Отношение к основополагающим принципам

Приведенные выше аргументы можно рассматривать как следующие духу принципа обусловленности статистического вывода, хотя они выражают более обобщенное понятие обусловленности, которое не требует существования вспомогательной статистики . Однако принцип обусловленности уже в своей первоначальной более ограниченной версии формально подразумевает принцип правдоподобия , результат, который был хорошо продемонстрирован Бирнбаумом . [7] CLs не подчиняется принципу правдоподобия , и, таким образом, такие соображения могут использоваться только для предположения о правдоподобии, но не о теоретической полноте с основополагающей точки зрения. (То же самое, однако, можно сказать о любом частотном методе, если принцип обусловленности считается необходимым).

Сам Бирнбаум в своей статье 1962 года предположил, что отношение CLs следует использовать в качестве меры силы статистических доказательств, предоставляемых тестами значимости, а не только в качестве такового. Это вытекало из простого применения принципа правдоподобия : если результат эксперимента должен быть сообщен только в форме решения «принять»/«отклонить», то общая процедура эквивалентна эксперименту, который имеет только два возможных результата с вероятностями , и , при . Отношение правдоподобия , связанное с результатом «отклонить », поэтому равно и, следовательно, должно определять доказательную интерпретацию этого результата. (Поскольку для проверки двух простых гипотез отношение правдоподобия является компактным представлением функции правдоподобия ). С другой стороны, если принцип правдоподобия должен соблюдаться последовательно, то следует использовать отношение правдоподобия исходного результата, а не , что делает основу такой интерпретации сомнительной. Бирнбаум позже описал это как имеющее «в лучшем случае эвристическое, но не существенное значение для доказательной интерпретации». α / ( 1 β ) {\displaystyle \alpha /(1-\beta )} α {\displaystyle \alpha } α {\displaystyle \alpha } ( 1 β ) {\displaystyle (1-\beta )} 1 α {\displaystyle 1-\alpha } ( β ) {\displaystyle (\beta )} H 1 , ( H 2 ) {\displaystyle H_{1},(H_{2})} H 1 {\displaystyle H_{1}} α / ( 1 β ) {\displaystyle \alpha /(1-\beta )} α / ( 1 β ) {\displaystyle \alpha /(1-\beta )}

Более прямой подход, приводящий к аналогичному выводу, можно найти в формулировке Бирнбаума принципа уверенности , который, в отличие от более распространенной версии, относится к вероятности ошибок обоих видов. Это формулируется следующим образом: [8]

«Концепция статистических доказательств не является правдоподобной, если она не находит «веских доказательств за или против » с малой вероятностью, когда это верно, и с гораздо большей вероятностью, когда это верно». H 2 {\displaystyle H_{2}} H 1 {\displaystyle H_{1}} ( α ) {\displaystyle (\alpha )} H 1 {\displaystyle H_{1}}   ( 1 β )   {\displaystyle \ (1-\beta )\ } H 2 {\displaystyle H_{2}}

Такое определение уверенности может естественным образом удовлетворяться определением CL. Остается верным, что как эта, так и более распространенная (связанная с теорией Неймана - Пирсона ) версия принципа уверенности несовместимы с принципом правдоподобия, и поэтому никакой частотный метод не может считаться действительно полным решением проблем, возникающих при рассмотрении условных свойств доверительных интервалов.

Расчет в пределе большой выборки

Если выполняются определенные условия регулярности, то общая функция правдоподобия станет гауссовой функцией в пределе большой выборки. В таком случае верхний предел CL на уровне достоверности (выведенный из равномерно наиболее мощного теста ) задается как [9] 1 α {\displaystyle 1-\alpha '}

θ u p = θ ^ + σ Φ 1 ( 1 α Φ ( θ ^ / σ ) ) , {\displaystyle \theta _{up}={\hat {\theta }}+\sigma \Phi ^{-1}(1-\alpha '\Phi ({\hat {\theta }}/\sigma )),}

где — стандартное нормальное кумулятивное распределение , — оценка максимального правдоподобия , а — его стандартное отклонение ; последнее можно оценить из обратной матрицы информации Фишера или с помощью набора данных «Азимов» [9] . Этот результат оказывается эквивалентным байесовскому доверительному интервалу, если используется равномерная априорная вероятность для . Φ {\displaystyle \Phi } θ ^ {\displaystyle {\hat {\theta }}} θ {\displaystyle \theta } σ {\displaystyle \sigma } θ {\displaystyle \theta }

Ссылки

  1. ^ Read, AL (2002). «Представление результатов поиска: метод CL(s)». Journal of Physics G: Nuclear and Particle Physics . 28 (10): 2693–2704 . Bibcode : 2002JPhG...28.2693R. doi : 10.1088/0954-3899/28/10/313.
  2. Физика частиц к 300-летию Михаила Ломоносова , стр. 13, в Google Books
  3. ^ Амнон Харел. "Статистические методы в поиске CMS" (PDF) . indico.cern.ch . Получено 10.04.2015 .
  4. ^ Марк Манделькерн (2002). «Установка доверительных интервалов для ограниченных параметров». Статистическая наука . 17 (2): 149– 159. doi : 10.1214/ss/1030550859 . JSTOR  3182816.
  5. ^ Рональд Н. Гир (1977). «Концепция статистических доказательств Аллана Бирнбаума». Synthese . 36 (1): 5– 13. doi :10.1007/bf00485688. S2CID  46973213.
  6. ^ G. Zech (1989). «Верхние пределы в экспериментах с фоновыми или измерительными ошибками» (PDF) . Nucl. Instrum. Methods Phys. Res. A. 277 ( 2–3 ) : 608–610 . Bibcode : 1989NIMPA.277..608Z. doi : 10.1016/0168-9002(89)90795-X.
  7. ^ Бирнбаум, Аллан (1962). «Об основах статистического вывода». Журнал Американской статистической ассоциации . 57 (298): 269– 326. doi :10.2307/2281640. JSTOR  2281640. MR  0138176. (С обсуждением.)
  8. ^ Бирнбаум, Аллан (1977). «Теория Неймана-Пирсона как теория принятия решений и как теория вывода; с критикой аргумента Линдли-Сэвиджа в пользу байесовской теории». Synthese . 36 (1): 19– 49. doi :10.1007/bf00485690. S2CID  35027844.
  9. ^ ab G. Cowan; K. Cranmer; E. Gross; O. Vitells (2011). "Асимптотические формулы для тестов новой физики на основе правдоподобия". Eur. Phys. J. C. 71 ( 2): 1554. arXiv : 1007.1727 . Bibcode :2011EPJC...71.1554C. doi :10.1140/epjc/s10052-011-1554-0.

Дальнейшее чтение

  • Леон Джей Глезер (2002). "[Установка доверительных интервалов для ограниченных параметров]: Комментарий". Статистическая наука . 17 (2): 161– 163. doi : 10.1214/ss/1030550859 . JSTOR  3182818.
  • Фрейзер, DAS; Рейд Н.; Вонг, ACM (2004). "Вывод для ограниченных параметров". Phys. Rev. D . 69 (3): 033002. arXiv : physics/0303111 . doi :10.1103/PhysRevD.69.033002. S2CID  18947032.
  • Роберт Д. Казинс (2011). «Отрицательно смещенные релевантные подмножества, вызванные наиболее мощными односторонними верхними доверительными пределами для ограниченного физического параметра». arXiv : 1109.2023 [physics.data-an].
  • Обзор статистических методов Particle Data Group (PDG)
Retrieved from "https://en.wikipedia.org/w/index.php?title=CLs_method_(particle_physics)&oldid=1161299003"