Вероятность успеха (POS) — статистическая концепция, широко используемая в фармацевтической промышленности, в том числе органами здравоохранения, для обоснования принятия решений .
Вероятность успеха — это концепция, тесно связанная с условной мощностью и предсказательной мощностью . Условная мощность — это вероятность наблюдения статистической значимости при условии, что наблюдаемые данные предполагают, что параметр эффекта лечения равен определенному значению. Условную мощность часто критикуют за это предположение. Если мы знаем точное значение эффекта лечения, нет необходимости проводить эксперимент. Чтобы решить эту проблему, мы можем рассмотреть условную мощность в байесовской обстановке, считая параметр эффекта лечения случайной величиной . Взятие ожидаемого значения условной мощности относительно апостериорного распределения параметра дает предсказательную мощность. Предсказательную мощность также можно рассчитать в частотной обстановке. Независимо от того, как она рассчитывается, предсказательная мощность является случайной величиной, поскольку она представляет собой условную вероятность, обусловленную случайно наблюдаемыми данными. И условная мощность, и предсказательная мощность используют статистическую значимость в качестве критерия успеха. Однако статистической значимости часто недостаточно для определения успеха. Например, орган здравоохранения часто требует, чтобы величина эффекта лечения была больше, чем эффект, который является просто статистически значимым, чтобы поддержать успешную регистрацию. Чтобы решить эту проблему, мы можем расширить условную мощность и предсказательную мощность на концепцию вероятности успеха. Для вероятности успеха критерий успеха не ограничивается статистической значимостью. Это может быть что-то еще, например, клинически значимый результат.
Традиционное пилотное испытание обычно осуществляется путем контроля частоты ошибок типа I и мощности для обнаружения определенного значения параметра. Цель пилотного испытания, такого как испытание фазы II, обычно не заключается в поддержке регистрации. Поэтому не имеет смысла контролировать частоту ошибок типа I, особенно большую ошибку типа I, как это обычно делается в испытании фазы II. Пилотное испытание обычно предоставляет доказательства в поддержку решения «годен/не годен» для подтверждающего испытания. Поэтому имеет смысл разрабатывать испытание на основе PPOS. Для поддержки решения «нет/годен» традиционные методы требуют, чтобы PPOS был небольшим. Однако PPOS может быть небольшим только из-за случайности. Чтобы решить эту проблему, мы можем потребовать, чтобы доверительный интервал PPOS был узким, так что расчет PPOS подкреплялся достаточной информацией, и, следовательно, PPOS не был малым только из-за случайности. Поиск оптимального дизайна эквивалентен поиску решения следующих 2 уравнений. [1]
где PPOS1 и PPOS2 — некоторые определяемые пользователем пороговые значения. Первое уравнение гарантирует, что PPOS будет небольшим, так что не слишком много испытаний не будут допущены к следующему этапу, чтобы защититься от ложных отрицательных результатов . Первое уравнение также гарантирует, что PPOS не будет слишком маленьким, так что не слишком много испытаний не будут допущены к следующему этапу, чтобы защититься от ложных положительных результатов . Второе уравнение гарантирует, что доверительный интервал PPOS будет узким, так что расчет PPOS будет подкреплен достаточной информацией. Второе уравнение также гарантирует, что доверительный интервал PPOS не будет слишком узким, так что он не потребует слишком много ресурсов.
Традиционная промежуточная оценка бесполезности разрабатывается на основе бета-расходов. Однако бета-расходы не имеют интуитивной интерпретации. Поэтому ее трудно объяснить коллегам, не являющимся статистиками. Поскольку PPOS имеет интуитивную интерпретацию, имеет больше смысла разрабатывать промежуточную оценку бесполезности с использованием PPOS. Чтобы объявить бесполезность, мы требуем, чтобы PPOS был небольшим, а расчет PPOS поддерживался достаточной информацией. Согласно Тану, 2015 [2], поиск оптимальной конструкции эквивалентен решению следующих 2 уравнений.
Традиционная промежуточная эффективность разрабатывается на основе функций расходов. Поскольку функции расходов не имеют интуитивной интерпретации, ее трудно объяснить коллегам, не являющимся статистиками. Напротив, вероятность успеха имеет интуитивно понятную интерпретацию и, следовательно, может облегчить общение с коллегами, не являющимися статистиками. Тан (2016) [3] [4] предлагает использовать следующие критерии для поддержки принятия промежуточных решений по эффективности: mCPOS>c1 lCPOS>c2, где mCPOS — медиана CPOS относительно распределения параметра, а lCPOS — нижняя граница вероятного интервала CPOS. Первый критерий гарантирует, что вероятность успеха велика. Второй критерий гарантирует, что вероятный интервал CPOS узок; расчет CPOS подкреплен достаточным количеством информации; следовательно, вероятность успеха невелика случайно. Нахождение оптимальной конструкции эквивалентно нахождению решения следующих уравнений: