Конструкция вверх-вниз

Статистические эксперименты

Up-and-down designs (UDD) — это семейство статистических экспериментальных дизайнов, используемых в экспериментах по поиску дозы в науке, технике и медицинских исследованиях. Эксперименты по поиску дозы имеют бинарные ответы : каждый отдельный результат может быть описан как одно из двух возможных значений, например, успех против неудачи или токсичность против нетоксичности. Математически бинарные ответы кодируются как 1 и 0. Целью экспериментов по поиску дозы является оценка силы лечения (т. е. «дозы»), которая вызовет реакцию «1» в заранее определенной пропорции времени. Эту дозу можно представить как процентиль распределения порогов реакции. Примером использования поиска дозы является эксперимент по оценке LD 50 некоторого токсичного химического вещества по отношению к мышам.

Имитационные эксперименты с тремя различными UDD. Ответы 0 и 1 отмечены буквами o и x соответственно. Сверху вниз: исходный «простой» UDD, нацеленный на медиану, UDD смещенной монеты Дарема-Флурноя, нацеленный примерно на 20,6% процентиль, и k-в-ряд / «преобразованный» UDD, нацеленный на тот же процентиль.

Планы поиска дозы являются последовательными и адаптивными к ответу: доза в заданной точке эксперимента зависит от предыдущих результатов, а не фиксируется априори . Планы поиска дозы, как правило, более эффективны для этой задачи, чем фиксированные планы, но их свойства сложнее анализировать, и некоторые требуют специализированного программного обеспечения для проектирования. UDD используют дискретный набор доз, а не изменяют дозу непрерывно. Они относительно просты в реализации и также являются одними из наиболее изученных планов поиска дозы. Несмотря на эту простоту, UDD генерируют случайные блуждания со сложными свойствами. [1] Первоначальный UDD был направлен на поиск медианного порога путем увеличения дозы на один уровень после ответа «0» и уменьшения ее на один уровень после ответа «1». Отсюда и название «вверх-вниз». Другие UDD нарушают эту симметрию, чтобы оценить процентили, отличные от медианы, или способны лечить группы субъектов, а не одного за раз.

UDD были разработаны в 1940-х годах несколькими исследовательскими группами независимо друг от друга. [2] [3] [4] В 1950-х и 1960-х годах наблюдалась быстрая диверсификация с UDD, нацеленными на процентили, отличные от медианы, и расширением в многочисленные прикладные области. В 1970-х и начале 1990-х годов было мало исследований методов UDD, даже несмотря на то, что дизайн продолжал широко использоваться. Возрождение исследований UDD с 1990-х годов обеспечило более глубокое понимание UDD и их свойств, [5] а также новые и лучшие методы оценки. [6] [7]

UDD по-прежнему широко используются в двух областях, для которых они изначально были разработаны: психофизика , где они используются для оценки сенсорных порогов и часто известны как процедуры лестницы с фиксированным принудительным выбором , [8] и тестирование взрывной чувствительности, где UDD с нацеливанием на медиану часто известен как тест Брюсетона . UDD также очень популярны в исследованиях токсичности и анестезиологии. [9] Они также считаются приемлемым выбором для клинических испытаний фазы I. [10]

Математическое описание

Определение

Пусть будет размером выборки эксперимента UDD, и предположим на данный момент, что субъекты обрабатываются по одному за раз. Тогда дозы, которые получают эти субъекты, обозначенные как случайные величины , выбираются из дискретного, конечного набора увеличивающихся уровней доз Кроме того, если , то в соответствии с простыми постоянными правилами, основанными на недавних ответах. Следующий субъект должен быть обработан на один уровень выше, на один уровень ниже или на том же уровне, что и текущий субъект. Сами ответы обозначаются далее как ответы «1» положительные, а «0» отрицательные. Повторное применение тех же правил (известных как правила перехода дозы ) по конечному набору уровней доз превращается в случайное блуждание по . Различные правила перехода дозы создают различные «ароматы» UDD, такие как три, показанные на рисунке выше. н {\displaystyle n} Х 1 , , Х н {\displaystyle X_{1},\ldots ,X_{n}} М {\displaystyle М} Х = { г 1 , , г М :   г 1 < < г М } . {\displaystyle {\mathcal {X}}=\left\{d_{1},\ldots ,d_{M}:\ d_{1}<\cdots <d_{M}\right\}.} Х я = г м {\displaystyle X_{i}=d_{m}} Х я + 1 { г м 1 , г м , г м + 1 } , {\displaystyle X_{i+1}\in \{d_{m-1},d_{m},d_{m+1}\},} И 1 , , И н { 0 , 1 } ; {\displaystyle Y_{1},\ldots ,Y_{n}\in \left\{0,1\right\};} Х 1 , , Х н {\displaystyle X_{1},\ldots ,X_{n}} Х {\displaystyle {\mathcal {X}}}

Несмотря на то, что эксперимент использует только дискретный набор уровней доз, сама переменная величины дозы, , предполагается непрерывной, и вероятность положительного ответа, как предполагается, непрерывно увеличивается с увеличением . Целью экспериментов по поиску дозы является оценка дозы (в непрерывной шкале), которая вызовет положительные ответы с заранее заданной целевой скоростью ; часто называемой «целевой дозой». Эту проблему можно также выразить как оценку квантиля кумулятивной функции распределения, описывающей кривую зависимости дозы от токсичности . Функция плотности , связанная с , может быть интерпретирована как распределение порогов ответа изучаемой популяции. х {\displaystyle x} х {\displaystyle x} х {\displaystyle x} Г = П { И = 1 Х = х } ,     Г ( 0 , 1 ) {\displaystyle \Гамма =P\left\{Y=1\mid X=x\right\},\ \ \Гамма \in (0,1)} Ф 1 ( Г ) {\displaystyle F^{-1}(\Gamma)} Ф ( х ) {\displaystyle F(x)} ф ( х ) {\displaystyle f(x)} Ф ( х ) {\displaystyle F(x)}

Матрица вероятностей перехода

Учитывая, что субъект получает дозу , обозначим вероятность того, что следующий субъект получит дозу , или , как или , соответственно. Эти вероятности перехода подчиняются ограничениям и граничным условиям . г м {\displaystyle d_{м}} г м 1 , г м {\displaystyle d_{м-1},d_{м}} г м + 1 {\displaystyle d_{m+1}} п м , м 1 , п м м {\displaystyle p_{м,м-1},p_{мм}} п м , м + 1 {\displaystyle p_{м,м+1}} п м , м 1 + п м м + п м , м + 1 = 1 {\displaystyle p_{м,м-1}+p_{мм}+p_{м,м+1}=1} п 1 , 0 = п М , М + 1 = 0 {\displaystyle p_{1,0}=p_{M,M+1}=0}

Каждый конкретный набор правил UDD позволяет символически вычислять эти вероятности, обычно как функцию . Предполагая, что вероятности перехода фиксированы во времени, в зависимости только от текущего распределения и его результата, т. е. от и через них (и, возможно, от набора фиксированных параметров). Вероятности тогда лучше всего представляются с помощью трехдиагональной матрицы вероятностей перехода (TPM) : Ф ( х ) {\displaystyle F(x)} ( Х я , И я ) {\displaystyle \left(X_{i},Y_{i}\right)} Ф ( х ) {\displaystyle F(x)} П {\displaystyle \mathbf {P} }

П = ( п 11 п 12 0 0 п 21 п 22 п 23 0 0 0 0 п М 1 , М 2 п М 1 , М 1 п М 1 , М 0 0 п М , М 1 п М М ) . {\displaystyle {\bf {{P}=\left({\begin{array}{cccccc}p_{11}&p_{12}&0&\cdots &\cdots &0\\p_{21}&p_{22}&p_{23}&0&\ddots &\vdots \\0&\ddots &\ddots &\ddots &\ddots &\vdots \\\vdots &\ddots &\ddots &\ddots &\ddots &0\\\vdots &\ddots &0&p_{M-1,M-2}&p_{M-1,M-1}&p_{M-1,M}\\0&\cdots &\cdots &0&p_{M,M-1}&p_{MM}\\\end{array}}\right).}}}

Точка равновесия

Обычно правила перехода дозы UDD снижают дозу (или, по крайней мере, не дают ей увеличиваться) после положительных ответов, и наоборот. Поэтому случайные блуждания UDD имеют центральную тенденцию: назначения дозы имеют тенденцию колебаться вокруг некоторой дозы, которая может быть рассчитана из правил перехода, когда они выражены как функция . [1] Эту дозу часто путают с формальной целью эксперимента , и эти две часто идентичны - но они не должны быть идентичными. Цель - это доза, которую эксперимент должен оценить, в то время как , известная как «точка равновесия», находится примерно там, где вращается случайное блуждание UDD. [11] х {\displaystyle x^{*}} Ф ( х ) {\displaystyle F(x)} Ф 1 ( Г ) {\displaystyle F^{-1}(\Gamma)} х {\displaystyle x^{*}}

Стационарное распределение дозовых распределений

Поскольку случайные блуждания UDD являются обычными цепями Маркова , они генерируют стационарное распределение распределения доз, , как только эффект выбранной вручную начальной дозы стирается. Это означает, что долгосрочные частоты визитов к различным дозам будут приближаться к устойчивому состоянию, описываемому . Согласно теории цепей Маркова, эффект начальной дозы стирается довольно быстро, с геометрической скоростью. [12] Численные исследования показывают, что обычно требуется от и субъектов, чтобы эффект стирался почти полностью. [11] также является асимптотическим распределением кумулятивных распределений доз. π {\displaystyle \пи} π {\displaystyle \пи} 2 / М {\displaystyle 2/М} 4 / М {\displaystyle 4/М} π {\displaystyle \пи}

Центральные тенденции UDD гарантируют, что долгосрочная, наиболее часто посещаемая доза (т. е. мода ) будет одной из двух доз, наиболее близких к точке равновесия . [1] Если находится за пределами диапазона разрешенных доз, то мода будет на граничной дозе, наиболее близкой к ней. При исходном медианном нахождении UDD мода будет находиться на ближайшей дозе к в любом случае. Вдали от моды асимптотические частоты посещений резко уменьшаются, со скоростью, превышающей геометрическую. Несмотря на то, что эксперимент UDD по-прежнему является случайным блужданием, длительные отклонения от интересующей области весьма маловероятны. π {\displaystyle \пи} х {\displaystyle x^{*}} х {\displaystyle x^{*}} х {\displaystyle x^{*}}

Примеры стационарных распределений UDD с . Слева: исходный («классический») UDD, . Справа: смещенная монета, нацеленная на 30-й процентиль, М = 10 {\displaystyle М=10} х = 5.6 {\displaystyle x^{*}=5,6} х 3.9. {\displaystyle x^{*}\приблизительно 3,9.}

Общие UDD

Оригинальный («простой» или «классический») UDD

Оригинальный "простой" или "классический" UDD перемещает дозу на один уровень вверх при отрицательном ответе, и наоборот. Таким образом, вероятности перехода равны п м , м + 1 = П { И я = 0 | Х я = г м } = 1 Ф ( г м ) ; п м , м 1 = П { И я = 1 | Х я = г м } = Ф ( г м ) . {\displaystyle {\begin{array}{rl}p_{m,m+1}&=P\{Y_{i}=0|X_{i}=d_{m}\}=1-F(d_{m});\\p_{m,m-1}&=P\{Y_{i}=1|X_{i}=d_{m}\}=F(d_{m}).\end{array}}}

Мы используем оригинальный UDD в качестве примера для расчета точки равновесия . Функции «вверх», «вниз» дизайна следующие: Мы приравниваем их, чтобы найти : «Классический» UDD предназначен для поиска срединного порога. Это случай, когда х {\displaystyle x^{*}} п ( х ) = 1 Ф ( х ) , д ( х ) = Ф ( х ) . {\displaystyle p(x)=1-F(x),q(x)=F(x).} Ф {\displaystyle F^{*}} 1 Ф = Ф     Ф = 0,5. {\displaystyle 1-F^{*}=F^{*}\ \longrightarrow \ F^{*}=0,5.} Ф = Г . {\displaystyle F^{*}=\Gamma .}

«Классический» UDD можно рассматривать как частный случай каждой из более универсальных конструкций, описанных ниже.

Предвзятый дизайн монеты Дарема и Флурноя

Этот UDD смещает точку равновесия, добавляя возможность лечить следующего субъекта той же дозой, а не двигаться только вверх или вниз. Остаться или нет, определяется случайным подбрасыванием метафорической «монеты» с вероятностью Этот дизайн смещенной монеты (BCD) имеет два «аромата», один для и один для, правила которых показаны ниже: б = П { головы } . {\displaystyle b=P\{{\textrm {головы}}\}.} Ф > 0,5 {\displaystyle F^{*}>0,5} Ф < 0,5 , {\displaystyle F^{*}<0.5,}

X i + 1 = d m + 1 if     Y i = 0     &     'heads' ; d m 1 if     Y _ i = 1 ; d m if     Y i = 0     &     'tails' . {\displaystyle X_{i+1}={\begin{array}{ll}d_{m+1}&{\textrm {if}}\ \ Y_{i}=0\ \ \&\ \ {\textrm {'heads'}};\\d_{m-1}&{\textrm {if}}\ \ Y\_i=1;\\d_{m}&{\textrm {if}}\ \ Y_{i}=0\ \ \&\ \ {\textrm {'tails'}}.\\\end{array}}}

Вероятность выпадения орла может принимать любое значение в . Точка равновесия — b {\displaystyle b} [ 0 , 1 ] {\displaystyle [0,1]} b ( 1 F ) = F F = b 1 + b [ 0 , 0.5 ] . {\displaystyle {\begin{array}{rcl}b\left(1-F^{*}\right)&=&F^{*}\\F^{*}&=&{\frac {b}{1+b}}\in [0,0.5].\end{array}}}

Точку баланса BCD можно сделать идентичной целевой ставке, установив вероятность выпадения орла на . Например, для набора . Установка делает эту конструкцию идентичной классической UDD, а инвертирование правил путем применения подбрасывания монеты при положительных, а не при отрицательных результатах дает точки баланса выше медианы. Версии с двумя монетами, по одной на каждый результат, также были опубликованы, но они, похоже, не дают преимущества перед более простой одномонетной BCD. F 1 ( Γ ) {\displaystyle F^{-1}(\Gamma )} b = Γ / ( 1 Γ ) {\displaystyle b=\Gamma /(1-\Gamma )} Γ = 0.3 {\displaystyle \Gamma =0.3} b = 3 / 7 {\displaystyle b=3/7} b = 1 {\displaystyle b=1}

Групповые (когортные) UDD

Некоторые эксперименты по поиску дозы, такие как испытания фазы I, требуют периода ожидания в несколько недель перед определением каждого индивидуального результата. Тогда может быть предпочтительнее иметь возможность лечить нескольких субъектов одновременно или в быстрой последовательности. При групповых UDD правила перехода применяют правила к когортам фиксированного размера, а не к отдельным лицам. становится дозой, данной когорте , и представляет собой количество положительных ответов в -й когорте, а не двоичный результат. Учитывая, что -я когорта лечится в на внутренней части -й когорты , назначается s {\displaystyle s} X i {\displaystyle X_{i}} i {\displaystyle i} Y i {\displaystyle Y_{i}} i {\displaystyle i} i {\displaystyle i} X i = d m {\displaystyle X_{i}=d_{m}} X {\displaystyle {\mathcal {X}}} i + 1 {\displaystyle i+1}

X i + 1 = { d m + 1 if     Y i l ; d m 1 if     Y i u ; d m if     l < Y i < u . {\displaystyle X_{i+1}={\begin{cases}d_{m+1}&{\textrm {if}}\ \ Y_{i}\leq l;\\d_{m-1}&{\textrm {if}}\ \ Y_{i}\geq u;\\d_{m}&{\textrm {if}}\ \ l<Y_{i}<u.\end{cases}}}

Y i {\displaystyle Y_{i}} следуют биномиальному распределению, обусловленному , с параметрами и . Вероятности вверх и вниз являются хвостами биномиального распределения, а вероятность остаться — его центром (она равна нулю, если ). Конкретный выбор параметров можно сократить до GUD X i {\displaystyle X_{i}} s {\displaystyle s} F ( X i ) {\displaystyle F(X_{i})} u = l + 1 {\displaystyle u=l+1} ( s , l , u ) . {\displaystyle _{(s,l,u)}.}

Номинально, групповые UDD генерируют случайные блуждания -порядка, поскольку для определения следующего распределения необходимы самые последние наблюдения. Однако, если рассматривать когорты как отдельные математические сущности, эти конструкции генерируют случайные блуждания первого порядка с трехдиагональным TPM, как указано выше. Некоторые соответствующие подсемейства групповых UDD: s {\displaystyle s} s {\displaystyle s}

  • Симметричные конструкции (например, GUD ) нацелены на медиану. l + u = s {\displaystyle l+u=s} ( 2 , 0 , 2 ) {\displaystyle _{(2,0,2)}}
  • Семейство GUD, встречающееся в исследованиях токсичности, допускает эскалацию только при нулевых положительных ответах и ​​деэскалацию при любом положительном ответе. Вероятность эскалации при равна и поскольку эта конструкция не позволяет оставаться на той же дозе, в точке равновесия она будет точно равна . Следовательно, ( s , 0 , 1 ) , {\displaystyle _{(s,0,1)},} x {\displaystyle x} ( 1 F ( x ) ) s , {\displaystyle \left(1-F(x)\right)^{s},} 1 / 2 {\displaystyle 1/2}

F = 1 ( 1 2 ) 1 / s . {\displaystyle F^{*}=1-\left({\frac {1}{2}}\right)^{1/s}.}

С будет ассоциироваться с и , соответственно. Зеркальное семейство GUD имеет свои балансные точки в единице минус эти вероятности. s = 2 , 3 , 4 {\displaystyle s=2,3,4} F 0.293 , 0.206 {\displaystyle F^{*}\approx 0.293,0.206} 0.159 {\displaystyle 0.159} ( s , s 1 , s ) {\displaystyle _{(s,s-1,s)}}

Для групповых УДА точку равновесия можно рассчитать только численно, найдя дозу с показателем токсичности таким образом, что x {\displaystyle x^{*}} F {\displaystyle F^{*}}

r = u s ( s r ) ( F ) r ( 1 F ) s r = t = 0 l ( s t ) ( F ) t ( 1 F ) s t . {\displaystyle \sum _{r=u}^{s}\left({\begin{array}{c}s\\r\\\end{array}}\right)\left(F^{*}\right)^{r}(1-F^{*})^{s-r}=\sum _{t=0}^{l}\left({\begin{array}{c}s\\t\\\end{array}}\right)\left(F^{*}\right)^{t}(1-F^{*})^{s-t}.}

Для решения можно использовать любой численный алгоритм поиска корня, например, Ньютона–Рафсона . [13] F {\displaystyle F^{*}}

k {\displaystyle k} -в-ряд (или «трансформированный» или «геометрический») UDD

Это наиболее часто используемый немедианный UDD. Он был введен Уэзериллом в 1963 году [14] и вскоре после этого распространен им и его коллегами в психофизике [15] , где он остается одним из стандартных методов поиска сенсорных порогов. [8] Уэзерилл назвал его «трансформированным» UDD; Мисрак Гезму , который был первым, кто проанализировал его свойства случайного блуждания, назвал его «геометрическим» UDD в 1990-х годах; [16] а в 2000-х годах было принято более прямолинейное название « -in-a-row» UDD. [11] Правила дизайна обманчиво просты: k {\displaystyle k}

X i + 1 = { d m + 1 if     Y i k + 1 = = Y i = 0 ,     all   observed   at     d m ; d m 1 if     Y i = 1 ; d m otherwise , {\displaystyle X_{i+1}={\begin{cases}d_{m+1}&{\textrm {if}}\ \ Y_{i-k+1}=\cdots =Y_{i}=0,\ \ {\textrm {all}}\ {\textrm {observed}}\ {\textrm {at}}\ \ d_{m};\\d_{m-1}&{\textrm {if}}\ \ Y_{i}=1;\\d_{m}&{\textrm {otherwise}},\end{cases}}}

Каждое повышение дозы требует отсутствия токсичности, наблюдаемой в последовательных точках данных, все при текущей дозе, в то время как деэскалация требует только одной токсичности. Она очень похожа на GUD, описанную выше, и действительно имеет ту же точку баланса. Разница в том, что -in-a-row может выходить из уровня дозы при первой токсичности, тогда как его родной брат UDD может лечить всю когорту сразу, и, следовательно, может увидеть более одной токсичности перед снижением. k {\displaystyle k} ( s , 0 , 1 ) {\displaystyle _{(s,0,1)}} k {\displaystyle k}

Метод, используемый в сенсорных исследованиях, на самом деле является зеркальным отражением метода, определенного выше, с последовательными ответами, необходимыми для деэскалации, и только одним отсутствием ответа для эскалации, что дает . [ 17] k {\displaystyle k} F 0.707 , 0.794 , 0.841 , {\displaystyle F^{*}\approx 0.707,0.794,0.841,\ldots } k = 2 , 3 , 4 , {\displaystyle k=2,3,4,\ldots }

k {\displaystyle k} -в-строку генерирует случайное блуждание -го порядка, поскольку может потребоваться знание последних ответов. Его можно представить как цепь первого порядка с состояниями или как цепь Маркова с уровнями, каждое из которых имеет внутренние состояния, помеченные как Внутреннее состояние служит счетчиком числа непосредственно недавних последовательных нетоксичностей, наблюдаемых при текущей дозе. Это описание ближе к физическому процессу распределения дозы, поскольку субъектам в различных внутренних состояниях уровня всем назначается одна и та же доза . В любом случае, TPM является (или, точнее, , поскольку внутренний счетчик бессмыслен при максимальной дозе) - и он не является трехдиагональным. k {\displaystyle k} k {\displaystyle k} M k {\displaystyle Mk} M {\displaystyle M} k {\displaystyle k} 0 {\displaystyle 0} k 1 {\displaystyle k-1} m {\displaystyle m} d m {\displaystyle d_{m}} M k × M k {\displaystyle Mk\times Mk} [ ( M 1 ) k + 1 ) ] × [ ( M 1 ) k + 1 ) ] {\displaystyle \left[(M-1)k+1)\right]\times \left[(M-1)k+1)\right]}

Ниже представлен развернутый TPM-модуль «в ряд» с и , использующий сокращение Внутренние состояния каждого уровня смежны друг с другом. k {\displaystyle k} k = 2 {\displaystyle k=2} M = 5 {\displaystyle M=5} F m F ( d m ) . {\displaystyle F_{m}\equiv F\left(d_{m}\right).}

[ F 1 1 F 1 0 0 0 0 0 0 0 F 1 0 1 F 1 0 0 0 0 0 0 F 2 0 0 1 F 2 0 0 0 0 0 F 2 0 0 0 1 F 2 0 0 0 0 0 0 F 3 0 0 1 F 3 0 0 0 0 0 F 3 0 0 0 1 F 3 0 0 0 0 0 0 F 4 0 0 1 F 4 0 0 0 0 0 F 4 0 0 0 1 F 4 0 0 0 0 0 0 F 5 0 1 F 5 ] . {\displaystyle {\begin{bmatrix}F_{1}&1-F_{1}&0&0&0&0&0&0&0\\F_{1}&0&1-F_{1}&0&0&0&0&0&0\\F_{2}&0&0&1-F_{2}&0&0&0&0&0\\F_{2}&0&0&0&1-F_{2}&0&0&0&0\\0&0&F_{3}&0&0&1-F_{3}&0&0&0\\0&0&F_{3}&0&0&0&1-F_{3}&0&0\\0&0&0&0&F_{4}&0&0&1-F_{4}&0\\0&0&0&0&F_{4}&0&0&0&1-F_{4}\\0&0&0&0&0&0&F_{5}&0&1-F_{5}\\\end{bmatrix}}.}

k {\displaystyle k} -in-a-row часто рассматривается для клинических испытаний, нацеленных на дозу с низкой токсичностью. В этом случае точка баланса и цель не идентичны; скорее, выбирается для нацеливания близко к целевой скорости, например, для исследований, нацеленных на 30-й процентиль, и для исследований, нацеленных на 20-й процентиль. k {\displaystyle k} k = 2 {\displaystyle k=2} k = 3 {\displaystyle k=3}

Оценка целевой дозы

Пример оценки усреднения методом реверсирования в психофизическом эксперименте. Точки реверсирования обведены кружками, а первый реверс был исключен из среднего. План двухэтапный, причем второй (и основной) этап подряд нацелен на 70,7% процентиль. Первый этап (до первого реверсирования) использует «классический» UDD, широко применяемую схему для ускорения прибытия в интересующую область. k {\displaystyle k}

В отличие от других подходов к проектированию, UDD не имеют конкретного метода оценки, «включенного» в проект в качестве выбора по умолчанию. Исторически более распространенным выбором было некоторое средневзвешенное значение введенных доз, обычно исключая первые несколько доз для смягчения смещения начальной точки. Этот подход предшествует более глубокому пониманию свойств Маркова UDD, но его успех в числовых оценках зависит от окончательной выборки из , поскольку последний сосредоточен примерно вокруг [5] π {\displaystyle \pi } x . {\displaystyle x^{*}.}

Единственная наиболее популярная среди этих усредняющих оценок была введена Уэзериллом и др. в 1966 году и включает только точки возврата (точки, где результат переключается с 0 на 1 или наоборот) в среднем. [18] В последние годы были выявлены ограничения усредняющих оценок, в частности, многочисленные источники смещения, которые очень трудно устранить. Уравновешивающие оценки страдают как от множественных смещений (хотя есть некоторое непреднамеренное устранение смещений), так и от повышенной дисперсии из-за использования подвыборки доз. Однако знания об ограничениях усредняющих оценок еще не распространились за пределы методологической литературы и не повлияли на реальную практику. [5]

Напротив, регрессионные оценщики пытаются аппроксимировать кривую, описывающую зависимость доза-реакция , в частности, вокруг целевого процентиля. Исходные данные для регрессии — это дозы на горизонтальной оси и наблюдаемые частоты токсичности на вертикальной оси. Целевая оценка — это абсцисса точки, где подогнанная кривая пересекает y = F ( x ) {\displaystyle y=F(x)} d m {\displaystyle d_{m}} F ^ m = i = 1 n Y i I [ X i = d m ] i = 1 n I [ X i = d m ] ,   m = 1 , , M , {\displaystyle {\hat {F}}_{m}={\frac {\sum _{i=1}^{n}Y_{i}I\left[X_{i}=d_{m}\right]}{\sum _{i=1}^{n}I\left[X_{i}=d_{m}\right]}},\ m=1,\ldots ,M,} y = Γ . {\displaystyle y=\Gamma .}

Пробит-регрессия использовалась в течение многих десятилетий для оценки целевых показателей UDD, хотя и гораздо реже, чем оценщик обратного усреднения. В 2002 году Стилиану и Флурной представили интерполированную версию изотонической регрессии (IR) для оценки целевых показателей UDD и других данных о дозе-ответе. [6] Совсем недавно Орон и Флурной разработали модификацию под названием «центрированная изотоническая регрессия» (CIR), обещающую существенно лучшую производительность оценки, чем обычная изотоническая регрессия в большинстве случаев, а также предлагающую первую жизнеспособную интервальную оценку для изотонической регрессии в целом. [7] Оценщики изотонической регрессии кажутся наиболее совместимыми с UDD, поскольку оба подхода являются непараметрическими и относительно надежными. [5] Общедоступный пакет R «cir» реализует как CIR, так и IR для поиска дозы и других приложений. [19]

Ссылки

  1. ^ abc Дарем, SD; Флурной, N. «Вверх-вниз планы. I. Стационарные распределения обработки». В Флурной, N; Розенбергер, WF (ред.). Серия монографий IMS Lecture Notes . Том 25: Адаптивные планы. С.  139–157 .
  2. ^ Диксон, У. Дж.; Муд, А. М. (1948). «Метод получения и анализа данных о чувствительности». Журнал Американской статистической ассоциации . 43 (241): 109– 126. doi :10.1080/01621459.1948.10483254.
  3. ^ фон Бекеши, Г (1947). «Новый аудиометр». Acta Oto-Laryngologica . 35 ( 5– 6): 411– 422. doi :10.3109/00016484709123756.
  4. ^ Андерсон, TW; Маккарти, PJ; Тьюки, JW (1946).«Лестничный» метод проверки чувствительности (Технический отчет). Отчет по военно-морским вооружениям. 65-46.
  5. ^ abcd Флурной, Н.; Орон, А. П. «Планы с повышением и понижением для поиска дозы». В Дине, А. (ред.). Справочник по планированию и анализу экспериментов . CRC Press. С.  858–894 .
  6. ^ ab Stylianou, MP; Flournoy, N (2002). «Определение дозы с использованием смещенной монеты вверх-вниз и изотонической регрессии». Биометрия . 58 (1): 171– 177. doi :10.1111/j.0006-341x.2002.00171.x. PMID  11890313. S2CID  8743090.
  7. ^ ab Oron, AP; Flournoy, N (2017). «Центрированная изотоническая регрессия: точечная и интервальная оценка для исследований зависимости «доза-ответ»». Статистика в биофармацевтических исследованиях . 9 (3): 258–267 . arXiv : 1701.05964 . doi : 10.1080/19466315.2017.1286256. S2CID  88521189.
  8. ^ ab Leek, MR (2001). «Адаптивные процедуры в психофизических исследованиях». Восприятие и психофизика . 63 (8): 1279–1292 . doi : 10.3758/bf03194543 . PMID  11800457.
  9. ^ Pace, NL; Stylianou, MP (2007). «Достижения и ограничения методологии «вверх-вниз»: краткое изложение клинического использования, дизайна исследования и оценки дозы в исследованиях анестезии». Анестезиология . 107 (1): 144–152 . doi : 10.1097/01.anes.0000267514.42592.2a . PMID  17585226.
  10. ^ Орон, AP; Хофф, PD (2013). «Поведение малых выборок в новых проектах испытаний фазы I рака». Клинические испытания . 10 (1): 63–80 . arXiv : 1202.4962 . doi : 10.1177/1740774512469311. PMID  23345304. S2CID  5667047.
  11. ^ abc Oron, AP; Hoff, PD (2009). «Дизайн k-в-ряд вверх-вниз, пересмотренный». Статистика в медицине . 28 (13): 1805– 1820. doi :10.1002/sim.3590. PMID  19378270. S2CID  25904900.
  12. ^ Диаконис, П.; Струк, Д. (1991). «Геометрические границы собственных значений цепи Маркова». Анналы прикладной теории вероятностей . 1 : 36–61 . doi : 10.1214/aoap/1177005980 .
  13. ^ Gezmu, M ; Flournoy, N (2006). «Групповые планы вверх и вниз для поиска дозы». Журнал статистического планирования и вывода . 136 (6): 1749– 1764. doi :10.1016/j.jspi.2005.08.002.
  14. ^ Wetherill, GB; Levitt, H (1963). «Последовательная оценка кривых квантового отклика». Журнал Королевского статистического общества, Серия B. 25 : 1– 48. doi : 10.1111/j.2517-6161.1963.tb00481.x.
  15. ^ Wetherill, GB (1965). «Последовательная оценка точек психометрической функции». British Journal of Mathematical and Statistical Psychology . 18 : 1– 10. doi :10.1111/j.2044-8317.1965.tb00689.x. PMID  14324842.
  16. ^ Gezmu, Misrak (1996). Геометрический дизайн «вверх-вниз» для распределения уровней дозировки (PhD). Американский университет.
  17. ^ Гарсия-Перес, MA (1998). «Лестницы принудительного выбора с фиксированными размерами ступеней: асимптотические и свойства малых выборок». Vision Research . 38 (12): 1861– 81. doi : 10.1016/s0042-6989(97)00340-4 . PMID  9797963.
  18. ^ Wetherill, GB; Chen, H; Vasudeva, RB (1966). «Последовательная оценка кривых квантового отклика: новый метод оценки». Biometrika . 53 ( 3– 4): 439– 454. doi :10.1093/biomet/53.3-4.439.
  19. ^ Орон, Ассаф. "Пакет 'cir'". CRAN . R Foundation for Statistical Computing . Получено 26 декабря 2020 г.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Up-and-down_design&oldid=1220244091"