Вероятность до теста и вероятность после теста (альтернативно пишутся как вероятность до теста и вероятность после теста) — это вероятности наличия состояния (например, болезни ) до и после диагностического теста соответственно. Вероятность после теста , в свою очередь, может быть положительной или отрицательной в зависимости от того, выпадает ли тест как положительный или отрицательный тест соответственно. В некоторых случаях она используется для вероятности развития интересующего состояния в будущем.
Тест в этом смысле может относиться к любому медицинскому тесту (но обычно в смысле диагностических тестов), а в широком смысле также включая вопросы и даже предположения (например, предположение, что целевой индивидуум является женщиной или мужчиной). Способность различать вероятности различных состояний до и после теста является основным фактором в показании медицинских тестов .
Вероятность индивидуума до теста может быть выбрана как одна из следующих:
В клинической практике вероятности после теста часто просто оцениваются или даже предполагаются. Обычно это приемлемо при обнаружении патогномоничного признака или симптома, в этом случае почти наверняка присутствует целевое состояние; или при отсутствии обнаружения sine qua non признака или симптома, в этом случае почти наверняка отсутствует целевое состояние.
Однако в действительности субъективная вероятность наличия состояния никогда не равна точно 0 или 100%. Тем не менее, существует несколько систематических методов оценки этой вероятности. Такие методы обычно основаны на предварительном проведении теста на референтной группе , в которой известно наличие или отсутствие состояния (или, по крайней мере, оценено другим тестом, который считается высокоточным, например, « Золотым стандартом »), с целью установления данных о производительности теста. Эти данные впоследствии используются для интерпретации результата теста любого человека, протестированного методом. Альтернативой или дополнением к методам, основанным на референтной группе, является сравнение результата теста с предыдущим тестом на том же человеке, что чаще встречается в тестах для мониторинга .
Наиболее важные систематические методы оценки посттестовой вероятности, основанные на референтной группе, включают методы, обобщенные и сравненные в следующей таблице, а также более подробно описанные в отдельных разделах ниже.
Метод | Установление данных о производительности | Метод индивидуальной интерпретации | Способность точно интерпретировать последующие тесты | Дополнительные преимущества |
---|---|---|---|---|
По прогностическим значениям | Прямые коэффициенты из референтной группы | Самый простой вариант: прогностическая ценность равна вероятности. | Обычно низкий: для каждого последующего состояния предварительного тестирования требуется отдельная референтная группа | Доступно как для двоичных , так и для непрерывных значений. |
По коэффициенту правдоподобия | Получено из чувствительности и специфичности | Посттестовые шансы, полученные путем умножения предтестовых шансов на отношение | Теоретически безгранично | Состояние до теста (и, следовательно, вероятность до теста) не обязательно должно быть таким же, как в референтной группе. |
По относительному риску | Коэффициент риска среди подвергшихся воздействию и риска среди не подвергшихся воздействию | Предварительная вероятность, умноженная на относительный риск | Низкий, если только последующие относительные риски не выводятся из того же многомерного регрессионного анализа | Относительно интуитивно понятное использование |
По диагностическим критериям и правилам клинического прогнозирования | Переменная, но обычно самая утомительная | Переменная | Обычно отлично по всем тестам, включенным в критерии | Обычно наиболее предпочтителен, если доступен |
Прогностические значения могут использоваться для оценки посттестовой вероятности человека, если можно предположить, что предтестовая вероятность человека примерно равна распространенности в референтной группе , в которой имеются как результаты тестов, так и знания о наличии или отсутствии состояния (например, заболевания, которое может быть определено « золотым стандартом »).
Если результат теста имеет бинарную классификацию на положительный или отрицательный тест , то можно составить следующую таблицу:
Состояние (определено « Золотым стандартом ») | ||||
Положительный | Отрицательно | |||
Результат теста | Положительный | Истинный позитив | Ложноположительный результат ( ошибка типа I ) | → Положительная прогностическая ценность |
Отрицательно | Ложноотрицательный результат ( ошибка II типа ) | Истинный отрицательный | → Отрицательная прогностическая ценность | |
↓ Чувствительность | ↓ Специфичность | ↘ Точность |
Вероятность до теста можно рассчитать по диаграмме следующим образом:
Вероятность претеста = (Истинно положительный результат + Ложно отрицательный результат) / Общая выборка
Кроме того, в этом случае положительная посттестовая вероятность (вероятность наличия целевого состояния, если тест окажется положительным) численно равна положительному прогностическому значению , а отрицательная посттестовая вероятность (вероятность наличия целевого состояния, если тест окажется отрицательным) численно дополняет отрицательное прогностическое значение ([отрицательная посттестовая вероятность] = 1 - [отрицательное прогностическое значение]), [1] снова предполагая, что у тестируемого человека нет никаких других факторов риска, которые приводят к тому, что этот человек имеет иную предтестовую вероятность, чем референтная группа, используемая для установления положительного и отрицательного прогностического значения теста.
На диаграмме выше эта положительная посттестовая вероятность , то есть посттестовая вероятность целевого состояния при положительном результате теста, рассчитывается следующим образом:
Вероятность положительного результата после теста = Истинно положительные результаты / (Истинно положительные результаты + Ложно положительные результаты)
Сходным образом:
Вероятность заболевания после теста при отрицательном результате рассчитывается как:
Вероятность отрицательного результата после теста = 1 - (Истинно отрицательные результаты / (Ложно отрицательные результаты + Истинно отрицательные результаты))
Обоснованность приведенных выше уравнений также зависит от того, что выборка из популяции не имеет существенного смещения выборки , которое делает группы тех, у кого есть заболевание, и тех, у кого нет существенной диспропорции относительно соответствующей распространенности и «нераспространенности» в популяции. По сути, приведенные выше уравнения недействительны только при исследовании случай-контроль , которое отдельно собирает одну группу с заболеванием и одну группу без него.
Вышеуказанные методы нецелесообразно использовать, если вероятность претеста отличается от распространенности в референтной группе, используемой для установления, среди прочего, положительной прогностической ценности теста. Такое различие может возникнуть, если предшествовал другой тест, или лицо, участвующее в диагностике, считает, что должна быть использована другая вероятность претеста из-за знания, например, конкретных жалоб, других элементов истории болезни , признаков физического обследования , либо путем расчета каждого результата как теста самого по себе с его собственной чувствительностью и специфичностью, либо, по крайней мере, путем грубой оценки индивидуальной вероятности претеста.
В этих случаях распространенность в контрольной группе не совсем точно отражает предтестовую вероятность наличия у человека целевого состояния, и, следовательно, прогностическое значение ( положительное или отрицательное ) не совсем точно отражает посттестовую вероятность наличия у человека целевого состояния.
В этих случаях вероятность после теста можно оценить точнее, используя отношение правдоподобия для теста. Отношение правдоподобия рассчитывается на основе чувствительности и специфичности теста, и, таким образом, оно не зависит от распространенности в референтной группе, [2] и, аналогично, оно не меняется с изменением вероятности до теста , в отличие от положительных или отрицательных прогностических значений (которые изменились бы). Кроме того, по сути, валидность вероятности после теста, определяемая из отношения правдоподобия, не подвержена смещению выборки в отношении тех, у кого есть и у кого нет заболевания в выборке населения, и может быть проведено как исследование случай-контроль, которое отдельно собирает тех, у кого есть и у кого нет заболевания.
Оценка посттестовой вероятности из предтестовой вероятности и отношения правдоподобия происходит следующим образом: [2]
В приведенном выше уравнении положительная посттестовая вероятность рассчитывается с использованием отношения правдоподобия positive , а отрицательная посттестовая вероятность рассчитывается с использованием отношения правдоподобия negative .
Эту связь можно также оценить с помощью так называемой номограммы Фагана (показана справа), проведя прямую линию от точки заданной априорной вероятности до заданного отношения правдоподобия в их шкалах, что, в свою очередь, даст оценку априорной вероятности в точке, где эта прямая пересекает ее шкалу.
Вероятность после теста может, в свою очередь, использоваться как вероятность до теста для дополнительных тестов, если ее продолжают рассчитывать тем же способом. [2]
Можно сделать расчет отношения правдоподобия для тестов с непрерывными значениями или более чем двумя результатами, что похоже на расчет для дихотомических результатов. Для этой цели отдельное отношение правдоподобия рассчитывается для каждого уровня результата теста и называется отношением правдоподобия, специфичным для интервала или слоя. [4]
Человек был обследован с помощью теста на скрытую кровь кала (FOB) для оценки вероятности наличия у него целевого состояния рака кишечника, и результат оказался положительным (кровь была обнаружена в стуле). До проведения теста у этого человека была предварительная вероятность наличия рака кишечника, например, 3% (0,03), что можно было бы оценить, например, по оценке истории болезни, осмотра и предыдущих тестов этого человека.
Чувствительность, специфичность и т. д. теста FOB были установлены на выборке из 203 человек (без такой наследственности) и распределились следующим образом:
Пациенты с раком кишечника (подтвержденным эндоскопией ) | ||||
Положительный | Отрицательно | |||
Результат анализа кала на скрытую кровь | Положительный | ТП = 2 | ФП = 18 | → Положительная прогностическая ценность = TP / (TP + FP) = 2 / (2 + 18) = 2 / 20 = 10% |
Отрицательно | ФН = 1 | ТН = 182 | → Отрицательная прогностическая ценность = TN / (FN + TN) = 182 / (1 + 182) = 182 / 183 ≈ 99,5% | |
↓ Чувствительность = TP / (TP + FN) = 2 / (2 + 1) = 2 / 3 ≈ 66,67% | ↓ Специфичность = TN / (FP + TN) = 182 / (18 + 182) = 182 / 200 = 91% | ↘ Точность = (TP + TN) / Всего = (2 + 182) / 203 = 184 / 203 = 90,64% |
Исходя из этого, можно установить коэффициенты правдоподобия теста: [2]
Таким образом, у этого человека вероятность (или «риск) после теста) заболеть раком кишечника составляет 18,6%.
Распространенность в выборке населения рассчитывается следующим образом :
Вероятность для данного человека до теста более чем в два раза превышала вероятность для всей выборки населения, хотя вероятность для данного человека после теста была менее чем в два раза превышала вероятность для всей выборки населения (которая оценивается по положительной прогностической ценности теста в 10%), что противоположно тому, что было бы получено при использовании менее точного метода простого умножения относительных рисков.
Конкретные источники неточности при использовании отношения правдоподобия для определения вероятности после теста включают помехи с детерминантами или предыдущими тестами или перекрытие целевых показателей теста, как поясняется ниже:
Вероятность после теста , оцененная по вероятности до теста с отношением правдоподобия , должна применяться с осторожностью у лиц с другими детерминантами (например, факторами риска), чем у населения в целом, а также у лиц, которые прошли предыдущие тесты, поскольку такие детерминанты или тесты могут также влиять на сам тест непредсказуемым образом, по-прежнему приводя к неточным результатам. Примером фактора риска ожирения является то, что дополнительный абдоминальный жир может затруднить пальпацию органов брюшной полости и снизить разрешение УЗИ брюшной полости , и аналогично, остаточный контраст бария от предыдущей рентгенографии может помешать последующим исследованиям брюшной полости, [5] фактически снижая чувствительность и специфичность таких последующих тестов. С другой стороны, эффект помех может потенциально повысить эффективность последующих тестов по сравнению с использованием в референтной группе, например, некоторые исследования брюшной полости легче проводить у людей с недостаточным весом.
Кроме того, обоснованность расчетов по любой вероятности предварительного теста, которая сама по себе выводится из предыдущего теста, зависит от того, что два теста существенно не пересекаются в отношении целевого тестируемого параметра, например, анализы крови веществ, принадлежащих к одному и тому же нарушенному метаболическому пути . Примером крайней степени такого перекрытия является случай, когда чувствительность и специфичность были установлены для анализа крови, обнаруживающего «вещество X», и аналогично для анализа, обнаруживающего «вещество Y». Если, по сути, «вещество X» и «вещество Y» являются одним и тем же веществом, то проведение двух последовательных тестов одного и того же вещества может вообще не иметь никакой диагностической ценности, хотя расчет, по-видимому, показывает разницу. В отличие от помех, описанных выше, увеличение перекрытия тестов только снижает их эффективность. В медицинских условиях диагностическая обоснованность увеличивается путем объединения тестов различных модальностей, чтобы избежать существенного перекрытия, например, при проведении комбинации анализа крови, биопсии и рентгенограммы .
Чтобы избежать таких источников неточности с помощью отношений правдоподобия, оптимальным методом было бы собрать большую референтную группу эквивалентных лиц, чтобы установить отдельные прогностические значения для использования теста у таких лиц. Однако с большим знанием истории болезни человека, физического обследования и предыдущего теста и т. д. этот человек становится более дифференцированным, и все труднее найти референтную группу для установления индивидуальных прогностических значений, что делает оценку вероятности после теста по прогностическим значениям недействительной.
Другим методом преодоления подобных неточностей является оценка результата теста в контексте диагностических критериев, как описано в следующем разделе.
Вероятность после теста иногда можно оценить, умножив вероятность до теста на относительный риск, полученный в результате теста. В клинической практике это обычно применяется при оценке истории болезни человека, где «тест» обычно представляет собой вопрос (или даже предположение) относительно различных факторов риска, например, пола, курения табака или веса , но потенциально это может быть существенный тест, такой как взвешивание человека . При использовании относительных рисков результирующая вероятность обычно скорее связана с развитием у человека состояния в течение определенного периода времени (аналогично заболеваемости в популяции), а не с вероятностью наличия у человека состояния в настоящее время, но может косвенно быть оценкой последнего.
Коэффициент опасности можно использовать аналогично относительному риску.
Чтобы установить относительный риск, риск в группе, подвергшейся воздействию, делится на риск в группе, не подвергшейся воздействию.
Если учитывается только один фактор риска отдельного человека, то вероятность после теста можно оценить, умножив относительный риск на риск в контрольной группе. Контрольная группа обычно представляет собой неэкспонированную популяцию, но если экспонирована очень низкая доля популяции, то распространенность в общей популяции часто можно считать равной распространенности в контрольной группе. В таких случаях вероятность после теста можно оценить, умножив относительный риск на риск в общей популяции.
Например, заболеваемость раком груди у женщины в Соединенном Королевстве в возрасте от 55 до 59 лет оценивается в 280 случаев на 100 000 в год [6] , а фактор риска подвергнуться воздействию высокой дозы ионизирующего излучения на грудь (например, в качестве лечения других видов рака) дает относительный риск рака груди от 2,1 до 4,0 [7] по сравнению с необлученными. Поскольку облучению подвергается лишь небольшая часть населения, распространенность среди необлученного населения можно предположить равной распространенности среди населения в целом. Следовательно, можно оценить, что женщина в Соединенном Королевстве в возрасте от 55 до 59 лет, подвергшаяся воздействию высокой дозы ионизирующего излучения, должна иметь риск развития рака груди в течение одного года от 588 до 1,120 на 100 000 (то есть от 0,6% до 1,1%).
Теоретически общий риск при наличии нескольких факторов риска можно оценить путем умножения на каждый относительный риск, но, как правило, это гораздо менее точно, чем использование отношений правдоподобия, и обычно делается только потому, что это гораздо проще выполнить, когда даны только относительные риски, по сравнению, например, с преобразованием исходных данных в чувствительности и специфичности и расчетом по отношениям правдоподобия. Аналогично, в литературе вместо отношений правдоподобия часто приводятся относительные риски, поскольку первый вариант более интуитивен. Источники неточности умножения относительных рисков включают:
(Последний упомянутый) эффект переоценки может быть компенсирован путем преобразования рисков в шансы, а относительных рисков в отношения шансов . Однако это не компенсирует (ранее упомянутый) эффект какой-либо разницы между вероятностью до теста у отдельного человека и распространенностью в референтной группе.
Методом компенсации обоих источников неточности, указанных выше, является установление относительных рисков с помощью многомерного регрессионного анализа. Однако для сохранения его валидности относительные риски, установленные как таковые, должны быть умножены на все другие факторы риска в том же регрессионном анализе и без добавления других факторов за пределами регрессионного анализа.
Кроме того, умножение нескольких относительных рисков имеет тот же риск пропуска важных совпадений включенных факторов риска, аналогично использованию отношений правдоподобия. Кроме того, различные факторы риска могут действовать в синергии , в результате чего, например, два фактора, которые оба по отдельности имеют относительный риск 2, имеют общий относительный риск 6, когда оба присутствуют, или могут подавлять друг друга, несколько аналогично помехам, описанным для использования отношений правдоподобия.
Большинство основных заболеваний имеют установленные диагностические критерии и/или клинические правила прогнозирования . Установление диагностических критериев или клинических правил прогнозирования состоит из комплексной оценки многих тестов, которые считаются важными для оценки вероятности интересующего состояния, иногда также включая то, как разделить его на подгруппы, а также когда и как лечить состояние. Такое установление может включать использование прогностических значений, отношений правдоподобия, а также относительных рисков.
Например, критерии ACR для системной красной волчанки определяют диагноз как наличие не менее 4 из 11 результатов, каждый из которых может рассматриваться как целевое значение теста с собственной чувствительностью и специфичностью. В этом случае была проведена оценка тестов для этих целевых параметров при использовании в сочетании в отношении, например, интерференции между ними и перекрытия целевых параметров, тем самым стремясь избежать неточностей, которые в противном случае могли бы возникнуть при попытке рассчитать вероятность заболевания с использованием отношений правдоподобия отдельных тестов. Поэтому, если диагностические критерии были установлены для состояния, обычно наиболее целесообразно интерпретировать любую вероятность после теста для этого состояния в контексте этих критериев.
Кроме того, существуют инструменты оценки риска для определения совокупного риска нескольких факторов риска, например, онлайн-инструмент [1] из исследования Framingham Heart Study для оценки риска исходов ишемической болезни сердца с использованием нескольких факторов риска, включая возраст, пол, уровень липидов в крови, артериальное давление и курение, который является гораздо более точным, чем умножение отдельных относительных рисков каждого фактора риска.
Тем не менее, опытный врач может оценить вероятность после теста (и мотивирующие ее действия) с помощью широкого анализа, включающего критерии и правила в дополнение к другим методам, описанным ранее, включая как индивидуальные факторы риска, так и результаты проведенных тестов.
Клинически полезным параметром является абсолютная (а не относительная и не отрицательная) разница между вероятностью до и после теста, рассчитываемая как:
Абсолютная разность = | (вероятность до теста) - (вероятность после теста) |
Основным фактором для такой абсолютной разницы является мощность самого теста, которая может быть описана в терминах, например, чувствительности и специфичности или отношения правдоподобия. Другим фактором является вероятность до теста, при этом более низкая вероятность до теста приводит к более низкой абсолютной разнице, в результате чего даже очень мощные тесты достигают низкой абсолютной разницы для очень маловероятных состояний у человека (например, редких заболеваний при отсутствии любого другого указывающего признака), но с другой стороны, даже тесты с низкой мощностью могут иметь большое значение для высоко подозрительных состояний.
Вероятности в этом смысле, возможно, также необходимо рассматривать в контексте условий, которые не являются основными целями теста, например, относительные вероятности профиля в дифференциальной диагностической процедуре .
Абсолютную разницу можно сопоставить с пользой для отдельного человека, которую приносит медицинский тест , например, ее можно приблизительно оценить как:
, где:
В этой формуле то, что составляет пользу или вред, во многом зависит от личных и культурных ценностей , но общие выводы все равно можно сделать. Например, если единственным ожидаемым эффектом медицинского теста является повышение вероятности возникновения одной болезни по сравнению с другой, но обе болезни имеют одинаковое лечение (или ни одна из них не поддается лечению), то r i = 0, и тест по сути не приносит никакой пользы человеку.
Дополнительные факторы, влияющие на решение о проведении медицинского теста, включают: стоимость теста, доступность дополнительных тестов, потенциальное вмешательство в последующий тест (например, пальпация живота, потенциально вызывающая кишечную активность, звуки которой мешают последующей аускультации живота ), время, необходимое для теста, или другие практические или административные аспекты. Кроме того, даже если результаты не приносят пользы человеку, проходящему тест, они могут быть полезны для установления статистики с целью улучшения медицинского обслуживания других людей.
Вероятности до и после теста субъективны , поскольку в действительности человек либо страдает заболеванием, либо нет (при этом вероятность всегда составляет 100%), поэтому вероятности до и после теста для людей можно скорее рассматривать как психологические явления в сознании тех, кто участвует в текущей диагностике .