Слово вероятность использовалось в различных значениях с тех пор, как оно впервые было применено к математическому изучению азартных игр . Измеряет ли вероятность реальную, физическую тенденцию чего-либо произойти, или это мера того, насколько сильно человек верит, что это произойдет, или она опирается на оба этих элемента? Отвечая на такие вопросы, математики интерпретируют значения вероятности теории вероятностей .
Существует две широкие категории [1] [2] вероятностных интерпретаций , которые можно назвать «физическими» и «доказательными» вероятностями. Физические вероятности, которые также называются объективными или частотными вероятностями , связаны со случайными физическими системами, такими как рулеточные колеса, игральные кости и радиоактивные атомы. В таких системах определенный тип событий (например, выпадение шестерки на игральной кости) имеет тенденцию происходить с постоянной скоростью или «относительной частотой» в длительной серии испытаний. Физические вероятности либо объясняют, либо привлекаются для объяснения этих стабильных частот. Двумя основными видами теории физической вероятности являются частотные счета (например, счета Венна, [3] Райхенбаха [4] и фон Мизеса) [5] и счета предрасположенности (например, счета Поппера, Миллера, Гира и Фетцера). [6]
Вероятность доказательств, также называемая байесовской вероятностью , может быть назначена любому утверждению, даже если не задействован случайный процесс, как способ представления его субъективной правдоподобности или степени, в которой утверждение поддерживается имеющимися доказательствами. В большинстве случаев вероятности доказательств считаются степенями веры, определяемыми в терминах предрасположенности играть в азартные игры с определенными шансами. Четыре основных интерпретации доказательств — это классическая (например, Лапласа) [7] интерпретация, субъективная интерпретация ( де Финетти [8] и Сэвидж), [9] эпистемическая или индуктивная интерпретация ( Рэмси [ 10] Кокс ) [11] и логическая интерпретация ( Кейнс [12] и Карнап ). [13] Существуют также интерпретации доказательств вероятности, охватывающей группы, которые часто называют «межсубъективными» (предложенные Джиллисом [14] и Роуботтомом). [6]
Некоторые интерпретации вероятности связаны с подходами к статистическому выводу , включая теории оценки и проверки гипотез . Физическая интерпретация, например, принимается последователями «частотных» статистических методов, такими как Рональд Фишер [ сомнительный – обсудить ] , Ежи Нейман и Эгон Пирсон . Статистики противоположной байесовской школы обычно принимают частотную интерпретацию, когда она имеет смысл (хотя и не как определение), но относительно физических вероятностей согласия меньше. Байесовцы считают расчет доказательных вероятностей как действительным, так и необходимым в статистике. Однако эта статья фокусируется на интерпретациях вероятности, а не на теориях статистического вывода.
Терминология этой темы довольно запутанная, отчасти потому, что вероятности изучаются в различных академических областях. Слово «частотный» особенно сложное. Для философов оно относится к конкретной теории физической вероятности, которая более или менее заброшена. Для ученых, с другой стороны, « частотная вероятность » — это просто другое название физической (или объективной) вероятности. Те, кто продвигает байесовский вывод, рассматривают « частотную статистику » как подход к статистическому выводу, основанный на частотной интерпретации вероятности, обычно полагающийся на закон больших чисел и характеризующийся тем, что называется «проверкой значимости нулевой гипотезы» (NHST). Кроме того, слово «объективный», применяемое к вероятности, иногда означает именно то, что здесь означает «физический», но также используется для доказательных вероятностей, которые фиксируются рациональными ограничениями, такими как логические и эпистемические вероятности.
Единогласно признано, что статистика каким-то образом зависит от вероятности. Но что касается того, что такое вероятность и как она связана со статистикой, редко случалось столь полное несогласие и разрыв коммуникации со времен Вавилонской башни. Несомненно, большая часть разногласий является просто терминологической и исчезнет при достаточно тщательном анализе.
— Сэвидж, 1954, стр. 2 [9]
Философия вероятности представляет проблемы в основном в вопросах эпистемологии и непростого интерфейса между математическими концепциями и обычным языком, который используют нематематики. Теория вероятностей является устоявшейся областью изучения математики. Она берет свое начало в переписке, в которой обсуждалась математика азартных игр между Блезом Паскалем и Пьером де Ферма в семнадцатом веке, [15] и была формализована и сделана аксиоматической как отдельная ветвь математики Андреем Колмогоровым в двадцатом веке. В аксиоматической форме математические утверждения о теории вероятностей несут в себе тот же вид эпистемологической уверенности в философии математики , который разделяют и другие математические утверждения. [16] [17]
Математический анализ возник в результате наблюдений за поведением игрового оборудования, такого как игральные карты и кости , которые специально разработаны для введения случайных и уравненных элементов; в математических терминах они являются субъектами безразличия . Это не единственный способ использования вероятностных утверждений в обычном человеческом языке: когда люди говорят, что « вероятно, пойдет дождь », они, как правило, не имеют в виду, что результат дождя по сравнению с отсутствием дождя является случайным фактором, которому в настоящее время благоприятствуют шансы; вместо этого такие утверждения, возможно, лучше понимать как квалификацию их ожидания дождя с определенной степенью уверенности. Аналогично, когда написано, что «наиболее вероятное объяснение» названия Ладлоу , Массачусетс , «состоит в том, что оно было названо в честь Роджера Ладлоу », здесь имеется в виду не то, что Роджер Ладлоу благоприятствует случайному фактору, а скорее то, что это наиболее правдоподобное объяснение доказательств, которое допускает другие, менее вероятные объяснения.
Томас Байес попытался разработать логику , которая могла бы работать с различными степенями уверенности; таким образом, байесовская вероятность представляет собой попытку переосмыслить представление вероятностных утверждений как выражение степени уверенности, с которой поддерживаются убеждения, которые они выражают.
Хотя изначально теория вероятности имела довольно приземленные мотивы, ее современное влияние и использование широко распространены: от доказательной медицины и шести сигм до вероятностно проверяемых доказательств и теории струн .
Классическая | Частотник | Субъективный | Склонность | |
---|---|---|---|---|
Основная гипотеза | Принцип безразличия | Частота появления | Степень веры | Степень причинно-следственной связи |
Концептуальная основа | Гипотетическая симметрия | Прошлые данные и справочный класс | Знание и интуиция | Текущее состояние системы |
Концептуальный подход | Предположительный | Эмпирический | Субъективный | Метафизический |
Возможен единичный случай | Да | Нет | Да | Да |
Точный | Да | Нет | Нет | Да |
Проблемы | Неопределенность в принципе безразличия | Круговое определение | Проблема ссылочного класса | Спорная концепция |
Первая попытка математической строгости в области вероятности, отстаиваемая Пьером-Симоном Лапласом , теперь известна как классическое определение . Разработанное на основе исследований азартных игр (таких как бросание костей ), оно утверждает, что вероятность делится поровну между всеми возможными результатами, при условии, что эти результаты можно считать одинаково вероятными. [1] (3.1)
Теория случая состоит в сведении всех событий одного и того же рода к определенному числу случаев, равновозможных, то есть к таким, относительно которых мы можем быть одинаково не уверены в их существовании, и в определении числа случаев, благоприятствующих событию, вероятность которого искома. Отношение этого числа к числу всех возможных случаев есть мера этой вероятности, которая, таким образом, есть просто дробь, числитель которой есть число благоприятствующих случаев, а знаменатель — число всех возможных случаев.
— Пьер-Симон Лаплас, Философское эссе о вероятностях [7]
Математически это можно представить следующим образом: если случайный эксперимент может привести к N взаимоисключающим и равновероятным результатам и если N A из этих результатов приводят к возникновению события A , вероятность A определяется как
Существует два четких ограничения классического определения. [18] Во-первых, оно применимо только к ситуациям, в которых существует только «конечное» число возможных результатов. Но некоторые важные случайные эксперименты, такие как подбрасывание монеты до тех пор, пока не выпадет орел, приводят к бесконечному набору результатов. И, во-вторых, оно требует априорного определения того, что все возможные результаты равновероятны, не попадая в ловушку кругового рассуждения, полагаясь на понятие вероятности. (Используя терминологию «мы можем быть в равной степени неопределенными», Лаплас предположил, с помощью того, что было названо « принципом недостаточной причины », что все возможные результаты равновероятны, если нет известной причины предполагать иное, для чего нет очевидного обоснования. [19] [20] )
Сторонники частотности утверждают, что вероятность события — это его относительная частота с течением времени, [1] (3.4) т. е. его относительная частота появления после повторения процесса большое количество раз при схожих условиях. Это также известно как алеаторная вероятность. Предполагается, что события управляются некоторыми случайными физическими явлениями, которые являются либо явлениями, которые в принципе предсказуемы при наличии достаточной информации (см. детерминизм ); либо явлениями, которые по сути непредсказуемы. Примерами первого рода являются подбрасывание игральных костей или вращение рулетки ; примером второго рода является радиоактивный распад . В случае подбрасывания честной монеты сторонники частотности говорят, что вероятность выпадения орла равна 1/2 не потому, что есть два равновероятных результата, а потому, что повторяющиеся серии большого числа испытаний демонстрируют, что эмпирическая частота сходится к пределу 1/2, когда число испытаний стремится к бесконечности.
Если мы обозначим через число появлений события в испытаниях, то если мы скажем, что .
Фракционистский взгляд имеет свои собственные проблемы. Конечно, невозможно на самом деле выполнить бесконечное количество повторений случайного эксперимента, чтобы определить вероятность события. Но если выполняется только конечное число повторений процесса, в разных сериях испытаний будут появляться разные относительные частоты. Если эти относительные частоты должны определять вероятность, вероятность будет немного отличаться каждый раз, когда она измеряется. Но реальная вероятность должна быть одинаковой каждый раз. Если мы признаем тот факт, что мы можем измерить вероятность только с некоторой погрешностью измерения, мы все равно сталкиваемся с проблемами, поскольку погрешность измерения может быть выражена только как вероятность, то есть как само понятие, которое мы пытаемся определить. Это делает даже определение частоты цикличным; см., например, «Какова вероятность землетрясения?» [21]
Субъективисты, также известные как байесовцы или последователи эпистемической вероятности , придают понятию вероятности субъективный статус, рассматривая его как меру «степени веры» индивидуума, оценивающего неопределенность конкретной ситуации. Эпистемическая или субъективная вероятность иногда называется доверием , в отличие от термина шанс для вероятности склонности. Некоторые примеры эпистемической вероятности — это присвоение вероятности утверждению о том, что предложенный закон физики истинен, или определение вероятности того, что подозреваемый совершил преступление, на основе представленных доказательств. Использование байесовской вероятности поднимает философские дебаты о том, может ли она способствовать обоснованным обоснованиям веры . Байесовцы указывают на работу Рэмси [10] (стр. 182) и де Финетти [8] (стр. 103) как на доказательство того, что субъективные убеждения должны следовать законам вероятности, если они хотят быть последовательными. [22] Доказательства ставят под сомнение то, что у людей будут последовательные убеждения. [23] [24] Использование байесовской вероятности подразумевает указание априорной вероятности . Это может быть получено из рассмотрения того, является ли требуемая априорная вероятность большей или меньшей, чем референтная вероятность [ необходимо разъяснение ] , связанная с моделью урны или мысленным экспериментом . Проблема в том, что для данной проблемы могут применяться несколько мысленных экспериментов, и выбор одного из них является вопросом суждения: разные люди могут назначать разные априорные вероятности, известные как проблема референтного класса . « Проблема восхода солнца » является примером.
Сторонники теории предрасположенности рассматривают вероятность как физическую предрасположенность, или расположение, или тенденцию данного типа физической ситуации давать результат определенного вида или давать долгосрочную относительную частоту такого результата. [25] Этот вид объективной вероятности иногда называют «шансом».
Склонности или шансы — это не относительные частоты, а предполагаемые причины наблюдаемых стабильных относительных частот. Склонности используются для объяснения того, почему повторение определенного вида эксперимента будет генерировать заданные типы результатов с постоянной скоростью, которые известны как склонности или шансы. Сторонники частотности не могут использовать этот подход, поскольку относительные частоты не существуют для отдельных подбрасываний монеты, а только для больших ансамблей или коллективов (см. «возможный единичный случай» в таблице выше). [2] Напротив, сторонники пропенсити могут использовать закон больших чисел для объяснения поведения долгосрочных частот. Этот закон, который является следствием аксиом вероятности, гласит, что если (например) монету подбрасывают многократно, таким образом, что вероятность выпадения орла одинакова при каждом подбрасывании, а результаты вероятностно независимы, то относительная частота выпадения орла будет близка к вероятности выпадения орла при каждом отдельном подбрасывании. Этот закон допускает, что стабильные долгосрочные частоты являются проявлением инвариантных единичных вероятностей. Помимо объяснения возникновения стабильных относительных частот, идея склонности мотивируется желанием придать смысл единичным вероятностным атрибуциям в квантовой механике, таким как вероятность распада конкретного атома в определенное время.
Основная проблема, с которой сталкиваются теории предрасположенности, — это точно сказать, что означает предрасположенность. (И затем, конечно, показать, что предрасположенность, определенная таким образом, обладает требуемыми свойствами.) К сожалению, в настоящее время ни одно из общепризнанных описаний предрасположенности не приближается к решению этой проблемы.
Теория склонности вероятности была предложена Чарльзом Сандерсом Пирсом . [26] [27] [28] [29] Более поздняя теория склонности была предложена философом Карлом Поппером , который, однако, был лишь поверхностно знаком с трудами К. С. Пирса. [26] [27] Поппер заметил, что результат физического эксперимента производится определенным набором «порождающих условий». Когда мы повторяем эксперимент, как говорится, мы на самом деле проводим другой эксперимент с (более или менее) похожим набором порождающих условий. Сказать, что набор порождающих условий имеет склонность p к получению результата E , означает, что эти точные условия, если их повторять бесконечно, дадут последовательность результатов, в которой E произойдет с предельной относительной частотой p . Для Поппера тогда детерминированный эксперимент будет иметь склонность 0 или 1 для каждого результата, поскольку эти порождающие условия будут иметь тот же результат в каждом испытании. Другими словами, нетривиальные склонности (отличные от 0 и 1) существуют только для действительно недетерминированных экспериментов.
Ряд других философов, включая Дэвида Миллера и Дональда А. Джиллиса , предложили теории склонностей, несколько схожие с теорией Поппера.
Другие теоретики предрасположенности (например, Рональд Гир [30] ) вообще не определяют предрасположенности явно, а скорее рассматривают предрасположенность как определяемую теоретической ролью, которую она играет в науке. Они утверждали, например, что физические величины, такие как электрический заряд, также не могут быть явно определены в терминах более базовых вещей, а только в терминах того, что они делают (например, притягивают и отталкивают другие электрические заряды). Аналогичным образом предрасположенность — это то, что заполняет различные роли, которые физическая вероятность играет в науке.
Какую роль играет физическая вероятность в науке? Каковы ее свойства? Одним из центральных свойств случайности является то, что, будучи известным, она заставляет рациональное убеждение принимать одно и то же числовое значение. Дэвид Льюис назвал это Главным принципом [1] (3.3 и 3.5) , термин, который в основном приняли философы. Например, предположим, что вы уверены, что конкретная несимметричная монета имеет склонность 0,32 выпадать орлом каждый раз, когда ее подбрасывают. Какова тогда правильная цена для азартной игры, которая приносит 1 доллар, если монета выпадает орлом, и ничего в противном случае? Согласно Главному принципу, справедливая цена составляет 32 цента.
Широко признано, что термин «вероятность» иногда используется в контекстах, где он не имеет ничего общего с физической случайностью. Рассмотрим, например, утверждение, что вымирание динозавров, вероятно, было вызвано падением на Землю большого метеорита. Такие утверждения, как «Гипотеза H, вероятно, верна», интерпретируются как означающие, что (имеющиеся в настоящее время) эмпирические доказательства (например, E) подтверждают H в высокой степени. Эта степень поддержки H со стороны E была названа логической , или эпистемической , или индуктивной вероятностью H при условии E.
Различия между этими интерпретациями довольно невелики и могут показаться несущественными. Один из главных пунктов разногласий заключается в отношении между вероятностью и верой. Логические вероятности понимаются (например, в « Трактате о вероятности » Кейнса [12] ) как объективные, логические отношения между суждениями (или предложениями) и, следовательно, не зависят никоим образом от веры. Они являются степенями (частичного) вывода или степенями логического следствия , а не степенями веры . (Тем не менее, они диктуют надлежащие степени веры, как обсуждается ниже.) Фрэнк П. Рэмси , с другой стороны, скептически относился к существованию таких объективных логических отношений и утверждал, что (доказательная) вероятность — это «логика частичной веры». [10] (стр. 157) Другими словами, Рэмси считал, что эпистемические вероятности — это просто степени рациональной веры, а не логические отношения, которые просто ограничивают степени рациональной веры.
Другой пункт разногласий касается уникальности доказательной вероятности относительно данного состояния знания. Рудольф Карнап считал, например, что логические принципы всегда определяют уникальную логическую вероятность для любого утверждения относительно любого набора доказательств. Рэмси, напротив, считал, что, хотя степени убеждения подчиняются некоторым рациональным ограничениям (таким как, но не ограничиваясь, аксиомами вероятности), эти ограничения обычно не определяют уникального значения. Другими словами, рациональные люди могут несколько отличаться по своим степеням убеждения, даже если все они имеют одинаковую информацию.
Альтернативный подход к вероятности подчеркивает роль предсказания — предсказания будущих наблюдений на основе прошлых наблюдений, а не ненаблюдаемых параметров. В своей современной форме он в основном в байесовском ключе. Это была основная функция вероятности до 20-го века, [31] но вышла из моды по сравнению с параметрическим подходом, который моделировал явления как физическую систему, наблюдаемую с ошибкой, например, в небесной механике .
Современный прогностический подход был впервые предложен Бруно де Финетти , его центральной идеей была взаимозаменяемость — будущие наблюдения должны вести себя как прошлые наблюдения. [31] Эта точка зрения привлекла внимание англоязычного мира с переводом книги де Финетти в 1974 году [31] и с тех пор была выдвинута такими статистиками, как Сеймур Гейссер .
Математику вероятности можно разработать на полностью аксиоматической основе, которая не зависит от какой-либо интерпретации: для подробного изучения см. статьи по теории вероятностей и аксиомам вероятности .