В теории вероятностей теория больших отклонений касается асимптотического поведения удаленных хвостов последовательностей вероятностных распределений. Хотя некоторые основные идеи теории можно проследить до Лапласа , формализация началась со страховой математики, а именно теории разорения Крамера и Лундберга . Единая формализация теории больших отклонений была разработана в 1966 году в статье Варадхана . [1] Теория больших отклонений формализует эвристические идеи концентрации мер и широко обобщает понятие сходимости вероятностных мер .
Грубо говоря, теория больших отклонений занимается экспоненциальным снижением вероятностных мер определенных видов экстремальных или хвостовых событий.
Любое большое отклонение совершается наименее маловероятным из всех маловероятных способов!
- Франк ден Холландер, Большие отклонения, с. 10
Рассмотрим последовательность независимых подбрасываний честной монеты. Возможными результатами могут быть орел или решка. Обозначим возможный результат i-го испытания как , где орел кодируется как 1, а решка как 0. Теперь обозначим среднее значение после испытаний, а именно
Тогда лежит между 0 и 1. Из закона больших чисел следует, что с ростом N распределение сходится к (ожидаемому значению одного подбрасывания монеты).
Более того, по центральной предельной теореме следует, что распределено приблизительно нормально для больших . Центральная предельная теорема может предоставить более подробную информацию о поведении , чем закон больших чисел. Например, мы можем приблизительно найти вероятность хвоста – вероятность того, что больше некоторого значения – для фиксированного значения . Однако приближение по центральной предельной теореме может быть неточным, если далеко от и недостаточно велико. Кроме того, оно не дает информации о сходимости вероятностей хвоста при . Однако теория больших отклонений может дать ответы на такие проблемы.
Давайте сделаем это утверждение более точным. Для заданного значения вычислим вероятность хвоста . Определим
Обратите внимание, что функция является выпуклой, неотрицательной функцией, которая равна нулю при и увеличивается при приближении к . Это отрицательная энтропия Бернулли с ; то, что она подходит для подбрасывания монеты, следует из свойства асимптотического равнораспределения, примененного к испытанию Бернулли . Тогда с помощью неравенства Чернова можно показать, что . [2] Эта граница довольно точная, в том смысле, что не может быть заменена большим числом, которое дало бы строгое неравенство для всех положительных . [3] (Однако экспоненциальную границу все еще можно уменьшить на субэкспоненциальный множитель порядка ; это следует из приближения Стирлинга, примененного к биномиальному коэффициенту, появляющемуся в распределении Бернулли .) Следовательно, мы получаем следующий результат:
Вероятность убывает экспоненциально как со скоростью, зависящей от x . Эта формула аппроксимирует любую хвостовую вероятность выборочного среднего iid-переменных и дает ее сходимость по мере увеличения числа выборок.
В приведенном выше примере подбрасывания монеты мы явно предположили, что каждое подбрасывание является независимым испытанием, и вероятность выпадения орла или решки всегда одинакова.
Пусть — независимые и одинаково распределенные (iid) случайные величины, общее распределение которых удовлетворяет определенному условию роста. Тогда существует следующий предел:
Здесь
как и прежде.
Функция называется « функцией скорости » или «функцией Крамера», а иногда «функцией энтропии».
Вышеупомянутый предел означает, что для больших ,
что является основным результатом теории больших отклонений. [4] [5]
Если мы знаем распределение вероятностей , можно получить явное выражение для функции скорости. Это дается преобразованием Лежандра–Фенхеля , [6]
где
называется кумулянтной производящей функцией (КПФ) и обозначает математическое ожидание .
Если распределение является нормальным , то функция скорости становится параболой с вершиной, соответствующей среднему значению нормального распределения.
Если — неприводимая и апериодическая цепь Маркова , то вариант основного результата больших отклонений, изложенный выше, может иметь место. [ необходима ссылка ]
Предыдущий пример контролировал вероятность события , то есть концентрацию закона на компактном множестве . Также возможно контролировать вероятность события для некоторой последовательности . Ниже приведен пример принципа умеренных отклонений : [7] [8]
Теорема — Пусть — последовательность центрированных независимых одинаковых переменных с конечной дисперсией, такая что . Определим . Тогда для любой последовательности :
В частности, предельным случаем является центральная предельная теорема .
Пусть задано польское пространство , пусть будет последовательностью борелевских вероятностных мер на , пусть будет последовательностью положительных действительных чисел, такой что , и, наконец, пусть будет полунепрерывным снизу функционалом на Говорят, что последовательность удовлетворяет принципу большого отклонения со скоростью и нормой тогда и только тогда, когда для каждого измеримого по Борелю множества ,
где и обозначают соответственно замыкание и внутреннюю часть . [ необходима ссылка ]
Первые строгие результаты, касающиеся больших отклонений, принадлежат шведскому математику Харальду Крамеру , который применил их для моделирования страхового бизнеса. [9] С точки зрения страховой компании, доход имеет постоянную ставку в месяц (ежемесячная премия), но претензии поступают случайным образом. Чтобы компания была успешной в течение определенного периода времени (предпочтительно многих месяцев), общий доход должен превышать общий размер претензии. Таким образом, чтобы оценить премию, вы должны задать следующий вопрос: «Какую премию мы должны выбрать, чтобы в течение месяцев общий размер претензии был меньше ?» Это, очевидно, тот же вопрос, который задает теория больших отклонений. Крамер дал решение этого вопроса для случайных величин iid , где функция ставки выражается в виде степенного ряда .
Крайне неполный список математиков, добившихся важных успехов, включает Петрова , [10] Санова , [11] С.Р.С. Варадхана (который получил премию Абеля за свой вклад в теорию), Д. Рюэля , О.Э. Ланфорда , Марка Фрейдлина , Александра Д. Вентцелля , Амира Дембо и Офера Зейтуни . [12]
Принципы больших отклонений могут эффективно применяться для сбора информации из вероятностной модели. Таким образом, теория больших отклонений находит свое применение в теории информации и управлении рисками . В физике наиболее известные приложения теории больших отклонений возникают в термодинамике и статистической механике (в связи со связью энтропии с функцией скорости).
Функция скорости связана с энтропией в статистической механике. Это можно эвристически увидеть следующим образом. В статистической механике энтропия конкретного макросостояния связана с числом микросостояний, которые соответствуют этому макросостоянию. В нашем примере с подбрасыванием монеты среднее значение может обозначать конкретное макросостояние. А конкретная последовательность орлов и решек, которая приводит к конкретному значению, составляет конкретное микросостояние. Грубо говоря, макросостояние, имеющее большее число микросостояний, приводящих к нему, имеет более высокую энтропию. И состояние с более высокой энтропией имеет более высокий шанс быть реализованным в реальных экспериментах. Макросостояние со средним значением 1/2 (столько же орлов, сколько и решек) имеет наибольшее число микросостояний, приводящих к нему, и это действительно состояние с самой высокой энтропией. И в большинстве практических ситуаций мы действительно получим это макросостояние для большого числа испытаний. С другой стороны, «функция скорости» измеряет вероятность появления конкретного макросостояния. Чем меньше функция скорости, тем выше вероятность появления макросостояния. В нашем подбрасывании монеты значение "функции скорости" для среднего значения, равного 1/2, равно нулю. Таким образом, можно рассматривать "функцию скорости" как отрицательную часть "энтропии".
Между «функцией скорости» в теории больших уклонений и дивергенцией Кульбака–Лейблера существует связь , установленная теоремой Санова (см. Санов [11] и Новак, [13] гл. 14.5).
В частном случае большие отклонения тесно связаны с понятием пределов Громова–Хаусдорфа . [14]