Часть серии по статистике |
Теория вероятностей |
---|
В математике случайное блуждание , иногда называемое « прогулкой пьяницы» , — это стохастический процесс , описывающий путь, состоящий из последовательности случайных шагов в некотором математическом пространстве .
Элементарным примером случайного блуждания является случайное блуждание по прямой целых чисел , которое начинается с 0 и на каждом шаге перемещается на +1 или −1 с равной вероятностью . Другие примеры включают путь, проложенный молекулой , когда она движется в жидкости или газе (см. Броуновское движение ), путь поиска животного , ищущего пищу , или цену колеблющейся акции и финансовое положение игрока . Случайные блуждания имеют приложения к инженерии и многим научным областям, включая экологию , психологию , информатику , физику , химию , биологию , экономику и социологию . Термин «случайное блуждание» был впервые введен Карлом Пирсоном в 1905 году. [1]
Реализации случайных блужданий могут быть получены с помощью моделирования Монте-Карло . [2]
Популярная модель случайного блуждания — это модель случайного блуждания по регулярной решетке, где на каждом шаге местоположение переходит на другой сайт в соответствии с некоторым распределением вероятностей. В простом случайном блуждании местоположение может переходить только на соседние сайты решетки, образуя путь решетки . В простом симметричном случайном блуждании по локально конечной решетке вероятности перехода местоположения к каждому из его непосредственных соседей одинаковы. Наиболее изученным примером является случайное блуждание по d -мерной целочисленной решетке (иногда называемой гиперкубической решеткой) . [3]
Если пространство состояний ограничено конечными размерами, модель случайного блуждания называется простым симметричным случайным блужданием с границей , а вероятности перехода зависят от местоположения состояния, поскольку в пограничных и угловых состояниях движение ограничено. [4]
Простейшим примером случайного блуждания является случайное блуждание по прямой целых чисел, которое начинается с 0 и на каждом шаге перемещается на +1 или −1 с равной вероятностью.
Эту прогулку можно проиллюстрировать следующим образом. Маркер помещается на нулевую позицию на числовой прямой, и подбрасывается честная монета. Если выпадает орел, маркер перемещается на одну единицу вправо. Если выпадает решка, маркер перемещается на одну единицу влево. После пяти подбрасываний маркер может оказаться на -5, -3, -1, 1, 3, 5. При пяти подбрасываниях, трех орлах и двух решках в любом порядке он приземлится на 1. Существует 10 способов приземлиться на 1 (перевернув три орла и две решки), 10 способов приземлиться на −1 (перевернув три решки и два орла), 5 способов приземлиться на 3 (перевернув четыре орла и одну решку), 5 способов приземлиться на −3 (перевернув четыре решки и одну решку), 1 способ приземлиться на 5 (перевернув пять орлов) и 1 способ приземлиться на −5 (перевернув пять решек). На рисунке ниже показаны возможные результаты 5 подбрасываний.
Чтобы формально определить этот блуждание, возьмем независимые случайные величины , где каждая переменная равна 1 или −1 с вероятностью 50% для любого значения, и установим и Ряд называется простым случайным блужданием по . Этот ряд (сумма последовательности −1 и 1) дает чистое пройденное расстояние, если каждая часть блуждания имеет длину один. Математическое ожидание равно нулю . То есть среднее значение всех подбрасываний монеты стремится к нулю по мере увеличения числа подбрасываний. Это следует из свойства конечной аддитивности математического ожидания:
Аналогичный расчет, использующий независимость случайных величин и тот факт, что , показывает, что:
Это намекает , что ожидаемое расстояние перевода после n шагов должно быть порядка . Фактически, [5]
Чтобы ответить на вопрос, сколько раз случайное блуждание пересечет граничную линию, если ему будет разрешено продолжать идти вечно, простое случайное блуждание пересечет каждую точку бесконечное число раз. У этого результата есть много названий: явление пересечения уровня , повторение или разорение игрока . Причина последнего названия следующая: игрок с конечной суммой денег в конечном итоге проиграет, играя в честную игру против банка с бесконечной суммой денег. Деньги игрока совершат случайное блуждание, и в какой-то момент достигнут нуля, и игра будет окончена.
Если a и b — положительные целые числа, то ожидаемое количество шагов до того, как одномерное простое случайное блуждание, начинающееся с 0, впервые попадет в b или − a , равно ab . Вероятность того, что это блуждание попадет в b до − a , равна , что можно вывести из того факта, что простое случайное блуждание является мартингалом . И эти ожидания и вероятности попадания можно вычислить в общей одномерной цепи Маркова случайного блуждания.
Некоторые из результатов, упомянутых выше, можно вывести из свойств треугольника Паскаля . Количество различных блужданий из n шагов, где каждый шаг равен +1 или −1, равно 2 n . Для простого случайного блуждания каждое из этих блужданий равновероятно. Для того чтобы S n было равно числу k, необходимо и достаточно, чтобы количество +1 в блуждании превышало количество −1 на k . Из этого следует, что +1 должно появляться ( n + k )/2 раз среди n шагов блуждания, следовательно, количество блужданий, которые удовлетворяют , равно количеству способов выбора ( n + k )/2 элементов из множества n элементов, [6] обозначаемых . Для того чтобы это имело смысл, необходимо, чтобы n + k было четным числом, что подразумевает, что n и k либо оба четные, либо оба нечетные. Следовательно, вероятность того, что равно . Представляя элементы треугольника Паскаля в терминах факториалов и используя формулу Стирлинга , можно получить хорошие оценки этих вероятностей для больших значений .
Если для краткости ограничиться знаком +, то количество способов, которыми случайное блуждание попадет на любое заданное число, имея пять подбрасываний, можно записать как {0,5,0,4,0,1}.
Эта связь с треугольником Паскаля демонстрируется для малых значений n . При нулевом числе оборотов единственной возможностью будет остаться на нуле. Однако при одном обороте есть один шанс приземлиться на −1 или один шанс приземлиться на 1. При двух оборотах маркер на 1 может переместиться на 2 или обратно на ноль. Маркер на −1 может переместиться на −2 или обратно на ноль. Следовательно, есть один шанс приземлиться на −2, два шанса приземлиться на ноль и один шанс приземлиться на 2.
к | −5 | −4 | −3 | −2 | −1 | 0 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | |||||||||||
1 | 1 | ||||||||||
1 | 2 | 1 | |||||||||
1 | 3 | 3 | 1 | ||||||||
1 | 4 | 6 | 4 | 1 | |||||||
1 | 5 | 10 | 10 | 5 | 1 |
Центральная предельная теорема и закон повторного логарифма описывают важные аспекты поведения простых случайных блужданий на . В частности, первая подразумевает, что с ростом n вероятности (пропорциональные числам в каждой строке) приближаются к нормальному распределению .
Если быть точным, то, зная это , и используя формулу Стирлинга, можно
Фиксируя масштабирование для фиксированного и используя расширение при исчезновении, следует
взяв предел (и заметив, что соответствует шагу сетки масштабирования), находим гауссовскую плотность . Действительно, для абсолютно непрерывной случайной величины с плотностью справедливо , с соответствующим бесконечно малым шагом.
В качестве прямого обобщения можно рассмотреть случайные блуждания по кристаллическим решеткам (бесконечнократные абелевы покрывающие графы над конечными графами). На самом деле, в этой постановке можно установить центральную предельную теорему и теорему о больших отклонениях. [7] [8]
Одномерное случайное блуждание можно также рассматривать как цепь Маркова , пространство состояний которой задается целыми числами. Для некоторого числа p, удовлетворяющего , вероятности перехода (вероятность P i,j перехода из состояния i в состояние j ) задаются выражением
Гетерогенное случайное блуждание рисует на каждом временном шаге случайное число, которое определяет локальные вероятности прыжков, а затем случайное число, которое определяет фактическое направление прыжка. Главный вопрос заключается в вероятности остаться в каждом из различных мест после прыжков, и в пределе этой вероятности, когда очень велико.
В более высоких измерениях набор случайно пройденных точек обладает интересными геометрическими свойствами. Фактически, получается дискретный фрактал , то есть набор, который демонстрирует стохастическое самоподобие в больших масштабах. В малых масштабах можно наблюдать «зубчатость», возникающую из-за сетки, по которой выполняется прогулка. Траектория случайной прогулки — это набор посещенных точек, рассматриваемых как набор без учета того, когда прогулка достигла точки. В одном измерении траектория — это просто все точки между минимальной высотой и максимальной высотой, достигнутой при прогулке (обе, в среднем, имеют порядок ).
Чтобы визуализировать двумерный случай, можно представить себе человека, хаотично идущего по городу. Город фактически бесконечен и организован в квадратную сетку тротуаров. На каждом перекрестке человек случайным образом выбирает один из четырех возможных маршрутов (включая тот, по которому он изначально ехал). Формально это случайное блуждание по множеству всех точек плоскости с целочисленными координатами .
Чтобы ответить на вопрос о том, вернется ли человек когда-либо в исходную точку прогулки, вот двумерный эквивалент проблемы пересечения уровней, обсуждавшейся выше. В 1921 году Джордж Полиа доказал, что человек почти наверняка вернется в двумерном случайном блуждании, но для трех измерений или выше вероятность возвращения в начало уменьшается с увеличением числа измерений. В трех измерениях вероятность уменьшается примерно до 34%. [9] Известно, что математик Сидзуо Какутани ссылался на этот результат следующей цитатой: «Пьяный человек найдет дорогу домой, но пьяная птица может потеряться навсегда». [10]
Вероятность повторения в общем случае равна , что можно вывести с помощью производящих функций [11] или процесса Пуассона. [12]
Другой вариант этого вопроса, который также задавал Полиа, звучит так: «если два человека выходят из одной и той же отправной точки, то встретятся ли они когда-нибудь снова?» [13] Можно показать, что разница между их местоположениями (два независимых случайных блуждания) также является простым случайным блужданием, поэтому они почти наверняка встретятся снова в двумерном блуждании, но для 3 измерений и выше вероятность уменьшается с числом измерений. Пол Эрдёш и Сэмюэл Джеймс Тейлор также показали в 1960 году, что для измерений, меньших или равных 4, два независимых случайных блуждания, начинающихся из любых двух заданных точек, имеют бесконечно много пересечений почти наверняка, но для измерений выше 5 они почти наверняка пересекаются только конечное число раз. [14]
Асимптотическая функция для двумерного случайного блуждания по мере увеличения числа шагов задается распределением Рэлея . Распределение вероятностей является функцией радиуса от начала координат, а длина шага постоянна для каждого шага. Здесь длина шага предполагается равной 1, N — общее число шагов, а r — радиус от начала координат. [15]
Винеровский процесс — это стохастический процесс, поведение которого похоже на броуновское движение , физическое явление диффузии мельчайшей частицы в жидкости. (Иногда винеровский процесс называют «броуновским движением», хотя, строго говоря, это путаница между моделью и моделируемым явлением.)
Процесс Винера — это предел масштабирования случайного блуждания в размерности 1. Это означает, что если есть случайное блуждание с очень малыми шагами, то существует приближение к процессу Винера (и, менее точно, к броуновскому движению). Точнее, если размер шага равен ε, нужно совершить блуждание длиной L /ε 2 , чтобы приблизиться к длине Винера L . Когда размер шага стремится к 0 (и число шагов увеличивается пропорционально), случайное блуждание сходится к процессу Винера в соответствующем смысле. Формально, если B — это пространство всех путей длины L с максимальной топологией, а если M — это пространство меры над B с топологией нормы, то сходимость имеет место в пространстве M . Аналогично, процесс Винера в нескольких измерениях — это предел масштабирования случайного блуждания в том же числе измерений.
Случайное блуждание — это дискретный фрактал (функция с целочисленными размерностями; 1, 2, ...), но траектория винеровского процесса — это настоящий фрактал, и между ними есть связь. Например, совершайте случайное блуждание, пока оно не достигнет окружности радиуса r , умноженного на длину шага. Среднее число шагов, которые оно совершает, равно r 2 . [ необходима цитата ] Этот факт является дискретной версией того факта, что блуждание винеровского процесса — это фрактал размерности Хаусдорфа 2. [ необходима цитата ]
В двух измерениях среднее число точек, которые одно и то же случайное блуждание имеет на границе своей траектории, равно r 4/3 . Это соответствует тому факту, что граница траектории винеровского процесса является фракталом размерности 4/3, факт, предсказанный Мандельбротом с помощью моделирования, но доказанный только в 2000 году Лоулером , Шраммом и Вернером . [16]
Процесс Винера обладает многими симметриями, которых нет у случайного блуждания. Например, блуждание процесса Винера инвариантно к поворотам, но случайное блуждание — нет, поскольку лежащая в основе сетка — нет (случайное блуждание инвариантно к поворотам на 90 градусов, но процессы Винера инвариантны также к поворотам, например, на 17 градусов). Это означает, что во многих случаях проблемы случайного блуждания проще решить, переведя их в процесс Винера, решив задачу там, а затем переведя обратно. С другой стороны, некоторые проблемы проще решить с помощью случайных блужданий из-за их дискретной природы.
Случайное блуждание и винеровский процесс могут быть связаны , а именно проявляться на одном и том же вероятностном пространстве зависимым образом, что заставляет их быть довольно близкими. Простейшей такой связью является вложение Скорохода , но существуют и более точные связи, такие как теорема аппроксимации Комлоша–Майора–Тушнади .
Сходимость случайного блуждания к винеровскому процессу контролируется центральной предельной теоремой и теоремой Донскера . Для частицы в известной фиксированной позиции при t = 0 центральная предельная теорема говорит нам, что после большого числа независимых шагов в случайном блуждании положение блуждающего распределяется в соответствии с нормальным распределением полной дисперсии :
где t — время, прошедшее с начала случайного блуждания, — размер шага случайного блуждания, — время, прошедшее между двумя последовательными шагами.
Это соответствует функции Грина уравнения диффузии , которое управляет винеровским процессом, что предполагает, что после большого числа шагов случайное блуждание сходится к винеровскому процессу.
В трехмерном пространстве дисперсия, соответствующая функции Грина уравнения диффузии, равна:
Приравнивая эту величину к дисперсии, связанной с положением случайного блуждающего, получаем эквивалентный коэффициент диффузии, который следует учитывать для асимптотического винеровского процесса, к которому случайное блуждание сходится после большого числа шагов: (справедливо только в 3D).
Два выражения дисперсии выше соответствуют распределению, связанному с вектором , который связывает два конца случайного блуждания, в 3D. Дисперсия, связанная с каждым компонентом , или составляет только одну треть этого значения (все еще в 3D).
Для 2D: [17]
Для 1D: [18]
Случайное блуждание с размером шага, изменяющимся в соответствии с нормальным распределением, используется в качестве модели для реальных временных рядов данных, таких как финансовые рынки.
Здесь размер шага представляет собой обратное кумулятивное нормальное распределение, где 0 ≤ z ≤ 1 — равномерно распределенное случайное число, а μ и σ — среднее значение и стандартное отклонение нормального распределения соответственно.
Если μ не равно нулю, случайное блуждание будет изменяться около линейного тренда. Если v s — начальное значение случайного блуждания, ожидаемое значение после n шагов будет v s + n μ.
Для особого случая, когда μ равно нулю, после n шагов распределение вероятностей расстояния перевода задается выражением N (0, n σ 2 ), где N () — обозначение нормального распределения, n — число шагов, а σ — из обратного кумулятивного нормального распределения, как указано выше.
Доказательство: Гауссовское случайное блуждание можно рассматривать как сумму последовательности независимых и одинаково распределенных случайных величин, X i из обратного кумулятивного нормального распределения со средним значением, равным нулю, и σ исходного обратного кумулятивного нормального распределения:
но у нас есть распределение для суммы двух независимых нормально распределенных случайных величин, Z = X + Y , которое задается формулой (см. здесь) .
В нашем случае μ X = μ Y = 0 и σ 2 X = σ 2 Y = σ 2 получаем По индукции для n шагов имеем Для шагов, распределенных в соответствии с любым распределением с нулевым средним и конечной дисперсией (не обязательно только нормальным распределением), среднеквадратичное расстояние перевода после n шагов равно (см. тождество Бьенеме )
Но для гауссовского случайного блуждания это всего лишь стандартное отклонение распределения расстояния трансляции после n шагов. Следовательно, если μ равно нулю, и поскольку среднеквадратичное (RMS) расстояние трансляции равно одному стандартному отклонению, существует 68,27% вероятность того, что RMS расстояние трансляции после n шагов попадет в диапазон . Аналогично, существует 50% вероятность того, что расстояние трансляции после n шагов попадет в диапазон .
Число отдельных мест, посещаемых одним случайным блуждающим, было тщательно изучено для квадратных и кубических решеток и для фракталов. [19] [20] Эта величина полезна для анализа проблем захвата и кинетических реакций. Она также связана с вибрационной плотностью состояний, [21] [22] процессами диффузионных реакций [23] и распространением популяций в экологии. [24] [25]
Скорость информации гауссовского случайного блуждания относительно квадратичного расстояния ошибки, т.е. его квадратичная функция искажения скорости , задается параметрически [26] где . Следовательно, невозможно закодировать с помощью двоичного кода размером менее бит и восстановить его с ожидаемой среднеквадратической ошибкой, меньшей . С другой стороны, для любого существует достаточно большой и двоичный код из не более различных элементов такой, что ожидаемая среднеквадратическая ошибка при восстановлении из этого кода не превышает .
This section needs additional citations for verification. (February 2013) |
Как уже упоминалось, диапазон природных явлений, которые были предметом попыток описания с помощью некоторого вида случайных блужданий, значителен, особенно в физике [27] [28] и химии, [29] материаловедении , [30] [31] и биологии. [32] [33] [34] Ниже приведены некоторые конкретные применения случайных блужданий:
Были рассмотрены несколько типов стохастических процессов , которые похожи на чистые случайные блуждания, но где простая структура может быть более обобщенной. Чистая структура может быть охарактеризована шагами, определяемыми независимыми и одинаково распределенными случайными величинами . Случайные блуждания могут происходить на различных пространствах, таких как графы , целые числа, вещественная прямая, плоскость или многомерные векторные пространства, на криволинейных поверхностях или многообразиях Римана более высокой размерности и на группах . Также возможно определить случайные блуждания, которые совершают свои шаги в случайные моменты времени, и в этом случае положение X
тдолжно быть определено для всех времен t ∈ [0, +∞) . Конкретные случаи или пределы случайных блужданий включают в себя модели полета Леви и диффузии, такие как броуновское движение .
Случайное блуждание длины k на возможно бесконечном графе G с корнем 0 является стохастическим процессом со случайными величинами, таким что и является вершиной, выбранной равномерно случайным образом из соседей . Тогда число является вероятностью того, что случайное блуждание длины k, начинающееся в v, заканчивается в w . В частности, если G является графом с корнем 0 , является вероятностью того, что -шаговое случайное блуждание возвращается в 0 .
Основываясь на аналогии из предыдущего раздела о более высоких измерениях, предположим теперь, что наш город больше не является идеальной квадратной сеткой. Когда наш человек достигает определенного перекрестка, он выбирает между различными доступными дорогами с равной вероятностью. Таким образом, если перекресток имеет семь съездов, человек поедет на каждый из них с вероятностью одна седьмая. Это случайное блуждание на графике. Дойдет ли наш человек до своего дома? Оказывается, что при довольно мягких условиях ответ все еще да, [44] но в зависимости от графика ответ на вариантный вопрос «Встретятся ли два человека снова?» может не быть тем, что они встречаются бесконечно часто почти наверняка. [45]
Примером случая, когда человек почти наверняка доберется до своего дома, является случай, когда длины всех блоков находятся в диапазоне от a до b (где a и b — любые два конечных положительных числа). Обратите внимание, что мы не предполагаем, что граф является плоским , т. е. город может содержать туннели и мосты. Один из способов доказать этот результат — использовать подключение к электрическим сетям . Возьмите карту города и поместите резистор сопротивлением 1 Ом на каждый блок. Теперь измерьте «сопротивление между точкой и бесконечностью». Другими словами, выберите некоторое число R и возьмите все точки в электрической сети, расстояние от которой до нашей точки больше R, и соедините их проводами. Теперь это конечная электрическая сеть, и мы можем измерить сопротивление от нашей точки до точек с проводами. Увеличьте R до бесконечности. Предел называется сопротивлением между точкой и бесконечностью . Оказывается, что верно следующее (элементарное доказательство можно найти в книге Дойла и Снелла):
Теорема : граф является переходным тогда и только тогда, когда сопротивление между точкой и бесконечностью конечно. Неважно, какая точка выбрана, если граф связен.
Другими словами, в переходной системе достаточно преодолеть конечное сопротивление, чтобы из любой точки достичь бесконечности. В возвратной системе сопротивление от любой точки до бесконечности бесконечно.
Эта характеристика мимолетности и повторяемости очень полезна и, в частности, позволяет нам проанализировать случай города, нарисованного на плоскости с ограниченными расстояниями.
Случайное блуждание по графу является очень частным случаем цепи Маркова . В отличие от общей цепи Маркова, случайное блуждание по графу обладает свойством, называемым симметрией времени или обратимостью . Грубо говоря, это свойство, также называемое принципом детального баланса , означает, что вероятности прохождения заданного пути в одном или другом направлении имеют очень простую связь между собой (если граф регулярен , они просто равны). Это свойство имеет важные последствия.
Начиная с 1980-х годов, многие исследования были направлены на связь свойств графа со случайными блужданиями. В дополнение к описанной выше электрической сетевой связи, существуют важные связи с изопериметрическими неравенствами , см. больше здесь , функциональными неравенствами, такими как неравенства Соболева и Пуанкаре , и свойствами решений уравнения Лапласа . Значительная часть этих исследований была сосредоточена на графах Кэли конечно порожденных групп . Во многих случаях эти дискретные результаты переносятся на многообразия и группы Ли или выводятся из них .
В контексте случайных графов , в частности модели Эрдёша–Реньи , были получены аналитические результаты для некоторых свойств случайных блуждающих. Они включают распределение первого [46] и последнего времени попадания [47] блуждающего, где первое время попадания дается первым разом, когда блуждающий ступает на ранее посещенный участок графа, а последнее время попадания соответствует первому разу, когда блуждающий не может выполнить дополнительный ход без повторного посещения ранее посещенного участка.
Хорошим справочником по случайным блужданиям на графах является онлайн-книга Олдоса и Филла. Для групп см. книгу Воесса. Если ядро перехода само по себе случайно (на основе среды ), то случайное блуждание называется «случайным блужданием в случайной среде». Когда закон случайного блуждания включает случайность , закон называется отожженным законом; с другой стороны, если рассматривается как фиксированный, закон называется погашенным законом. См. книгу Хьюза, книгу Ревеса или лекции Зейтуни.
Мы можем думать о выборе каждого возможного ребра с той же вероятностью, что и о локальной максимизации неопределенности (энтропии). Мы также могли бы сделать это глобально — в случайном блуждании с максимальной энтропией (MERW) мы хотим, чтобы все пути были равновероятными, или, другими словами: для каждых двух вершин каждый путь заданной длины равновероятен. [48] Это случайное блуждание имеет гораздо более сильные свойства локализации.
Существует ряд интересных моделей случайных путей, в которых каждый шаг зависит от прошлого сложным образом. Все они более сложны для аналитического решения, чем обычное случайное блуждание; тем не менее, поведение любой модели случайного блуждания может быть получено с помощью компьютеров. Вот некоторые примеры:
Самоизбегающий путь длины n на является случайным n -шаговым путем, который начинается в начале координат, совершает переходы только между соседними сайтами в , никогда не посещает сайт повторно и выбирается равномерно среди всех таких путей. В двух измерениях из-за самозахвата типичный самоизбегающий путь очень короткий, [50] тогда как в более высоком измерении он растет за пределы всех границ. Эта модель часто использовалась в физике полимеров (с 1960-х годов).
Случайное блуждание, выбранное для максимизации скорости энтропии , имеет гораздо более сильные свойства локализации.
Случайные блуждания, где направление движения в один момент времени коррелирует с направлением движения в следующий момент времени. Используется для моделирования движений животных. [55] [56]