В комбинаторике проблема голосования Бертрана — это вопрос: «На выборах , где кандидат А получает p голосов, а кандидат В получает q голосов, причем p > q , какова вероятность того , что А будет строго опережать В на протяжении всего подсчета, при условии, что голоса подсчитываются в случайно выбранном порядке?» Ответ:
Результат был впервые опубликован У. А. Уитвортом в 1878 году, но назван в честь Жозефа Луи Франсуа Бертрана, который заново открыл его в 1887 году . [1] [2] [3] [4] [5]
В оригинальной статье Бертрана он набрасывает доказательство, основанное на общей формуле для числа благоприятных последовательностей с использованием рекурсивного отношения . Он замечает, что кажется вероятным, что такой простой результат может быть доказан более прямым методом. Такое доказательство было дано Дезире Андре [6] , основанное на наблюдении, что неблагоприятные последовательности можно разделить на два равновероятных случая, один из которых (случай, когда B получает первый голос) легко вычисляется; он доказывает равенство явной биекцией . Разновидность его метода широко известна как метод отражения Андре , хотя Андре не использовал никаких отражений. [7]
Теорема Бертрана о бюллетене связана с леммой о цикле . Они дают похожие формулы, но лемма о цикле рассматривает циклические сдвиги заданного порядка подсчета бюллетеней, а не все перестановки.
Предположим, что есть 5 избирателей, из которых 3 голосуют за кандидата A и 2 голосуют за кандидата B (то есть p = 3 и q = 2). Существует десять равновероятных порядков, в которых можно подсчитать голоса:
Для порядка AABAB подсчет голосов по ходу выборов будет следующим:
Кандидат | А | А | Б | А | Б |
---|---|---|---|---|---|
А | 1 | 2 | 2 | 3 | 3 |
Б | 0 | 0 | 1 | 1 | 2 |
Для каждого столбца счет для A всегда больше счета для B , поэтому A всегда строго впереди B. Для порядка AABBA счет голосов по ходу выборов следующий:
Кандидат | А | А | Б | Б | А |
---|---|---|---|---|---|
А | 1 | 2 | 2 | 2 | 3 |
Б | 0 | 0 | 1 | 2 | 2 |
Для этого порядка B делит с A после четвертого голоса, поэтому A не всегда строго впереди B. Из 10 возможных порядков A всегда впереди B только для AAABB и AABAB . Поэтому вероятность того, что A всегда будет строго впереди, равна
и это действительно равно тому, что предсказывает теорема.
Вместо того чтобы вычислять вероятность того, что случайный порядок подсчета голосов обладает желаемым свойством, можно вместо этого вычислить количество благоприятных порядков подсчета, а затем разделить на общее количество способов, которыми могли быть подсчитаны голоса. (Это метод, который использовал Бертран.) Общее количество способов — это биномиальный коэффициент ; доказательство Бертрана показывает, что количество благоприятных порядков, в которых следует подсчитывать голоса, равно (хотя он не приводит это число явно). И действительно, после деления это дает .
Другая связанная проблема — вычислить количество случайных блужданий по целым числам , состоящим из n шагов единичной длины, начинающихся в начале и заканчивающихся в точке m , которые никогда не становятся отрицательными. Поскольку n и m имеют одинаковую четность и , это число равно
Когда и четно, это дает число Каталана . Таким образом, вероятность того, что случайное блуждание никогда не будет отрицательным и вернется в начало в момент времени, равна . По формуле Стирлинга, когда , эта вероятность равна .
[Обратите внимание, что имеют одинаковую четность следующим образом: пусть будет числом «положительных» ходов, т. е. вправо, а пусть будет числом «отрицательных» ходов, т. е. влево. Поскольку и , то имеем и . Поскольку и являются целыми числами, имеют одинаковую четность]
Чтобы A был строго впереди B на протяжении всего подсчета голосов, не может быть никаких ничьих. Разделите последовательности подсчета в соответствии с первым голосованием. Любая последовательность, которая начинается с голоса за B, должна достичь ничьей в какой-то момент, потому что A в конечном итоге побеждает. Для любой последовательности, которая начинается с A и достигает ничьей, отразите голоса до точки первой ничьей (так, чтобы любой A стал B, и наоборот), чтобы получить последовательность, которая начинается с B. Следовательно, каждая последовательность, которая начинается с A и достигает ничьей, находится во взаимно-однозначном соответствии с последовательностью, которая начинается с B, и вероятность того, что последовательность начинается с B, равна , поэтому вероятность того, что A всегда лидирует в голосовании, равна
Другой метод доказательства — математическая индукция :
Простое доказательство основано на лемме о цикле Дворецкого и Моцкина. [8] Назовем последовательность бюллетеней доминирующей, если A строго опережает B на протяжении всего подсчета голосов. Лемма о цикле утверждает, что любая последовательность A и B, где , имеет точно доминирующие циклические перестановки. Чтобы увидеть это, просто расположите заданную последовательность A и B в круг и многократно удаляйте соседние пары AB, пока не останутся только A. Каждая из этих A была началом доминирующей циклической перестановки до того, как что-либо было удалено. Таким образом, из циклических перестановок любой расстановки голосов A и B являются доминирующими.
Пусть . Определим стохастический процесс «обратного счета»
где находится преимущество кандидата А над кандидатом В после подсчета голосов?
Утверждение: это процесс мартингейла .
Учитывая , мы знаем, что , поэтому из первых голосов было подано за кандидата А, а было за кандидата Б.
Итак, с вероятностью , имеем , и . Аналогично для другого. Затем вычисляем, чтобы найти .
Определим время остановки как минимум такой, что , или если такого нет . Тогда вероятность того, что кандидат A все время лидирует, равна просто , что по теореме об остановке необязательно равно
Бертран выразил решение как
где - общее число избирателей, а - число избирателей, проголосовавших за первого кандидата. Он утверждает, что результат следует из формулы
где — число благоприятных последовательностей, но «кажется вероятным, что такой простой результат можно показать более прямым способом». Действительно, более прямое доказательство вскоре было получено Дезире Андре. Его подход часто ошибочно называют «принципом отражения» современными авторами, но на самом деле он использует перестановку. Он показывает, что «неблагоприятные» последовательности (те, которые достигают промежуточной ничьей) состоят из равного числа последовательностей, начинающихся с A, как и тех, которые начинаются с B. Каждая последовательность, которая начинается с B, является неблагоприятной, и существуют такие последовательности, в которых за B следует произвольная последовательность из ( q -1) B и p A. Каждая неблагоприятная последовательность, которая начинается с A, может быть преобразована в произвольную последовательность из ( q -1) B и p A, путем нахождения первого B, который нарушает правило (вызывая ничью подсчетов голосов), и удаления его, а также перестановки порядка оставшихся частей. Чтобы обратить процесс, возьмите любую последовательность из ( q -1) B и p A и ищите с конца, чтобы найти, где количество A впервые превышает количество B, а затем поменяйте порядок частей и поместите B между ними. Например, неблагоприятная последовательность AAB B ABAA однозначно соответствует произвольной последовательности ABAA AAB . Из этого следует, что количество благоприятных последовательностей из p A и q B равно
и, таким образом, требуемая вероятность равна
как и ожидалось.
Исходная задача — найти вероятность того, что первый кандидат всегда строго впереди в подсчете голосов. Вместо этого можно рассмотреть задачу нахождения вероятности того, что второй кандидат никогда не впереди (то есть, когда допускаются ничьи). В этом случае ответ будет
Вариантную задачу можно решить методом отражения аналогично исходной задаче. Число возможных последовательностей голосования равно . Назовем последовательность «плохой», если второй кандидат когда-либо впереди, и если число плохих последовательностей можно перечислить, то число «хороших» последовательностей можно найти вычитанием, а вероятность можно вычислить.
Представьте последовательность голосования в виде решетчатого пути на декартовой плоскости следующим образом:
Каждый такой путь соответствует уникальной последовательности голосов и заканчивается в точке ( p , q ). Последовательность является «хорошей» ровно тогда, когда соответствующий путь никогда не выходит за пределы диагональной линии y = x ; эквивалентно, последовательность является «плохой» ровно тогда, когда соответствующий путь касается линии y = x + 1.
Для каждого «плохого» пути P определите новый путь P ′, отразив часть P до первой точки, в которой она касается линии, пересекающей его. P ′ — это путь из (−1, 1) в ( p , q ). Та же операция, примененная снова, восстанавливает исходный P . Это создает однозначное соответствие между «плохими» путями и путями из (−1, 1) в ( p , q ). Количество этих путей равно и, таким образом, это количество «плохих» последовательностей. Это оставляет количество «хороших» последовательностей как
Поскольку их всего, вероятность того, что последовательность является хорошей, равна .
На самом деле, решения исходной задачи и вариантной задачи легко связаны. Чтобы кандидат А был строго впереди на протяжении всего подсчета голосов, он должен получить первый голос, а для остальных голосов (игнорируя первый) он должен быть либо строго впереди, либо иметь равные голоса на протяжении всего подсчета. Следовательно, решение исходной задачи:
по мере необходимости.
Наоборот, случай равенства голосов может быть получен из случая равенства голосов. Обратите внимание, что количество последовательностей равенства голосов с p+1 голосами за A равно количеству последовательностей равенства голосов с p голосами за A. Количество голосов без равенства голосов с p + 1 голосами за голоса за A равно , что путем алгебраических манипуляций равно , поэтому доля последовательностей с p голосами за голоса за A равна .