Модель Гилберта–Шеннона–Ридса

📋 Краткое описание
Модель Гилберта–Шеннона–Ридса описывает математическое распределение вероятностей при рифл-перетасовке карт. Она объясняет, почему колоду нужно перетасовывать семь раз для полной рандомизации, и показывает, что тождественная перестановка намного более вероятна, чем другие.

Математическая формализация перетасовки карт

В математике перетасовки игральных карт модель Гилберта–Шеннона–Ридса (Gilbert–Shannon–Reeds model) представляет собой распределение вероятностей на перестановках, получаемых при рифл-перетасовке. Она служит основанием для рекомендации перетасовывать колоду карт семь раз для её полной рандомизации. Модель названа в честь работ Эдгара Гилберта (Edgar Gilbert), Клода Шеннона (Claude Shannon) и Джима Ридса (J. Reeds), описанных в техническом отчёте Гилберта 1955 года и неопубликованной рукописи Ридса 1981 года.

Описание

Перестановка при рифл-перетасовке последовательности элементов получается путём разделения элементов на две смежные подпоследовательности с последующим произвольным чередованием этих подпоследовательностей. Например, это описывает многие распространённые способы перетасовки колоды карт: колода разрезается на две стопки, которые затем перемешиваются вместе. Модель Гилберта–Шеннона–Ридса назначает вероятность каждой из этих перестановок, описывая вероятность получения каждой перестановки при случайной перетасовке. Модель может быть определена несколькими эквивалентными способами:

**Способ, наиболее близкий к тому, как люди перетасовывают карты.** Модель Гилберта–Шеннона–Ридса описывает вероятности, получаемые при определённой математической модели случайного разрезания и последующей рифл-перетасовки колоды. Сначала колода разрезается на два пакета. Если всего n карт, то вероятность выбрать k карт в первый пакет и n−k во второй определяется как C(n,k)/2^n. Затем карты по одной перемещаются со дна одного из пакетов на верх перетасованной колоды таким образом, что если в одном пакете осталось x карт, а в другом y карт, то вероятность выбрать карту из первого пакета равна x/(x+y), а из второго — y/(x+y).

**Второе альтернативное описание** основано на свойстве модели, согласно которому она генерирует перестановку исходной колоды, в которой каждая карта с равной вероятностью могла прийти из первого или второго пакета. Для генерации случайной перестановки по этой модели нужно n раз подбросить честную монету, чтобы определить для каждой позиции перетасованной колоды, откуда она происходит. Затем разделить на два пакета размерами, равными числу выпавших решек и орлов, и использовать ту же последовательность бросаний для определения, из какого пакета брать каждую карту.

**Третье альтернативное описание** более абстрактно, но лучше подходит для математического анализа. Генерируются n значений из равномерного непрерывного распределения на единичном интервале и упорядочиваются. Затем отображение удвоения x ↦ 2x (mod 1) из теории динамических систем преобразует эту систему точек в перестановку, в которой новый порядок подчиняется модели Гилберта–Шеннона–Ридса, а позиции новых точек снова распределены равномерно.

Среди всех возможных перестановок при рифл-перетасовке колоды карт модель Гилберта–Шеннона–Ридса присваивает почти всем перетасовкам одинаковую вероятность 1/2^n. Однако есть одно исключение — тождественная перестановка (когда порядок карт не меняется), которая имеет большую вероятность (n+1)/2^n. Таким образом, для стандартной 52-карточной колоды перетасовка, не изменяющая порядок карт, в 53 раза более вероятна, чем любая другая отдельная перестановка.

Обратная перестановка

Обратную перестановку случайной рифл-перетасовки можно сгенерировать непосредственно. Для этого начните с колоды из n карт и повторно снимайте карты со дна колоды на одну из двух стопок, выбирая случайно с равной вероятностью, на какую стопку положить каждую карту. Когда все карты разложены, сложите две стопки обратно вместе.

Эффект повторных перетасовок

Формула для одной перетасовки показывает, что тождественная перестановка намного более вероятна, чем любая другая отдельная перестановка. Она остаётся наиболее вероятной перестановкой даже после повторных перетасовок в этой модели.

Байер и Диакони (Bayer & Diaconis, 1992) математически проанализировали полную вариационную дистанцию между двумя распределениями вероятностей на перестановках: равномерным распределением, в котором все перестановки равновероятны, и распределением, генерируемым повторным применением модели Гилберта–Шеннона–Ридса. Полная вариационная дистанция измеряет сходство или различие двух распределений вероятностей; она равна нулю только когда распределения идентичны, и достигает максимума один для распределений, которые никогда не генерируют одинаковые значения. Байер и Диакони обнаружили, что для колод из n карт, перетасованных (3/2)log₂n + θ раз, где θ — произвольная константа, полная вариационная дистанция близка к единице, когда θ значительно меньше нуля, и близка к нулю, когда θ значительно больше нуля, независимо от n. В частности, их расчёты показали, что для n = 52 пять перетасовок дают распределение, полная вариационная дистанция которого от равномерного всё ещё близка к единице, тогда как семь перетасовок дают полную вариационную дистанцию 0,334. Этот результат широко интерпретировался как указание на то, что колоды карт следует перетасовывать семь раз для их полной рандомизации.

Подобные анализы проводились с использованием дивергенции Кульбака–Лейблера (Kullback–Leibler divergence) — дистанции между двумя распределениями вероятностей, определяемой через энтропию; дивергенция распределения от равномерного может интерпретироваться как количество битов информации, которые всё ещё можно восстановить об исходном состоянии колоды карт. Результаты качественно отличаются: вместо резкого порога между случайным и неслучайным состояниями при (3/2)log₂n перетасовках, как происходит для полной вариационной дистанции, дивергенция убывает более постепенно, уменьшаясь линейно при количестве перетасовок от нуля до log₂n (в этой точке количество оставшихся битов информации линейно, на логарифмический множитель меньше исходного значения), а затем убывает экспоненциально, пока после (3/2)log₂n перетасовок остаётся только постоянное количество битов информации.

🔑 Ключевые факты

Модель названа в честь работ Эдгара Гилберта, Клода Шеннона и Джима Ридса, описанных в 1955 году
Для 52-карточной колоды перетасовка без изменения порядка в 53 раза более вероятна, чем любая другая отдельная перестановка
Байер и Диакони доказали, что семь перетасовок дают полную вариационную дистанцию 0,334 от равномерного распределения
Пять перетасовок недостаточны для полной рандомизации — дистанция остаётся близка к единице
Модель описывает три эквивалентных способа математического описания случайной рифл-перетасовки
Почти все перестановки при рифл-перетасовке имеют одинаковую вероятность 1/2^n
Дивергенция Кульбака–Лейблера показывает более постепенное убывание случайности, чем полная вариационная дистанция

❓ Часто задаваемые вопросы

Почему нужно перетасовывать карты семь раз?

Исследование Байера и Диакони показало, что семь перетасовок достаточны для достижения близкого к равномерному распределению вероятностей. При пяти перетасовках колода остаётся недостаточно рандомизированной, а семь перетасовок обеспечивают полную вариационную дистанцию 0,334 от идеального распределения.

Что такое рифл-перетасовка?

Рифл-перетасовка — это способ перемешивания карт, при котором колода разрезается на две стопки, которые затем перемешиваются вместе путём чередования карт со дна каждой стопки. Это один из самых распространённых способов перетасовки в казино и при игре в карточные игры.

Какова вероятность того, что карты останутся в исходном порядке после перетасовки?

Для колоды из 52 карт вероятность тождественной перестановки (когда порядок не меняется) составляет (n+1)/2^n, что в 53 раза выше, чем вероятность любой другой отдельной перестановки. Это значительно выше, чем для других возможных расположений карт.

Кто разработал модель Гилберта–Шеннона–Ридса?

Модель была разработана на основе работ Эдгара Гилберта (описана в техническом отчёте 1955 года), Клода Шеннона и Джима Ридса (неопубликованная рукопись 1981 года). Позже Байер и Диакони провели полный математический анализ в 1992 году.

Как полная вариационная дистанция помогает оценить рандомизацию?

Полная вариационная дистанция измеряет различие между текущим распределением перестановок и идеальным равномерным распределением. Значение близко к единице означает, что колода неслучайна, а значение близко к нулю указывает на полную рандомизацию. Семь перетасовок дают дистанцию 0,334, что считается достаточным для практических целей.

💡 Интересные факты

Клод Шеннон, один из авторов модели, был основателем теории информации и считается отцом цифровой революции
Тождественная перестановка (когда карты остаются в исходном порядке) остаётся наиболее вероятной даже после повторных перетасовок
Обратную перестановку случайной рифл-перетасовки можно сгенерировать, раскладывая карты на две стопки случайным образом, а затем складывая их обратно

🔗 Связанные темы

Рифл-перетасовка картТеория вероятностей в азартных играхПолная вариационная дистанцияДивергенция Кульбака–ЛейблераСлучайные перестановкиМатематика казиноКриптография и случайность