Проверка честности монеты

Q: Как определить, честная ли монета?

Существует два основных метода: байесовский подход, использующий априорное распределение и теорему Байеса, и частотный подход, основанный на доверительных интервалах. Оба требуют проведения достаточного количества бросков и статистического анализа полученных результатов.

Q: Сколько раз нужно подбросить монету для проверки?

Количество бросков зависит от требуемого уровня доверия и допустимой погрешности. Формула: n = Z²/(4E²). Например, для ошибки 0,01 при уровне доверия 95,45% потребуется 10000 бросков.

Q: Что такое апостериорное распределение?

Апостериорное распределение — это вероятностное распределение параметра (вероятности выпадения орла) после учёта результатов эксперимента. Оно получается путём комбинирования априорного распределения с информацией из наблюдений.

Q: Какая вероятность считается честной для монеты?

Обычно честная монета определяется как имеющая вероятность выпадения орла в диапазоне 45-55%. Однако точное определение зависит от практических требований и допустимого смещения.

Q: Где ещё применяется анализ честности монеты?

Этот анализ используется в контроле качества (определение доли дефектных изделий), опросах общественного мнения, определении соотношения полов в популяции и других задачах с двумя взаимно исключающими исходами.

Проверка честности монеты — это фундаментальная задача в статистике, которая помогает определить, равна ли вероятность выпадения орла и решки 50%. Этот метод служит простой моделью для иллюстрации основных принципов статистического вывода и позволяет сравнивать различные подходы к анализу данных. В статье рассмотрены байесовский и частотный методы проверки честности монеты с практическими примерами.

📋 Краткое описание
Проверка честности монеты — это статистическая задача определения, равна ли вероятность выпадения орла и решки 50%. Существуют два основных метода анализа: байесовский подход с апостериорным распределением и частотный подход с оценкой доверительных интервалов.

Задача в статистике

В статистике вопрос о проверке честности монеты важен, во-первых, тем, что служит простой моделью для иллюстрации основных идей статистического вывода, а во-вторых, позволяет сравнивать различные конкурирующие методы статистического анализа, включая теорию принятия решений. Хотя практическую задачу проверки честности монеты можно решить, проведя достаточно большое количество испытаний, статистика и теория вероятностей дают рекомендации по двум типам вопросов: сколько испытаний следует провести и какова точность оценки вероятности выпадения орла на основе полученной выборки.

Честная монета — это идеализированное устройство для случайного выбора с двумя равновероятными состояниями (обычно называемыми «орёл» и «решка»). Она основана на подбрасывании монеты, широко используемом в спорте и других ситуациях, когда требуется дать двум сторонам равные шансы на победу. Обычно используется либо специально разработанный жетон, либо обычная монета, хотя последняя может быть немного «нечестной» из-за асимметричного распределения веса, что может привести к более частому выпадению одной стороны, давая одной стороне несправедливое преимущество. Поэтому может потребоваться экспериментально проверить, является ли монета действительно «честной» — то есть равна ли вероятность выпадения каждой стороны ровно 50%. Конечно, невозможно исключить произвольно малые отклонения от честности, которые могли бы повлиять только на один бросок за всю жизнь подбрасывания; кроме того, даже нечестная (или «смещённая») монета может случайно выпасть ровно 10 раз орлом из 20 бросков. Поэтому любой тест честности должен устанавливать лишь определённую степень уверенности в определённой степени честности (определённое максимальное смещение). В более строгой терминологии задача состоит в определении параметров процесса Бернулли на основе ограниченной выборки испытаний Бернулли.

Содержание

Введение

В этой статье описаны экспериментальные процедуры для определения честности или нечестности монеты. Существует множество статистических методов для анализа такой экспериментальной процедуры. В этой статье рассматриваются два из них.

Оба метода предусматривают проведение эксперимента (или испытания), при котором монета подбрасывается много раз и результат каждого броска записывается. Результаты затем анализируются статистически, чтобы определить, является ли монета «честной» или «вероятно нечестной».

Апостериорная функция плотности вероятности (байесовский подход). Первоначально истинная вероятность выпадения определённой стороны при подбрасывании монеты неизвестна, но неопределённость представляется «априорным распределением». Теория байесовского вывода используется для получения апостериорного распределения путём объединения априорного распределения и функции правдоподобия, которая представляет информацию, полученную из эксперимента. Вероятность того, что данная монета является «честной», можно затем получить, интегрируя функцию плотности апостериорного распределения по соответствующему интервалу, представляющему все вероятности, которые можно считать «честными» в практическом смысле.
Оценка истинной вероятности (частотный подход). Этот метод предполагает, что экспериментатор может подбросить монету любое количество раз. Экспериментатор сначала определяет требуемый уровень доверия и допустимую погрешность. Эти параметры определяют минимальное количество бросков, которое необходимо провести для завершения эксперимента.

Важное различие между этими двумя подходами заключается в том, что первый подход учитывает предыдущий опыт подбрасывания монет, а второй — нет. Вопрос о том, какой вес придавать предыдущему опыту в зависимости от качества (достоверности) этого опыта, рассматривается в теории достоверности.

Апостериорная функция плотности вероятности

Один из методов — вычисление апостериорной функции плотности вероятности с использованием теории байесовской вероятности.

Тест проводится путём подбрасывания монеты N раз и записи наблюдаемого количества орлов h и решек t. Символы H и T представляют более обобщённые переменные, выражающие количество орлов и решек соответственно, которые могли бы быть получены в эксперименте. Таким образом, N = H + T = h + t.

Далее пусть r — фактическая вероятность выпадения орла при одном подбрасывании монеты. Это свойство монеты, которое исследуется. Используя теорему Байеса, апостериорная плотность вероятности r при условии h и t выражается следующим образом:

f(r∣H=h,T=t)=Pr(H=h∣r,N=h+t)g(r)∫₀¹Pr(H=h∣p,N=h+t)g(p)dp

где g(r) представляет априорное распределение вероятности r, которое находится в диапазоне от 0 до 1.

Априорное распределение вероятности суммирует то, что известно о распределении r в отсутствие каких-либо наблюдений. Будем предполагать, что априорное распределение r равномерно на интервале [0, 1]. То есть g(r) = 1. (На практике было бы более целесообразно предположить априорное распределение, которое намного более сильно взвешено в области около 0,5, чтобы отразить наш опыт работы с реальными монетами.)

Вероятность получить h орлов при N подбрасываниях монеты с вероятностью орла, равной r, задаётся биномиальным распределением:

Pr(H=h∣r,N=h+t)=(N choose h)r^h(1−r)^t

Подставляя это в предыдущую формулу:

f(r∣H=h,T=t)=(N choose h)r^h(1−r)^t / ∫₀¹(N choose h)p^h(1−p)^t dp = r^h(1−r)^t / ∫₀¹p^h(1−p)^t dp

Это фактически бета-распределение (сопряжённое априорное распределение для биномиального распределения), знаменатель которого можно выразить через бета-функцию:

f(r∣H=h,T=t) = 1/B(h+1,t+1) · r^h(1−r)^t

Поскольку было предположено равномерное априорное распределение и поскольку h и t — целые числа, это также можно записать через факториалы:

f(r∣H=h,T=t) = (h+t+1)! / (h! · t!) · r^h(1−r)^t

Пример

Например, пусть N = 10, h = 7, то есть монета подбрасывается 10 раз и получается 7 орлов:

f(r∣H=7,T=3) = (10+1)! / (7! · 3!) · r^7(1−r)^3 = 1320 · r^7(1−r)^3

График справа показывает функцию плотности вероятности r при условии, что получено 7 орлов из 10 подбрасываний. (Примечание: r — это вероятность выпадения орла при одном подбрасывании той же монеты.)

Вероятность для беспристрастной монеты (определяемой для этой цели как монета, у которой вероятность выпадения орла находится между 45% и 55%)

Pr(0.45

мала по сравнению с альтернативной гипотезой (смещённая монета). Однако она недостаточно мала, чтобы заставить нас поверить, что монета имеет значительное смещение. Эта вероятность немного выше нашего предположения о вероятности того, что монета была честной, соответствующей равномерному априорному распределению, которое составляло 10%.

Используя априорное распределение, отражающее наши предварительные знания о том, что такое монета и как она работает, апостериорное распределение не благоприятствовало бы гипотезе о смещении. Однако количество испытаний в этом примере (10 подбрасываний) очень мало, и при большем количестве испытаний выбор априорного распределения был бы менее значимым.

При равномерном априорном распределении апостериорное распределение вероятности f(r | H = 7, T = 3) достигает своего пика при r = h / (h + t) = 0,7; это значение называется оценкой максимума апостериорной вероятности (MAP) для r. Также при равномерном априорном распределении ожидаемое значение r при апостериорном распределении равно:

E[r] = ∫₀¹ r · f(r∣H=7,T=3) dr = (h+1)/(h+t+2) = 2/3

Оценка истинной вероятности

Используя этот подход, для определения количества раз, которое монета должна быть подброшена, требуются два параметра:

Уровень доверия, обозначаемый доверительным интервалом (Z)
Максимальная (допустимая) ошибка (E)

Уровень доверия обозначается Z и задаётся Z-значением стандартного нормального распределения. Это значение можно найти в таблице стандартных оценок для нормального распределения.

Максимальная ошибка (E) определяется как |p − r| < E, где p — оценённая вероятность выпадения орла. Примечание: r — это та же фактическая вероятность (выпадения орла), что и r из предыдущего раздела этой статьи.

В статистике стандартная ошибка оценки доли выборки (обозначаемой p) задаётся как:

s_p = √(p(1−p)/n)

где n — количество испытаний (которое обозначалось N в предыдущем разделе).

Эта функция стандартной ошибки s_p от p имеет максимум при p = (1−p) = 0,5. Кроме того, в случае подбрасывания монеты вероятно, что p будет не далеко от 0,5, поэтому разумно принять p = 0,5 в следующем:

И, следовательно, значение максимальной ошибки (E) задаётся как:

E = Z/(2√n)

Решая относительно требуемого количества подбрасываний монеты n:

n = Z²/(4E²)

Примеры

Если желаемая максимальная ошибка составляет 0,01, сколько раз следует подбросить монету?

n = Z²/(4E²) = Z²/(4×0,01²) = 2500Z²

n = 2500 при уровне доверия 68,27% (Z=1)
n = 10000 при уровне доверия 95,45% (Z=2)
n = 27225 при уровне доверия 99,90% (Z=3,3)

Если монета подбрасывается 10000 раз, какова максимальная ошибка оценки p относительно значения r (фактической вероятности выпадения орла при подбрасывании монеты)?

E = Z/(2√n) = Z/(2√10000) = Z/200

E = 0,0050 при уровне доверия 68,27% (Z=1)
E = 0,0100 при уровне доверия 95,45% (Z=2)
E = 0,0165 при уровне доверия 99,90% (Z=3,3)

Монета подбрасывается 12000 раз с результатом 5961 орёл (и 6039 решек). В каком интервале находится значение r (истинная вероятность выпадения орла), если требуется уровень доверия 99,999%?

p = h/(h+t) = 5961/12000 = 0,4968

Теперь найдём значение Z, соответствующее уровню доверия 99,999%.

Z = 4,4172

Теперь вычислим E:

E = Z/(2√n) = 4,4172/(2√12000) = 0,0202

Интервал, содержащий r, таким образом:

p − E < r < p + E

0,4766 < r < 0,5170

Другие подходы

Другие подходы к вопросу проверки честности монеты доступны с использованием теории принятия решений, применение которой потребовало бы формулировки функции потерь или функции полезности, описывающей последствия принятия данного решения. Подход, который избегает необходимости в функции потерь или априорной вероятности (как в байесовском подходе), — это «приёмочная выборка».

Другие применения

Вышеприведённый математический анализ для определения честности монеты также может быть применён к другим целям. Например:

Определение доли дефектных изделий для продукта, подвергнутого определённому (но хорошо определённому) условию. Иногда продукт может быть очень сложным или дорогим в производстве. Кроме того, если тестирование таких продуктов приведёт к их разрушению, следует протестировать минимальное количество изделий. Используя аналогичный анализ, можно найти функцию плотности вероятности уровня дефектности продукта.
Двусторонние опросы. Если проводится небольшой случайный выборочный опрос, в котором есть только два взаимно исключающих варианта, то это похоже на подбрасывание одной монеты несколько раз с использованием возможно смещённой монеты. Аналогичный анализ может быть применён для определения уверенности, которую следует приписать фактическому соотношению поданных голосов. (Если людям разрешено воздерживаться, анализ должен это учитывать, и аналогия с подбрасыванием монеты не совсем верна.)
Определение соотношения полов в большой группе животного вида. При условии, что при случайной выборке из популяции берётся небольшая случайная выборка (то есть малая по сравнению с общей популяцией), анализ аналогичен определению вероятности выпадения орла при подбрасывании монеты.

🔑 Ключевые факты

Честная монета имеет равновероятные исходы: вероятность орла и решки равна 0,5
Байесовский подход использует априорное распределение и теорему Байеса для получения апостериорного распределения
Частотный подход требует определения уровня доверия и допустимой погрешности для расчёта количества бросков
Апостериорное распределение при равномерном априорном распределении следует бета-распределению
Формула для расчёта количества бросков: n = Z²/(4E²), где Z — уровень доверия, E — максимальная ошибка
При 10 бросках с результатом 7 орлов вероятность честности монеты (45-55%) составляет примерно 13%
Анализ честности монеты применим к контролю качества, опросам и определению соотношения полов в популяции

Методы проверки честности монеты

❓ Часто задаваемые вопросы

Как определить, честная ли монета?

Существует два основных метода: байесовский подход, использующий априорное распределение и теорему Байеса, и частотный подход, основанный на доверительных интервалах. Оба требуют проведения достаточного количества бросков и статистического анализа полученных результатов.

Сколько раз нужно подбросить монету для проверки?

Количество бросков зависит от требуемого уровня доверия и допустимой погрешности. Формула: n = Z²/(4E²). Например, для ошибки 0,01 при уровне доверия 95,45% потребуется 10000 бросков.

Что такое апостериорное распределение?

Апостериорное распределение — это вероятностное распределение параметра (вероятности выпадения орла) после учёта результатов эксперимента. Оно получается путём комбинирования априорного распределения с информацией из наблюдений.

Какая вероятность считается честной для монеты?