Проверка честности монеты — это фундаментальная задача в статистике, которая помогает определить, равна ли вероятность выпадения орла и решки 50%. Этот метод служит простой моделью для иллюстрации основных принципов статистического вывода и позволяет сравнивать различные подходы к анализу данных. В статье рассмотрены байесовский и частотный методы проверки честности монеты с практическими примерами.
Проверка честности монеты — это статистическая задача определения, равна ли вероятность выпадения орла и решки 50%. Существуют два основных метода анализа: байесовский подход с апостериорным распределением и частотный подход с оценкой доверительных интервалов.
Задача в статистике
В статистике вопрос о проверке честности монеты важен, во-первых, тем, что служит простой моделью для иллюстрации основных идей статистического вывода, а во-вторых, позволяет сравнивать различные конкурирующие методы статистического анализа, включая теорию принятия решений. Хотя практическую задачу проверки честности монеты можно решить, проведя достаточно большое количество испытаний, статистика и теория вероятностей дают рекомендации по двум типам вопросов: сколько испытаний следует провести и какова точность оценки вероятности выпадения орла на основе полученной выборки.
Честная монета — это идеализированное устройство для случайного выбора с двумя равновероятными состояниями (обычно называемыми «орёл» и «решка»). Она основана на подбрасывании монеты, широко используемом в спорте и других ситуациях, когда требуется дать двум сторонам равные шансы на победу. Обычно используется либо специально разработанный жетон, либо обычная монета, хотя последняя может быть немного «нечестной» из-за асимметричного распределения веса, что может привести к более частому выпадению одной стороны, давая одной стороне несправедливое преимущество. Поэтому может потребоваться экспериментально проверить, является ли монета действительно «честной» — то есть равна ли вероятность выпадения каждой стороны ровно 50%. Конечно, невозможно исключить произвольно малые отклонения от честности, которые могли бы повлиять только на один бросок за всю жизнь подбрасывания; кроме того, даже нечестная (или «смещённая») монета может случайно выпасть ровно 10 раз орлом из 20 бросков. Поэтому любой тест честности должен устанавливать лишь определённую степень уверенности в определённой степени честности (определённое максимальное смещение). В более строгой терминологии задача состоит в определении параметров процесса Бернулли на основе ограниченной выборки испытаний Бернулли.
Содержание
Введение
В этой статье описаны экспериментальные процедуры для определения честности или нечестности монеты. Существует множество статистических методов для анализа такой экспериментальной процедуры. В этой статье рассматриваются два из них.
Оба метода предусматривают проведение эксперимента (или испытания), при котором монета подбрасывается много раз и результат каждого броска записывается. Результаты затем анализируются статистически, чтобы определить, является ли монета «честной» или «вероятно нечестной».
- Апостериорная функция плотности вероятности (байесовский подход). Первоначально истинная вероятность выпадения определённой стороны при подбрасывании монеты неизвестна, но неопределённость представляется «априорным распределением». Теория байесовского вывода используется для получения апостериорного распределения путём объединения априорного распределения и функции правдоподобия, которая представляет информацию, полученную из эксперимента. Вероятность того, что данная монета является «честной», можно затем получить, интегрируя функцию плотности апостериорного распределения по соответствующему интервалу, представляющему все вероятности, которые можно считать «честными» в практическом смысле.
- Оценка истинной вероятности (частотный подход). Этот метод предполагает, что экспериментатор может подбросить монету любое количество раз. Экспериментатор сначала определяет требуемый уровень доверия и допустимую погрешность. Эти параметры определяют минимальное количество бросков, которое необходимо провести для завершения эксперимента.
Важное различие между этими двумя подходами заключается в том, что первый подход учитывает предыдущий опыт подбрасывания монет, а второй — нет. Вопрос о том, какой вес придавать предыдущему опыту в зависимости от качества (достоверности) этого опыта, рассматривается в теории достоверности.
Апостериорная функция плотности вероятности
Один из методов — вычисление апостериорной функции плотности вероятности с использованием теории байесовской вероятности.
Тест проводится путём подбрасывания монеты N раз и записи наблюдаемого количества орлов h и решек t. Символы H и T представляют более обобщённые переменные, выражающие количество орлов и решек соответственно, которые могли бы быть получены в эксперименте. Таким образом, N = H + T = h + t.
Далее пусть r — фактическая вероятность выпадения орла при одном подбрасывании монеты. Это свойство монеты, которое исследуется. Используя теорему Байеса, апостериорная плотность вероятности r при условии h и t выражается следующим образом:
f(r∣H=h,T=t)=Pr(H=h∣r,N=h+t)g(r)∫₀¹Pr(H=h∣p,N=h+t)g(p)dp
где g(r) представляет априорное распределение вероятности r, которое находится в диапазоне от 0 до 1.
Априорное распределение вероятности суммирует то, что известно о распределении r в отсутствие каких-либо наблюдений. Будем предполагать, что априорное распределение r равномерно на интервале [0, 1]. То есть g(r) = 1. (На практике было бы более целесообразно предположить априорное распределение, которое намного более сильно взвешено в области около 0,5, чтобы отразить наш опыт работы с реальными монетами.)
Вероятность получить h орлов при N подбрасываниях монеты с вероятностью орла, равной r, задаётся биномиальным распределением:
Pr(H=h∣r,N=h+t)=(N choose h)r^h(1−r)^t
Подставляя это в предыдущую формулу:
f(r∣H=h,T=t)=(N choose h)r^h(1−r)^t / ∫₀¹(N choose h)p^h(1−p)^t dp = r^h(1−r)^t / ∫₀¹p^h(1−p)^t dp
Это фактически бета-распределение (сопряжённое априорное распределение для биномиального распределения), знаменатель которого можно выразить через бета-функцию:
f(r∣H=h,T=t) = 1/B(h+1,t+1) · r^h(1−r)^t
Поскольку было предположено равномерное априорное распределение и поскольку h и t — целые числа, это также можно записать через факториалы:
f(r∣H=h,T=t) = (h+t+1)! / (h! · t!) · r^h(1−r)^t
Пример
Например, пусть N = 10, h = 7, то есть монета подбрасывается 10 раз и получается 7 орлов:
f(r∣H=7,T=3) = (10+1)! / (7! · 3!) · r^7(1−r)^3 = 1320 · r^7(1−r)^3
График справа показывает функцию плотности вероятности r при условии, что получено 7 орлов из 10 подбрасываний. (Примечание: r — это вероятность выпадения орла при одном подбрасывании той же монеты.)
Вероятность для беспристрастной монеты (определяемой для этой цели как монета, у которой вероятность выпадения орла находится между 45% и 55%)
Pr(0.45 мала по сравнению с альтернативной гипотезой (смещённая монета). Однако она недостаточно мала, чтобы заставить нас поверить, что монета имеет значительное смещение. Эта вероятность немного выше нашего предположения о вероятности того, что монета была честной, соответствующей равномерному априорному распределению, которое составляло 10%. Используя априорное распределение, отражающее наши предварительные знания о том, что такое монета и как она работает, апостериорное распределение не благоприятствовало бы гипотезе о смещении. Однако количество испытаний в этом примере (10 подбрасываний) очень мало, и при большем количестве испытаний выбор априорного распределения был бы менее значимым. При равномерном априорном распределении апостериорное распределение вероятности f(r | H = 7, T = 3) достигает своего пика при r = h / (h + t) = 0,7; это значение называется оценкой максимума апостериорной вероятности (MAP) для r. Также при равномерном априорном распределении ожидаемое значение r при апостериорном распределении равно: E[r] = ∫₀¹ r · f(r∣H=7,T=3) dr = (h+1)/(h+t+2) = 2/3 Используя этот подход, для определения количества раз, которое монета должна быть подброшена, требуются два параметра: Уровень доверия обозначается Z и задаётся Z-значением стандартного нормального распределения. Это значение можно найти в таблице стандартных оценок для нормального распределения. Максимальная ошибка (E) определяется как |p − r| < E, где p — оценённая вероятность выпадения орла. Примечание: r — это та же фактическая вероятность (выпадения орла), что и r из предыдущего раздела этой статьи. В статистике стандартная ошибка оценки доли выборки (обозначаемой p) задаётся как: s_p = √(p(1−p)/n) где n — количество испытаний (которое обозначалось N в предыдущем разделе). Эта функция стандартной ошибки s_p от p имеет максимум при p = (1−p) = 0,5. Кроме того, в случае подбрасывания монеты вероятно, что p будет не далеко от 0,5, поэтому разумно принять p = 0,5 в следующем: И, следовательно, значение максимальной ошибки (E) задаётся как: E = Z/(2√n) Решая относительно требуемого количества подбрасываний монеты n: n = Z²/(4E²) n = Z²/(4E²) = Z²/(4×0,01²) = 2500Z² E = Z/(2√n) = Z/(2√10000) = Z/200 p = h/(h+t) = 5961/12000 = 0,4968 Теперь найдём значение Z, соответствующее уровню доверия 99,999%. Z = 4,4172 Теперь вычислим E: E = Z/(2√n) = 4,4172/(2√12000) = 0,0202 Интервал, содержащий r, таким образом: p − E < r < p + E 0,4766 < r < 0,5170 Другие подходы к вопросу проверки честности монеты доступны с использованием теории принятия решений, применение которой потребовало бы формулировки функции потерь или функции полезности, описывающей последствия принятия данного решения. Подход, который избегает необходимости в функции потерь или априорной вероятности (как в байесовском подходе), — это «приёмочная выборка». Вышеприведённый математический анализ для определения честности монеты также может быть применён к другим целям. Например:Оценка истинной вероятности
Примеры
Другие подходы
Другие применения
🔑 Ключевые факты
Методы проверки честности монеты
❓ Часто задаваемые вопросы
💡 Интересные факты
🔗 Связанные темы
📚 Читайте также