EssayAI
Блог
Блог
Математика и алгоритмы

Лемма Неймана-Пирсона: наиболее мощный критерий

11 июня 2026Время чтения: 8 минут
#лемма неймана-пирсона#отношение правдоподобия#наиболее мощный критерий#проверка гипотез#мощность критерия

Лемма Неймана-Пирсона отвечает на главный вопрос проверки статистических гипотез: если уровень значимости α\alpha задан, какой критерий обнаруживает альтернативу с наибольшей вероятностью? Оказывается, для простой гипотезы H0H_0 против простой альтернативы H1H_1 ответ единственный и удивительно простой: нужно сравнивать отношение правдоподобия двух гипотез с подходящим порогом. Любой другой критерий того же уровня будет не мощнее. Ниже разберём, что именно утверждает лемма, как из неё получается критическая область, почему критерий сводится к одному порогу на выборочной статистике и как считать мощность. Чтобы сразу почувствовать связь уровня значимости, размера эффекта и мощности, покрутите калькулятор ниже: он ставит порог наиболее мощного критерия и показывает обе плотности с областью отвержения.

Что утверждает лемма Неймана-Пирсона

Пусть наблюдается выборка x=(x1,,xn)x = (x_1, \dots, x_n), а проверяются две простые гипотезы: H0H_0, при которой параметр равен θ0\theta_0, и альтернатива H1H_1, при которой он равен θ1\theta_1. Простая гипотеза полностью задаёт распределение, поэтому у каждой из них есть функция правдоподобия: L(x;θ0)L(x; \theta_0) и L(x;θ1)L(x; \theta_1). Лемма Неймана-Пирсона говорит, что среди всех критериев с заданной вероятностью ошибки первого рода α\alpha наибольшую мощность имеет критерий, который отвергает H0H_0 при

Λ(x)=L(x;θ1)L(x;θ0)>k,\Lambda(x) = \frac{L(x; \theta_1)}{L(x; \theta_0)} > k,

где порог kk подбирается так, чтобы выполнялось условие на уровень значимости PH0(Λ(x)>k)=αP_{H_0}(\Lambda(x) > k) = \alpha. Величину Λ(x)\Lambda(x) называют отношением правдоподобия. Смысл прост: чем больше Λ(x)\Lambda(x), тем сильнее данные «голосуют» за альтернативу. Критерий отвергает нулевую гипотезу там, где данные правдоподобнее при H1H_1, чем при H0H_0, ровно настолько, насколько позволяет бюджет ошибок α\alpha.

Ключевое слово здесь - «наиболее мощный». Мощность критерия 1β1 - \beta - это вероятность правильно отвергнуть H0H_0, когда верна H1H_1. Лемма утверждает, что критерий отношения правдоподобия даёт максимально возможную мощность при фиксированном α\alpha. Это сильное и точное оптимальное свойство, а не приближённое правило.

Отношение правдоподобия и один порог

На первый взгляд сравнивать Λ(x)\Lambda(x) с порогом неудобно: это функция всей выборки. Но для многих распределений отношение правдоподобия монотонно зависит от одной достаточной статистики, и тогда условие Λ(x)>k\Lambda(x) > k превращается в простое неравенство на эту статистику.

Две плотности: при H0 (синяя) и при H1 (розовая). Золотой порог c едет слева направо, и видно компромисс: вероятность ошибки I рода alpha (хвост H0 правее порога) убывает, а ошибка II рода beta (масса H1 левее порога) растёт. Разом обе ошибки не убрать

Покажем это на каноническом примере. Пусть X1,,XnX_1, \dots, X_n - выборка из нормального распределения с известной дисперсией σ2\sigma^2, H0:μ=μ0H_0: \mu = \mu_0 против H1:μ=μ1H_1: \mu = \mu_1, причём μ1>μ0\mu_1 > \mu_0. Логарифм отношения правдоподобия равен

lnΛ(x)=μ1μ0σ2i=1nxin(μ12μ02)2σ2.\ln \Lambda(x) = \frac{\mu_1 - \mu_0}{\sigma^2} \sum_{i=1}^n x_i - \frac{n(\mu_1^2 - \mu_0^2)}{2\sigma^2}.

Поскольку μ1>μ0\mu_1 > \mu_0, эта величина строго возрастает по сумме xi\sum x_i, а значит и по выборочному среднему xˉ\bar{x}. Поэтому условие Λ(x)>k\Lambda(x) > k эквивалентно условию xˉ>c\bar{x} > c для некоторого порога cc. Видео выше показывает именно этот разрез: один порог делит ось выборочного среднего на область принятия и область отвержения.

Отношение правдоподобия монотонно растёт по выборочному среднему, поэтому условие Лямбда больше k равносильно x больше c: одна точка пересечения задаёт границу критической области
Отношение правдоподобия монотонно растёт по выборочному среднему, поэтому условие Лямбда больше k равносильно x больше c: одна точка пересечения задаёт границу критической области

Удобнее перейти к стандартизованной статистике z=n(xˉμ0)/σz = \sqrt{n}\,(\bar{x} - \mu_0)/\sigma. При верной H0H_0 она имеет стандартное нормальное распределение, и порог определяется критическим значением

zc=Φ1(1α),z_c = \Phi^{-1}(1 - \alpha),

где Φ\Phi - функция распределения стандартной нормали. Например, для одностороннего критерия уровня α=0,05\alpha = 0{,}05 получаем zc1,645z_c \approx 1{,}645. Критерий отвергает H0H_0, если наблюдённое значение zz превышает zcz_c.

Критическая область и ошибки двух родов

Критическая область - это множество значений статистики, при которых H0H_0 отвергается. Для нашего примера это полупрямая z>zcz > z_c, или, в исходных единицах, xˉ>μ0+zcσ/n\bar{x} > \mu_0 + z_c\,\sigma/\sqrt{n}. С двумя гипотезами всегда связаны две ошибки: ошибка первого рода (отвергнуть верную H0H_0) с вероятностью α\alpha и ошибка второго рода (не отвергнуть H0H_0, когда верна H1H_1) с вероятностью β\beta. Лемма Неймана-Пирсона фиксирует α\alpha и минимизирует β\beta, то есть максимизирует мощность.

Две плотности под H0 и под H1, порог на критическом значении, хвост alpha (часть H0) и область мощности 1 минус beta (часть H1); скобка снизу измеряет мощность критерия
Две плотности под H0 и под H1, порог на критическом значении, хвост alpha (часть H0) и область мощности 1 минус beta (часть H1); скобка снизу измеряет мощность критерия

На рисунке видно геометрию решения. Синяя кривая - распределение статистики при H0H_0, розовая - при H1H_1. Золотой пунктир - порог cc. Площадь синего хвоста правее порога равна α\alpha: это вероятность ложно отвергнуть нулевую гипотезу. Площадь розовой области правее того же порога равна мощности 1β1 - \beta: это вероятность правильно поймать альтернативу. Когда гипотезы стоят дальше друг от друга, розовая область растёт, и мощность увеличивается, а уровень α\alpha остаётся прежним.

Как считать мощность критерия

Мощность зависит от того, насколько далеко альтернатива отстоит от нуля в единицах разброса статистики. Введём размер эффекта на одно наблюдение d=(μ1μ0)/σd = (\mu_1 - \mu_0)/\sigma. Тогда при верной H1H_1 статистика zz имеет среднее dnd\sqrt{n} и единичную дисперсию, поэтому мощность равна

1β=Φ ⁣(dnzc),β=Φ ⁣(zcdn).1 - \beta = \Phi\!\left(d\sqrt{n} - z_c\right), \qquad \beta = \Phi\!\left(z_c - d\sqrt{n}\right).

Эта формула показывает три рычага влияния на мощность. Во-первых, чем больше эффект dd, тем правее уезжает розовая плотность и тем больше её масса попадает в критическую область. Во-вторых, чем больше объём выборки nn, тем сильнее раздвигаются распределения по стандартизованной оси (множитель n\sqrt{n}). В-третьих, чем выше допустимый уровень α\alpha, тем меньше zcz_c и тем легче попасть в область отвержения, но тогда растёт риск ошибки первого рода. Калькулятор в начале статьи строит правый график мощности как функцию nn: видно, что при фиксированных α\alpha и dd кривая мощности монотонно растёт и постепенно выходит на уровень, близкий к единице.

Когда гипотезы сложные

Лемма Неймана-Пирсона в чистом виде сформулирована для двух простых гипотез. На практике альтернатива часто сложная, например H1:μ>μ0H_1: \mu > \mu_0 - целое семейство значений. Здесь спасает то, что для распределений с монотонным отношением правдоподобия (нормальное, показательное, пуассоновское и другие из экспоненциального семейства) граница критической области не зависит от конкретного значения θ1\theta_1 внутри альтернативы. Поэтому один и тот же критерий xˉ>c\bar{x} > c оказывается равномерно наиболее мощным сразу для всех альтернатив μ>μ0\mu > \mu_0. Этот результат - прямое следствие леммы и теоремы Карлина-Рубина, и именно он оправдывает повсеместное использование односторонних zz- и tt-критериев.

Если же монотонности нет или альтернатива двусторонняя, равномерно наиболее мощного критерия может не существовать, и тогда используют обобщённое отношение правдоподобия и другие принципы. Но логическим фундаментом всей теории остаётся именно лемма Неймана-Пирсона.

Частые ошибки

  • Применение леммы к сложным гипотезам напрямую. Лемма в исходной форме работает только для двух простых гипотез. Для сложной альтернативы сначала нужно убедиться в монотонности отношения правдоподобия, иначе вывод о наиболее мощном критерии неверен.
  • Путаница порога kk и критического значения zcz_c. Порог kk стоит на отношении правдоподобия, а zcz_c - на стандартизованной статистике. Это разные числа, связанные монотонным преобразованием.
  • Забыть про направление неравенства. Если μ1<μ0\mu_1 < \mu_0, отношение правдоподобия убывает по xˉ\bar{x}, и критическая область становится левым хвостом xˉ<c\bar{x} < c, а не правым.
  • Считать мощность без учёта nn. Мощность зависит от dnd\sqrt{n}, а не от одного dd. При малом объёме выборки даже большой эффект может давать низкую мощность.
  • Смешивать уровень значимости и мощность. Уровень α\alpha относится к ситуации, когда верна H0H_0, а мощность - к ситуации, когда верна H1H_1. Это две разные вероятности на двух разных распределениях.

FAQ

Почему критерий отношения правдоподобия самый мощный? Потому что он включает в критическую область именно те исходы, где данные относительно правдоподобнее при H1H_1. При фиксированном бюджете ошибки первого рода такой выбор отдаёт критической области максимально возможную массу альтернативного распределения, а значит и максимальную мощность. Строгое доказательство сравнивает критерий Неймана-Пирсона с любым другим критерием того же уровня и показывает, что мощность последнего не больше.

Чем отличается уровень значимости от мощности критерия? Уровень значимости α\alpha - это вероятность ошибки первого рода, то есть отвергнуть H0H_0, когда она верна. Мощность 1β1 - \beta - это вероятность правильно отвергнуть H0H_0, когда верна альтернатива H1H_1. Лемма фиксирует α\alpha и делает мощность наибольшей из возможных.

Как лемма Неймана-Пирсона связана с zz- и tt-критериями? Для нормальной выборки наиболее мощный критерий из леммы сводится к порогу на выборочном среднем, а это и есть односторонний zz-критерий (при известной дисперсии) или tt-критерий (при оценённой). Поэтому привычные критерии не выбраны произвольно: они оптимальны в смысле леммы.

Коротко

Лемма Неймана-Пирсона утверждает, что для простой гипотезы против простой альтернативы наиболее мощный критерий уровня α\alpha отвергает H0H_0 при Λ(x)=L(x;θ1)/L(x;θ0)>k\Lambda(x) = L(x;\theta_1)/L(x;\theta_0) > k, где порог kk выбран из условия на α\alpha. Для распределений с монотонным отношением правдоподобия это сводится к одному порогу на достаточной статистике, например к условию xˉ>c\bar{x} > c для нормальной выборки. Мощность критерия равна 1β=Φ(dnzc)1 - \beta = \Phi(d\sqrt{n} - z_c) и растёт с размером эффекта и объёмом выборки. Эта лемма - фундамент теории проверки гипотез и причина, по которой односторонние zz- и tt-критерии считаются оптимальными.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также