Лемма Неймана-Пирсона: наиболее мощный критерий

11 июня 2026Время чтения: 8 минут

#лемма неймана-пирсона#отношение правдоподобия#наиболее мощный критерий#проверка гипотез#мощность критерия

Лемма Неймана-Пирсона отвечает на главный вопрос проверки статистических гипотез: если уровень значимости $\alpha$ задан, какой критерий обнаруживает альтернативу с наибольшей вероятностью? Оказывается, для простой гипотезы $H_0$ против простой альтернативы $H_1$ ответ единственный и удивительно простой: нужно сравнивать отношение правдоподобия двух гипотез с подходящим порогом. Любой другой критерий того же уровня будет не мощнее. Ниже разберём, что именно утверждает лемма, как из неё получается критическая область, почему критерий сводится к одному порогу на выборочной статистике и как считать мощность. Чтобы сразу почувствовать связь уровня значимости, размера эффекта и мощности, покрутите калькулятор ниже: он ставит порог наиболее мощного критерия и показывает обе плотности с областью отвержения.

Что утверждает лемма Неймана-Пирсона

Пусть наблюдается выборка $x = (x_1, \dots, x_n)$ , а проверяются две простые гипотезы: $H_0$ , при которой параметр равен $\theta_0$ , и альтернатива $H_1$ , при которой он равен $\theta_1$ . Простая гипотеза полностью задаёт распределение, поэтому у каждой из них есть функция правдоподобия: $L(x; \theta_0)$ и $L(x; \theta_1)$ . Лемма Неймана-Пирсона говорит, что среди всех критериев с заданной вероятностью ошибки первого рода $\alpha$ наибольшую мощность имеет критерий, который отвергает $H_0$ при

$\Lambda(x) = \frac{L(x; \theta_1)}{L(x; \theta_0)} > k,$

где порог $k$ подбирается так, чтобы выполнялось условие на уровень значимости $P_{H_0}(\Lambda(x) > k) = \alpha$ . Величину $\Lambda(x)$ называют отношением правдоподобия. Смысл прост: чем больше $\Lambda(x)$ , тем сильнее данные «голосуют» за альтернативу. Критерий отвергает нулевую гипотезу там, где данные правдоподобнее при $H_1$ , чем при $H_0$ , ровно настолько, насколько позволяет бюджет ошибок $\alpha$ .

Ключевое слово здесь - «наиболее мощный». Мощность критерия $1 - \beta$ - это вероятность правильно отвергнуть $H_0$ , когда верна $H_1$ . Лемма утверждает, что критерий отношения правдоподобия даёт максимально возможную мощность при фиксированном $\alpha$ . Это сильное и точное оптимальное свойство, а не приближённое правило.

Отношение правдоподобия и один порог

На первый взгляд сравнивать $\Lambda(x)$ с порогом неудобно: это функция всей выборки. Но для многих распределений отношение правдоподобия монотонно зависит от одной достаточной статистики, и тогда условие $\Lambda(x) > k$ превращается в простое неравенство на эту статистику.

Две плотности: при H0 (синяя) и при H1 (розовая). Золотой порог c едет слева направо, и видно компромисс: вероятность ошибки I рода alpha (хвост H0 правее порога) убывает, а ошибка II рода beta (масса H1 левее порога) растёт. Разом обе ошибки не убрать

Покажем это на каноническом примере. Пусть $X_1, \dots, X_n$ - выборка из нормального распределения с известной дисперсией $\sigma^2$ , $H_0: \mu = \mu_0$ против $H_1: \mu = \mu_1$ , причём $\mu_1 > \mu_0$ . Логарифм отношения правдоподобия равен

$\ln \Lambda(x) = \frac{\mu_1 - \mu_0}{\sigma^2} \sum_{i=1}^n x_i - \frac{n(\mu_1^2 - \mu_0^2)}{2\sigma^2}.$

Поскольку $\mu_1 > \mu_0$ , эта величина строго возрастает по сумме $\sum x_i$ , а значит и по выборочному среднему $\bar{x}$ . Поэтому условие $\Lambda(x) > k$ эквивалентно условию $\bar{x} > c$ для некоторого порога $c$ . Видео выше показывает именно этот разрез: один порог делит ось выборочного среднего на область принятия и область отвержения.

Отношение правдоподобия монотонно растёт по выборочному среднему, поэтому условие Лямбда больше k равносильно x больше c: одна точка пересечения задаёт границу критической области

Удобнее перейти к стандартизованной статистике $z = \sqrt{n}\,(\bar{x} - \mu_0)/\sigma$ . При верной $H_0$ она имеет стандартное нормальное распределение, и порог определяется критическим значением

$z_c = \Phi^{-1}(1 - \alpha),$

где $\Phi$ - функция распределения стандартной нормали. Например, для одностороннего критерия уровня $\alpha = 0{,}05$ получаем $z_c \approx 1{,}645$ . Критерий отвергает $H_0$ , если наблюдённое значение $z$ превышает $z_c$ .

Критическая область и ошибки двух родов

Критическая область - это множество значений статистики, при которых $H_0$ отвергается. Для нашего примера это полупрямая $z > z_c$ , или, в исходных единицах, $\bar{x} > \mu_0 + z_c\,\sigma/\sqrt{n}$ . С двумя гипотезами всегда связаны две ошибки: ошибка первого рода (отвергнуть верную $H_0$ ) с вероятностью $\alpha$ и ошибка второго рода (не отвергнуть $H_0$ , когда верна $H_1$ ) с вероятностью $\beta$ . Лемма Неймана-Пирсона фиксирует $\alpha$ и минимизирует $\beta$ , то есть максимизирует мощность.

Две плотности под H0 и под H1, порог на критическом значении, хвост alpha (часть H0) и область мощности 1 минус beta (часть H1); скобка снизу измеряет мощность критерия

На рисунке видно геометрию решения. Синяя кривая - распределение статистики при $H_0$ , розовая - при $H_1$ . Золотой пунктир - порог $c$ . Площадь синего хвоста правее порога равна $\alpha$ : это вероятность ложно отвергнуть нулевую гипотезу. Площадь розовой области правее того же порога равна мощности $1 - \beta$ : это вероятность правильно поймать альтернативу. Когда гипотезы стоят дальше друг от друга, розовая область растёт, и мощность увеличивается, а уровень $\alpha$ остаётся прежним.

Как считать мощность критерия

Мощность зависит от того, насколько далеко альтернатива отстоит от нуля в единицах разброса статистики. Введём размер эффекта на одно наблюдение $d = (\mu_1 - \mu_0)/\sigma$ . Тогда при верной $H_1$ статистика $z$ имеет среднее $d\sqrt{n}$ и единичную дисперсию, поэтому мощность равна

$1 - \beta = \Phi\!\left(d\sqrt{n} - z_c\right), \qquad \beta = \Phi\!\left(z_c - d\sqrt{n}\right).$

Эта формула показывает три рычага влияния на мощность. Во-первых, чем больше эффект $d$ , тем правее уезжает розовая плотность и тем больше её масса попадает в критическую область. Во-вторых, чем больше объём выборки $n$ , тем сильнее раздвигаются распределения по стандартизованной оси (множитель $\sqrt{n}$ ). В-третьих, чем выше допустимый уровень $\alpha$ , тем меньше $z_c$ и тем легче попасть в область отвержения, но тогда растёт риск ошибки первого рода. Калькулятор в начале статьи строит правый график мощности как функцию $n$ : видно, что при фиксированных $\alpha$ и $d$ кривая мощности монотонно растёт и постепенно выходит на уровень, близкий к единице.

Когда гипотезы сложные

Лемма Неймана-Пирсона в чистом виде сформулирована для двух простых гипотез. На практике альтернатива часто сложная, например $H_1: \mu > \mu_0$ - целое семейство значений. Здесь спасает то, что для распределений с монотонным отношением правдоподобия (нормальное, показательное, пуассоновское и другие из экспоненциального семейства) граница критической области не зависит от конкретного значения $\theta_1$ внутри альтернативы. Поэтому один и тот же критерий $\bar{x} > c$ оказывается равномерно наиболее мощным сразу для всех альтернатив $\mu > \mu_0$ . Этот результат - прямое следствие леммы и теоремы Карлина-Рубина, и именно он оправдывает повсеместное использование односторонних $z$ - и $t$ -критериев.

Если же монотонности нет или альтернатива двусторонняя, равномерно наиболее мощного критерия может не существовать, и тогда используют обобщённое отношение правдоподобия и другие принципы. Но логическим фундаментом всей теории остаётся именно лемма Неймана-Пирсона.

Частые ошибки

Применение леммы к сложным гипотезам напрямую. Лемма в исходной форме работает только для двух простых гипотез. Для сложной альтернативы сначала нужно убедиться в монотонности отношения правдоподобия, иначе вывод о наиболее мощном критерии неверен.
Путаница порога $k$ и критического значения $z_c$ . Порог $k$ стоит на отношении правдоподобия, а $z_c$ - на стандартизованной статистике. Это разные числа, связанные монотонным преобразованием.
Забыть про направление неравенства. Если $\mu_1 < \mu_0$ , отношение правдоподобия убывает по $\bar{x}$ , и критическая область становится левым хвостом $\bar{x} < c$ , а не правым.
Считать мощность без учёта $n$ . Мощность зависит от $d\sqrt{n}$ , а не от одного $d$ . При малом объёме выборки даже большой эффект может давать низкую мощность.
Смешивать уровень значимости и мощность. Уровень $\alpha$ относится к ситуации, когда верна $H_0$ , а мощность - к ситуации, когда верна $H_1$ . Это две разные вероятности на двух разных распределениях.

FAQ

Почему критерий отношения правдоподобия самый мощный? Потому что он включает в критическую область именно те исходы, где данные относительно правдоподобнее при $H_1$ . При фиксированном бюджете ошибки первого рода такой выбор отдаёт критической области максимально возможную массу альтернативного распределения, а значит и максимальную мощность. Строгое доказательство сравнивает критерий Неймана-Пирсона с любым другим критерием того же уровня и показывает, что мощность последнего не больше.

Чем отличается уровень значимости от мощности критерия? Уровень значимости $\alpha$ - это вероятность ошибки первого рода, то есть отвергнуть $H_0$ , когда она верна. Мощность $1 - \beta$ - это вероятность правильно отвергнуть $H_0$ , когда верна альтернатива $H_1$ . Лемма фиксирует $\alpha$ и делает мощность наибольшей из возможных.

Как лемма Неймана-Пирсона связана с $z$ - и $t$ -критериями? Для нормальной выборки наиболее мощный критерий из леммы сводится к порогу на выборочном среднем, а это и есть односторонний $z$ -критерий (при известной дисперсии) или $t$ -критерий (при оценённой). Поэтому привычные критерии не выбраны произвольно: они оптимальны в смысле леммы.

Коротко

Лемма Неймана-Пирсона утверждает, что для простой гипотезы против простой альтернативы наиболее мощный критерий уровня $\alpha$ отвергает $H_0$ при $\Lambda(x) = L(x;\theta_1)/L(x;\theta_0) > k$ , где порог $k$ выбран из условия на $\alpha$ . Для распределений с монотонным отношением правдоподобия это сводится к одному порогу на достаточной статистике, например к условию $\bar{x} > c$ для нормальной выборки. Мощность критерия равна $1 - \beta = \Phi(d\sqrt{n} - z_c)$ и растёт с размером эффекта и объёмом выборки. Эта лемма - фундамент теории проверки гипотез и причина, по которой односторонние $z$ - и $t$ -критерии считаются оптимальными.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Лемма Неймана-Пирсона: наиболее мощный критерий

Что утверждает лемма Неймана-Пирсона

Отношение правдоподобия и один порог

Критическая область и ошибки двух родов

Как считать мощность критерия

Когда гипотезы сложные

Частые ошибки

FAQ

Коротко

Читайте также

Мощность статистического критерия: формула и расчёт

Частный F-критерий: значимость фактора в регрессии

Критерий Фишера: сравнение двух дисперсий