Нулевая и альтернативная гипотезы: как проверить

11 июня 2026Время чтения: 9 минут

#статистическая гипотеза#нулевая гипотеза#альтернативная гипотеза#p-value#z-критерий

Любое статистическое исследование начинается с пары утверждений: нулевой гипотезы $H_0$ (то, что мы проверяем) и альтернативной гипотезы $H_1$ (то, что принимается, если $H_0$ опровергнута данными). Главный вопрос - насколько наблюдаемые данные несовместимы с $H_0$ ? Ответ даёт p-value: вероятность получить результат не менее «экстремальный», чем наблюдаемый, если бы $H_0$ была верна. Чтобы сразу увидеть, как значение z-статистики и уровень значимости $\alpha$ определяют критическую область и вывод, попробуйте калькулятор ниже.

Что такое нулевая и альтернативная гипотезы

Нулевая гипотеза $H_0$ - это утверждение об отсутствии эффекта: среднее равно заданному значению, разница между группами равна нулю, коэффициент корреляции равен нулю. Это то, что мы стремимся опровергнуть. Альтернативная гипотеза $H_1$ описывает то, что мы ищем: среднее больше, меньше или просто не равно заявленному.

Формально для проверки среднего по нормальной генеральной совокупности с известным $\sigma$ :

H_0: \mu = \mu_0 \qquad \text{против} \qquad H_1: \mu \neq \mu_0 \;\text{(двусторонняя)}.

Пара $H_0$ / $H_1$ задаётся до сбора данных - это принципиально важно. Выбирать гипотезу после просмотра данных, «подгоняя» её под результат, - грубое нарушение логики вывода.

Терминология взята из британской традиции (Фишер, Пирсон, Нейман): нулевая гипотеза исторически называлась «нулевой», потому что описывала нулевой эффект - «лекарство не действует», «монета не фальшивая». Альтернативная гипотеза соответствует тому, во что исследователь хочет поверить, опираясь на прикладную теорию. Именно поэтому статистика не доказывает $H_1$ напрямую - она опровергает $H_0$ на заданном уровне риска.

Стандартная нормаль N(0,1): при движении z_obs от 0 к 3 красные хвосты (область отвержения alpha=0,05) остаются фиксированными, а золотая линия z пересекает границу - в этот момент H0 отвергается

Стандартизованная статистика и p-value

Если выборка объёма $n$ взята из $N(\mu, \sigma^2)$ и $\sigma$ известна, то при $H_0$ статистика

z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}

имеет стандартное нормальное распределение $N(0, 1)$ .

Двусторонний p-value вычисляется как вероятность попасть в хвосты, более экстремальные, чем наблюдаемое $|z|$ :

p = 2 \cdot \bigl(1 - \Phi(|z|)\bigr),

где $\Phi$ - функция стандартного нормального распределения. Для одностороннего правого теста ( $H_1: \mu > \mu_0$ ):

p = 1 - \Phi(z).

Именно эти формулы использует калькулятор выше: двигайте ползунок $z$ - и p-value пересчитывается мгновенно, сразу показывая, попадает ли золотая линия в красную критическую область.

p-value не говорит о вероятности того, что H0 верна. Это вероятность получить наблюдаемый или более экстремальный результат при условии, что H0 верна. Путаница этих двух утверждений - одна из самых частых ошибок в интерпретации статистических тестов.

Уровень значимости и критическое значение

Уровень значимости $\alpha$ задаётся заранее и определяет, насколько строго мы проверяем гипотезу. Это максимально допустимая вероятность совершить ошибку I рода - отвергнуть $H_0$ , когда она верна. Типичные значения: $\alpha = 0{,}05$ (5 %) и $\alpha = 0{,}01$ (1 %).

Критическое значение $z_{кр}$ - порог, при котором ровно доля $\alpha$ нормального распределения находится в критической зоне. Для двустороннего теста:

z_{кр} = z_{1 - \alpha/2} = \Phi^{-1}(1 - \alpha/2).

При $\alpha = 0{,}05$ получается $z_{кр} \approx 1{,}96$ ; при $\alpha = 0{,}01$ - $z_{кр} \approx 2{,}576$ .

H0 отвергается, когда $|z_{набл}| > z_{кр}$ , что эквивалентно условию $p < \alpha$ .

Критическая область двустороннего z-теста: хвосты площадью alpha/2 каждый по краям стандартной нормали, граница проходит на z=1,96 при alpha=0,05

Ошибки I и II рода

При проверке гипотез возможны два типа ошибок:

	$H_0$ верна	$H_0$ неверна
Отвергаем $H_0$	Ошибка I рода ( $\alpha$ )	Правильное решение (мощность $1-\beta$ )
Не отвергаем $H_0$	Правильное решение	Ошибка II рода ( $\beta$ )

Ошибка I рода - ложная тревога: данные случайно попали в критическую зону, хотя $H_0$ верна. Её вероятность - это и есть $\alpha$ . Уменьшение $\alpha$ снижает число ложных тревог, но одновременно увеличивает $\beta$ .

Ошибка II рода - пропуск эффекта: $H_1$ верна, но данных не хватило, чтобы отвергнуть $H_0$ . Вероятность $\beta$ зависит от объёма выборки $n$ , размера эффекта и $\alpha$ . Мощность критерия - $1 - \beta$ : доля экспериментов, в которых мы корректно отвергаем $H_0$ при реально существующем эффекте.

Между $\alpha$ и $\beta$ существует компромисс: при фиксированном $n$ ужесточение $\alpha$ (скажем, с 0,05 до 0,01) автоматически увеличивает $\beta$ - порог становится выше, и критерий «пропускает» больше реальных эффектов. Выход один - увеличивать $n$ . Стандартный целевой уровень в прикладных науках: мощность не ниже 0,8 (80 %), то есть $\beta \leq 0{,}2$ . Расчёт необходимого объёма выборки по заданным $\alpha$ , $\beta$ и размеру эффекта $d = (\mu_1 - \mu_0)/\sigma$ даёт формула:

n \geq \left(\frac{z_{1-\alpha/2} + z_{1-\beta}}{d}\right)^2.

При $\alpha = 0{,}05$ , $\beta = 0{,}2$ и $d = 0{,}5$ (средний эффект по Коэну) получаем $n \geq ((1{,}96 + 0{,}84)/0{,}5)^2 = (5{,}6)^2 \approx 32$ .

Пример полного решения

Условие. Производитель утверждает, что среднее время работы батарей $\mu_0 = 300$ ч. Выборка $n = 36$ батарей показала $\bar{x} = 312$ ч при известном $\sigma = 48$ ч. Проверить на уровне $\alpha = 0{,}05$ : не занижено ли заявленное время (правосторонний тест).

Шаг 1. Формулируем гипотезы:

H_0: \mu = 300, \qquad H_1: \mu > 300.

Шаг 2. Вычисляем статистику:

z = \frac{312 - 300}{48 / \sqrt{36}} = \frac{12}{8} = 1{,}5.

Шаг 3. Критическое значение для одностороннего теста при $\alpha = 0{,}05$ :

z_{кр} = z_{0{,}95} \approx 1{,}645.

Шаг 4. Сравниваем: $z = 1{,}5 < 1{,}645$ . p-value $= 1 - \Phi(1{,}5) \approx 0{,}067 > 0{,}05$ .

Вывод. $H_0$ не отвергается. При выбранном уровне значимости нет достаточных оснований считать реальное среднее выше заявленного. Обратите внимание: «не отвергается» не значит «доказана» - мы лишь констатируем, что данные не противоречат $H_0$ .

Двусторонний и односторонние критерии

Выбор вида альтернативы влияет на расположение критической области:

Двусторонняя ( $H_1: \mu \neq \mu_0$ ) - область отвержения с двух сторон нормали, каждый хвост занимает $\alpha/2$ . Критичнее к смещениям в обоих направлениях.
Правосторонняя ( $H_1: \mu > \mu_0$ ) - вся критическая область в правом хвосте. Чувствительнее к эффектам в одном направлении, но полностью слепа к эффектам в противоположном.
Левосторонняя ( $H_1: \mu < \mu_0$ ) - зеркально правосторонней.

Вид альтернативы должен определяться содержательными соображениями, а не тем, какой тест легче отвергнуть. Переключайте «Вид альтернативы» в калькуляторе - критическая зона меняется на глазах.

Важное следствие: при одном и том же $z_{набл} = 1{,}8$ двусторонний тест с $\alpha = 0{,}05$ даёт $p = 2(1-\Phi(1{,}8)) \approx 0{,}072$ - не значимо. Правосторонний тест той же задачи даёт $p = 1-\Phi(1{,}8) \approx 0{,}036$ - значимо. Именно поэтому нельзя выбирать вид теста после просмотра данных: это удваивает реальный уровень ошибки I рода.

Сравнение критических областей: двусторонний тест (хвосты по 2,5%) против правостороннего (5% в одном хвосте) при alpha=0,05

Связь с доверительными интервалами

Проверка гипотезы и доверительный интервал - два способа описать одно и то же. Если $95\%$ -доверительный интервал для $\mu$ не включает $\mu_0$ , то двусторонний z-тест на уровне $\alpha = 0{,}05$ отвергнет $H_0: \mu = \mu_0$ . И наоборот: если $H_0$ отвергается, $\mu_0$ лежит вне соответствующего доверительного интервала. Доверительный интервал несёт больше информации: он показывает не только факт значимости, но и диапазон правдоподобных значений $\mu$ . Поэтому в современных публикациях рекомендуется приводить оба - и p-value, и 95 % ДИ.

Доверительный интервал для $\mu$ при известном $\sigma$ строится так:

\bar{x} \pm z_{1-\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}.

При $\alpha = 0{,}05$ множитель $z_{0{,}975} \approx 1{,}96$ - то самое критическое значение z-теста. Если выборочное среднее $\bar{x}$ удалилось от $\mu_0$ на расстояние большее, чем $1{,}96 \cdot \sigma/\sqrt{n}$ , это одновременно означает и значимое отвержение $H_0$ , и то, что $\mu_0$ выходит за границы доверительного интервала.

Частые ошибки

Подбор гипотезы после данных. Если $H_0$ сформулирована уже после просмотра результатов, контроль ошибки I рода теряется - уровень $\alpha$ становится формальностью.
«p > 0,05» означает, что $H_0$ доказана. Нет: отсутствие значимости - лишь недостаток доказательств против $H_0$ , а не её подтверждение.
Малая выборка даёт «незначимый» результат. При $n = 10$ и реальном эффекте критерий может его просто не «увидеть» (низкая мощность). Нужно оценивать мощность до начала исследования.
Подстановка в формулу z при неизвестном $\sigma$ . Если генеральное стандартное отклонение неизвестно и оценивается по выборке, используют t-критерий Стьюдента, а не z-критерий.
Расчёт одностороннего p по формуле двустороннего. Делить p-значение двустороннего теста пополам - допустимо только для симметричных распределений и только при правильно выбранном направлении ещё до сбора данных.

FAQ

Можно ли получить p-value точно равное нулю? Нет: в непрерывных распределениях вероятность точного значения равна нулю, а вычисленный p-value - вероятность хвоста, которая строго больше нуля. Запись «p < 0,001» означает лишь, что программа округлила число до трёх знаков.

Нулевая гипотеза всегда о равенстве нулю? Нет, нулевая гипотеза - утверждение об отсутствии определённого эффекта, конкретное значение не обязано быть нулём. $H_0: \mu = 300$ - типичная нулевая гипотеза, где 300 - заявленный стандарт.

Что выбрать - z-тест или t-тест? z-тест применяется, когда $\sigma$ известна или выборка очень большая ( $n > 30$ и приближение нормально). В большинстве прикладных задач $\sigma$ неизвестна и оценивается по данным - тогда используют t-критерий; при росте $n$ распределение Стьюдента стремится к нормальному, и разница исчезает.

Коротко

Нулевая гипотеза $H_0$ предполагает отсутствие эффекта; альтернативная $H_1$ - его наличие. Статистика $z = (\bar{x} - \mu_0)/(\sigma/\sqrt{n})$ при истинной $H_0$ имеет распределение $N(0,1)$ . p-value - вероятность наблюдать не менее экстремальный результат при верной $H_0$ ; если $p < \alpha$ , нулевую гипотезу отвергают. Уровень значимости $\alpha$ контролирует ошибку I рода, а мощность $1 - \beta$ - способность обнаружить реальный эффект.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN