EssayAI
Блог
Блог
Математика и алгоритмы

Нулевая и альтернативная гипотезы: как проверить

11 июня 2026Время чтения: 9 минут
#статистическая гипотеза#нулевая гипотеза#альтернативная гипотеза#p-value#z-критерий
Нулевая и альтернативная гипотезы: как проверить

Любое статистическое исследование начинается с пары утверждений: нулевой гипотезы H0H_0 (то, что мы проверяем) и альтернативной гипотезы H1H_1 (то, что принимается, если H0H_0 опровергнута данными). Главный вопрос - насколько наблюдаемые данные несовместимы с H0H_0? Ответ даёт p-value: вероятность получить результат не менее «экстремальный», чем наблюдаемый, если бы H0H_0 была верна. Чтобы сразу увидеть, как значение z-статистики и уровень значимости α\alpha определяют критическую область и вывод, попробуйте калькулятор ниже.

Что такое нулевая и альтернативная гипотезы

Нулевая гипотеза H0H_0 - это утверждение об отсутствии эффекта: среднее равно заданному значению, разница между группами равна нулю, коэффициент корреляции равен нулю. Это то, что мы стремимся опровергнуть. Альтернативная гипотеза H1H_1 описывает то, что мы ищем: среднее больше, меньше или просто не равно заявленному.

Формально для проверки среднего по нормальной генеральной совокупности с известным σ\sigma:

H0:μ=μ0противH1:μμ0  (двусторонняя).H_0: \mu = \mu_0 \qquad \text{против} \qquad H_1: \mu \neq \mu_0 \;\text{(двусторонняя)}.

Пара H0H_0/H1H_1 задаётся до сбора данных - это принципиально важно. Выбирать гипотезу после просмотра данных, «подгоняя» её под результат, - грубое нарушение логики вывода.

Терминология взята из британской традиции (Фишер, Пирсон, Нейман): нулевая гипотеза исторически называлась «нулевой», потому что описывала нулевой эффект - «лекарство не действует», «монета не фальшивая». Альтернативная гипотеза соответствует тому, во что исследователь хочет поверить, опираясь на прикладную теорию. Именно поэтому статистика не доказывает H1H_1 напрямую - она опровергает H0H_0 на заданном уровне риска.

Стандартная нормаль N(0,1): при движении z_obs от 0 к 3 красные хвосты (область отвержения alpha=0,05) остаются фиксированными, а золотая линия z пересекает границу - в этот момент H0 отвергается

Стандартизованная статистика и p-value

Если выборка объёма nn взята из N(μ,σ2)N(\mu, \sigma^2) и σ\sigma известна, то при H0H_0 статистика

z=xˉμ0σ/nz = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}

имеет стандартное нормальное распределение N(0,1)N(0, 1).

Двусторонний p-value вычисляется как вероятность попасть в хвосты, более экстремальные, чем наблюдаемое z|z|:

p=2(1Φ(z)),p = 2 \cdot \bigl(1 - \Phi(|z|)\bigr),

где Φ\Phi - функция стандартного нормального распределения. Для одностороннего правого теста (H1:μ>μ0H_1: \mu > \mu_0):

p=1Φ(z).p = 1 - \Phi(z).

Именно эти формулы использует калькулятор выше: двигайте ползунок zz - и p-value пересчитывается мгновенно, сразу показывая, попадает ли золотая линия в красную критическую область.

p-value не говорит о вероятности того, что H0 верна. Это вероятность получить наблюдаемый или более экстремальный результат при условии, что H0 верна. Путаница этих двух утверждений - одна из самых частых ошибок в интерпретации статистических тестов.

Уровень значимости и критическое значение

Уровень значимости α\alpha задаётся заранее и определяет, насколько строго мы проверяем гипотезу. Это максимально допустимая вероятность совершить ошибку I рода - отвергнуть H0H_0, когда она верна. Типичные значения: α=0,05\alpha = 0{,}05 (5 %) и α=0,01\alpha = 0{,}01 (1 %).

Критическое значение zкрz_{кр} - порог, при котором ровно доля α\alpha нормального распределения находится в критической зоне. Для двустороннего теста:

zкр=z1α/2=Φ1(1α/2).z_{кр} = z_{1 - \alpha/2} = \Phi^{-1}(1 - \alpha/2).

При α=0,05\alpha = 0{,}05 получается zкр1,96z_{кр} \approx 1{,}96; при α=0,01\alpha = 0{,}01 - zкр2,576z_{кр} \approx 2{,}576.

H0 отвергается, когда zнабл>zкр|z_{набл}| > z_{кр}, что эквивалентно условию p<αp < \alpha.

Критическая область двустороннего z-теста: хвосты площадью alpha/2 каждый по краям стандартной нормали, граница проходит на z=1,96 при alpha=0,05
Критическая область двустороннего z-теста: хвосты площадью alpha/2 каждый по краям стандартной нормали, граница проходит на z=1,96 при alpha=0,05

Ошибки I и II рода

При проверке гипотез возможны два типа ошибок:

H0H_0 вернаH0H_0 неверна
Отвергаем H0H_0Ошибка I рода (α\alpha)Правильное решение (мощность 1β1-\beta)
Не отвергаем H0H_0Правильное решениеОшибка II рода (β\beta)

Ошибка I рода - ложная тревога: данные случайно попали в критическую зону, хотя H0H_0 верна. Её вероятность - это и есть α\alpha. Уменьшение α\alpha снижает число ложных тревог, но одновременно увеличивает β\beta.

Ошибка II рода - пропуск эффекта: H1H_1 верна, но данных не хватило, чтобы отвергнуть H0H_0. Вероятность β\beta зависит от объёма выборки nn, размера эффекта и α\alpha. Мощность критерия - 1β1 - \beta: доля экспериментов, в которых мы корректно отвергаем H0H_0 при реально существующем эффекте.

Между α\alpha и β\beta существует компромисс: при фиксированном nn ужесточение α\alpha (скажем, с 0,05 до 0,01) автоматически увеличивает β\beta - порог становится выше, и критерий «пропускает» больше реальных эффектов. Выход один - увеличивать nn. Стандартный целевой уровень в прикладных науках: мощность не ниже 0,8 (80 %), то есть β0,2\beta \leq 0{,}2. Расчёт необходимого объёма выборки по заданным α\alpha, β\beta и размеру эффекта d=(μ1μ0)/σd = (\mu_1 - \mu_0)/\sigma даёт формула:

n(z1α/2+z1βd)2.n \geq \left(\frac{z_{1-\alpha/2} + z_{1-\beta}}{d}\right)^2.

При α=0,05\alpha = 0{,}05, β=0,2\beta = 0{,}2 и d=0,5d = 0{,}5 (средний эффект по Коэну) получаем n((1,96+0,84)/0,5)2=(5,6)232n \geq ((1{,}96 + 0{,}84)/0{,}5)^2 = (5{,}6)^2 \approx 32.

Пример полного решения

Условие. Производитель утверждает, что среднее время работы батарей μ0=300\mu_0 = 300 ч. Выборка n=36n = 36 батарей показала xˉ=312\bar{x} = 312 ч при известном σ=48\sigma = 48 ч. Проверить на уровне α=0,05\alpha = 0{,}05: не занижено ли заявленное время (правосторонний тест).

Шаг 1. Формулируем гипотезы:

H0:μ=300,H1:μ>300.H_0: \mu = 300, \qquad H_1: \mu > 300.

Шаг 2. Вычисляем статистику:

z=31230048/36=128=1,5.z = \frac{312 - 300}{48 / \sqrt{36}} = \frac{12}{8} = 1{,}5.

Шаг 3. Критическое значение для одностороннего теста при α=0,05\alpha = 0{,}05:

zкр=z0,951,645.z_{кр} = z_{0{,}95} \approx 1{,}645.

Шаг 4. Сравниваем: z=1,5<1,645z = 1{,}5 < 1{,}645. p-value =1Φ(1,5)0,067>0,05= 1 - \Phi(1{,}5) \approx 0{,}067 > 0{,}05.

Вывод. H0H_0 не отвергается. При выбранном уровне значимости нет достаточных оснований считать реальное среднее выше заявленного. Обратите внимание: «не отвергается» не значит «доказана» - мы лишь констатируем, что данные не противоречат H0H_0.

Двусторонний и односторонние критерии

Выбор вида альтернативы влияет на расположение критической области:

  • Двусторонняя (H1:μμ0H_1: \mu \neq \mu_0) - область отвержения с двух сторон нормали, каждый хвост занимает α/2\alpha/2. Критичнее к смещениям в обоих направлениях.
  • Правосторонняя (H1:μ>μ0H_1: \mu > \mu_0) - вся критическая область в правом хвосте. Чувствительнее к эффектам в одном направлении, но полностью слепа к эффектам в противоположном.
  • Левосторонняя (H1:μ<μ0H_1: \mu < \mu_0) - зеркально правосторонней.

Вид альтернативы должен определяться содержательными соображениями, а не тем, какой тест легче отвергнуть. Переключайте «Вид альтернативы» в калькуляторе - критическая зона меняется на глазах.

Важное следствие: при одном и том же zнабл=1,8z_{набл} = 1{,}8 двусторонний тест с α=0,05\alpha = 0{,}05 даёт p=2(1Φ(1,8))0,072p = 2(1-\Phi(1{,}8)) \approx 0{,}072 - не значимо. Правосторонний тест той же задачи даёт p=1Φ(1,8)0,036p = 1-\Phi(1{,}8) \approx 0{,}036 - значимо. Именно поэтому нельзя выбирать вид теста после просмотра данных: это удваивает реальный уровень ошибки I рода.

Сравнение критических областей: двусторонний тест (хвосты по 2,5%) против правостороннего (5% в одном хвосте) при alpha=0,05
Сравнение критических областей: двусторонний тест (хвосты по 2,5%) против правостороннего (5% в одном хвосте) при alpha=0,05

Связь с доверительными интервалами

Проверка гипотезы и доверительный интервал - два способа описать одно и то же. Если 95%95\%-доверительный интервал для μ\mu не включает μ0\mu_0, то двусторонний z-тест на уровне α=0,05\alpha = 0{,}05 отвергнет H0:μ=μ0H_0: \mu = \mu_0. И наоборот: если H0H_0 отвергается, μ0\mu_0 лежит вне соответствующего доверительного интервала. Доверительный интервал несёт больше информации: он показывает не только факт значимости, но и диапазон правдоподобных значений μ\mu. Поэтому в современных публикациях рекомендуется приводить оба - и p-value, и 95 % ДИ.

Доверительный интервал для μ\mu при известном σ\sigma строится так:

xˉ±z1α/2σn.\bar{x} \pm z_{1-\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}.

При α=0,05\alpha = 0{,}05 множитель z0,9751,96z_{0{,}975} \approx 1{,}96 - то самое критическое значение z-теста. Если выборочное среднее xˉ\bar{x} удалилось от μ0\mu_0 на расстояние большее, чем 1,96σ/n1{,}96 \cdot \sigma/\sqrt{n}, это одновременно означает и значимое отвержение H0H_0, и то, что μ0\mu_0 выходит за границы доверительного интервала.

Частые ошибки

  • Подбор гипотезы после данных. Если H0H_0 сформулирована уже после просмотра результатов, контроль ошибки I рода теряется - уровень α\alpha становится формальностью.
  • «p > 0,05» означает, что H0H_0 доказана. Нет: отсутствие значимости - лишь недостаток доказательств против H0H_0, а не её подтверждение.
  • Малая выборка даёт «незначимый» результат. При n=10n = 10 и реальном эффекте критерий может его просто не «увидеть» (низкая мощность). Нужно оценивать мощность до начала исследования.
  • Подстановка в формулу z при неизвестном σ\sigma. Если генеральное стандартное отклонение неизвестно и оценивается по выборке, используют t-критерий Стьюдента, а не z-критерий.
  • Расчёт одностороннего p по формуле двустороннего. Делить p-значение двустороннего теста пополам - допустимо только для симметричных распределений и только при правильно выбранном направлении ещё до сбора данных.

FAQ

Можно ли получить p-value точно равное нулю? Нет: в непрерывных распределениях вероятность точного значения равна нулю, а вычисленный p-value - вероятность хвоста, которая строго больше нуля. Запись «p < 0,001» означает лишь, что программа округлила число до трёх знаков.

Нулевая гипотеза всегда о равенстве нулю? Нет, нулевая гипотеза - утверждение об отсутствии определённого эффекта, конкретное значение не обязано быть нулём. H0:μ=300H_0: \mu = 300 - типичная нулевая гипотеза, где 300 - заявленный стандарт.

Что выбрать - z-тест или t-тест? z-тест применяется, когда σ\sigma известна или выборка очень большая (n>30n > 30 и приближение нормально). В большинстве прикладных задач σ\sigma неизвестна и оценивается по данным - тогда используют t-критерий; при росте nn распределение Стьюдента стремится к нормальному, и разница исчезает.

Коротко

Нулевая гипотеза H0H_0 предполагает отсутствие эффекта; альтернативная H1H_1 - его наличие. Статистика z=(xˉμ0)/(σ/n)z = (\bar{x} - \mu_0)/(\sigma/\sqrt{n}) при истинной H0H_0 имеет распределение N(0,1)N(0,1). p-value - вероятность наблюдать не менее экстремальный результат при верной H0H_0; если p<αp < \alpha, нулевую гипотезу отвергают. Уровень значимости α\alpha контролирует ошибку I рода, а мощность 1β1 - \beta - способность обнаружить реальный эффект.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также