Критерий Фишера: сравнение двух дисперсий

11 июня 2026Время чтения: 8 минут

#критерий фишера#сравнение дисперсий#f-распределение#проверка гипотез#степени свободы

Критерий Фишера (F-критерий) отвечает на простой вопрос: можно ли считать, что две выборки имеют одинаковый разброс, или одна из них «гуляет» заметно сильнее другой. В основе лежит одна идея: если поделить большую выборочную дисперсию на меньшую, то при равных генеральных дисперсиях это отношение не должно сильно отличаться от единицы. Чем дальше отношение уходит вправо, тем меньше верится в равенство дисперсий. Ниже разберём, как составить F-статистику, какие степени свободы у неё бывают, как найти критическое значение и сделать вывод, а также где студенты чаще всего ошибаются. Чтобы сразу почувствовать связь дисперсий, объёмов выборок и порога значимости, покрутите калькулятор ниже: он считает F, критическое значение и p-значение и показывает, попало ли наблюдённое F в критический хвост.

Что проверяет критерий Фишера

Пусть из двух нормально распределённых генеральных совокупностей взяты независимые выборки и по ним посчитаны исправленные выборочные дисперсии $s_1^2$ и $s_2^2$ . Нулевая гипотеза утверждает, что генеральные дисперсии равны:

$H_0: \sigma_1^2 = \sigma_2^2, \qquad H_1: \sigma_1^2 \ne \sigma_2^2.$

Содержательно это вопрос об однородности точности или стабильности: одинаково ли точны два прибора, два станка, два метода измерения. Если разброс данных значимо разный, то и сравнивать средние этих выборок обычным способом уже нельзя, поэтому проверку равенства дисперсий часто делают первым шагом анализа. Похожую задачу для трёх и более групп решает однофакторный дисперсионный анализ ANOVA, а более устойчивый к ненормальности вариант для двух выборок даёт тест Левена на равенство дисперсий.

Формула F-статистики и степени свободы

Сама статистика критерия - это отношение двух выборочных дисперсий, причём по соглашению в числитель ставят большую из них:

$F = \frac{s_б^2}{s_м^2}, \qquad s_б^2 \ge s_м^2.$

Тогда $F \ge 1$ всегда, и работать нужно только с правым хвостом распределения - это заметно упрощает работу с таблицами. У статистики две степени свободы: одна у числителя, другая у знаменателя. Каждая равна объёму своей выборки минус единица:

$df_1 = n_б - 1, \qquad df_2 = n_м - 1,$

где $n_б$ - объём той выборки, чья дисперсия оказалась больше (она в числителе), а $n_м$ - объём второй. Порядок здесь критичен: $df_1$ относится именно к числителю. Если при равенстве генеральных дисперсий многократно повторять эксперимент, значения $F$ складываются в распределение Фишера $F(df_1, df_2)$ - несимметричную кривую, прижатую к нулю слева и с длинным хвостом справа.

По кривой F-распределения едет золотой маркер наблюдённого F. Пока отношение дисперсий невелико, F сидит у вершины и различие не значимо; когда отношение растёт и F пересекает критический порог Fкр, оно попадает в красную зону отклонения H0

На анимации видно главное: пока выборочные дисперсии близки, отношение $F$ держится около единицы, у вершины кривой, и попадает в типичные значения. Но стоит разбросу одной выборки заметно превысить разброс другой, как $F$ уезжает вправо и в какой-то момент пересекает критическую границу. Именно положение этой границы и решает, считать различие случайным или значимым.

Критическое значение и правило вывода

Критическое значение $F_{кр}$ - это квантиль распределения Фишера, правее которого лежит ровно доля $\alpha$ всей площади под кривой (уровень значимости, обычно 0.05 или 0.01). Его берут из таблицы критических значений распределения Фишера на пересечении столбца $df_1$ и строки $df_2$ либо считают численно. Подробно про чтение таблицы - в разборе про критические значения распределения Фишера.

Кривая F-распределения с критическим хвостом: правее Fкр лежит площадь, равная уровню значимости α = 0.05, и попадание наблюдённого F в эту зону означает отклонение H0

Правило принятия решения простое и сводится к одному сравнению:

если $F > F_{кр}$ , наблюдённое значение попало в критический хвост - нулевую гипотезу отклоняют, дисперсии различаются значимо;
если $F \le F_{кр}$ , оснований отклонить $H_0$ нет - различие разбросов считают случайным.

Тот же вывод можно получить через p-значение: это вероятность увидеть $F$ не меньше наблюдённого при верной $H_0$ , то есть площадь правого хвоста за точкой $F$ . Если $p < \alpha$ , гипотезу отклоняют. Калькулятор выше показывает обе величины одновременно, чтобы было видно, как они согласуются: $F > F_{кр}$ и $p < \alpha$ всегда срабатывают вместе.

Односторонний и двусторонний варианты

Здесь кроется тонкость, на которой легко споткнуться. Записывая $F = s_б^2 / s_м^2$ с большей дисперсией в числителе, мы заранее «подсматриваем» в данные и выбираем направление. Поэтому при двусторонней альтернативе $H_1: \sigma_1^2 \ne \sigma_2^2$ критическое значение нужно брать на уровне $\alpha/2$ , а не $\alpha$ : вся вероятность ошибки распределена на два хвоста, но мы свернули задачу к одному. Если же по смыслу задачи заранее известно, какая дисперсия должна быть больше (например, проверяем, что новый метод не ухудшил точность), альтернатива односторонняя, и критическое значение берут на полном уровне $\alpha$ . В типовых учебных задачах формулировка обычно двусторонняя, и грамотнее использовать $\alpha/2$ ; в калькуляторе для наглядности порог считается по выбранному $\alpha$ напрямую, поэтому при строгой двусторонней постановке выбирайте, например, $\alpha = 0.025$ вместо 0.05.

Пример решения типовой задачи

Разберём стандартную формулировку: два станка изготавливают детали, и по выборкам получены исправленные дисперсии размера $s_1^2 = 4{,}8$ при $n_1 = 10$ и $s_2^2 = 1{,}2$ при $n_2 = 10$ . Нужно при $\alpha = 0{,}05$ проверить, одинакова ли точность станков.

Большая дисперсия - у первого станка, ставим её в числитель:

$F = \frac{s_1^2}{s_2^2} = \frac{4{,}8}{1{,}2} = 4{,}0.$

Степени свободы: $df_1 = n_1 - 1 = 9$ для числителя и $df_2 = n_2 - 1 = 9$ для знаменателя. По таблице распределения Фишера для уровня значимости 0.05 и степеней свободы $(9, 9)$ находим критическое значение:

$F_{кр}(0{,}05;\, 9,\, 9) \approx 3{,}18.$

Сравниваем: $F = 4{,}0 > 3{,}18 = F_{кр}$ . Наблюдённое значение попало в критический хвост, поэтому нулевую гипотезу о равенстве дисперсий отклоняем: точность станков различается значимо. Достигнутый уровень значимости здесь $p \approx 0{,}026$ , что меньше 0.05 и подтверждает тот же вывод. Если бы отношение оказалось, скажем, $F = 2{,}5$ , оно не дотянуло бы до порога, и гипотезу о равной точности пришлось бы оставить.

Частые ошибки

Меньшая дисперсия в числителе. По соглашению в числитель ставят большую выборочную дисперсию, чтобы $F \ge 1$ . Если перевернуть дробь, выйдет $F < 1$ , и сравнение с табличным $F_{кр}$ (рассчитанным для правого хвоста) даст бессмысленный результат.
Перепутаны степени свободы. $df_1$ всегда относится к числителю, $df_2$ - к знаменателю. В таблице они стоят на разных осях, и перестановка $(df_1, df_2) \to (df_2, df_1)$ при неравных $n$ даёт другое критическое значение.
Использование $n$ вместо $n-1$ . Степень свободы равна объёму выборки минус единица, а не самому объёму. Эта же поправка уже заложена в исправленную дисперсию $s^2$ .
Игнор уровня $\alpha/2$ при двусторонней проверке. Раз большая дисперсия выбрана по данным, для альтернативы $\sigma_1^2 \ne \sigma_2^2$ критическое значение берут на уровне $\alpha/2$ , иначе фактическая вероятность ошибки I рода вдвое выше заявленной.
Применение критерия к ненормальным данным. F-критерий очень чувствителен к отклонению от нормальности. Если есть сомнения в распределении, надёжнее тест Левена или Брауна-Форсайта.

FAQ

Какую дисперсию ставить в числитель критерия Фишера? Большую из двух выборочных дисперсий. Тогда статистика $F = s_б^2 / s_м^2$ всегда не меньше единицы, и достаточно работать только с правым критическим значением из таблицы. Степени свободы числителя при этом берутся у той выборки, чья дисперсия попала в числитель.

Чем критерий Фишера отличается от критерия Стьюдента? Критерий Стьюдента сравнивает средние двух выборок, а критерий Фишера - их дисперсии (разбросы). Часто их применяют по очереди: сначала F-критерием проверяют равенство дисперсий, и от результата зависит, какую версию t-критерия использовать для средних.

Что делать, если F получилось меньше единицы? Это признак того, что в числитель попала меньшая дисперсия. Поменяйте выборки местами так, чтобы большая дисперсия была сверху, и одновременно переставьте степени свободы - числитель и знаменатель должны соответствовать своим выборкам.

Коротко

Критерий Фишера сравнивает две дисперсии через отношение $F = s_б^2 / s_м^2$ , где большая выборочная дисперсия стоит в числителе, а степени свободы равны $df_1 = n_б - 1$ и $df_2 = n_м - 1$ . Наблюдённое значение сравнивают с критическим $F_{кр}(\alpha; df_1, df_2)$ из таблицы распределения Фишера: если $F > F_{кр}$ , гипотезу о равенстве дисперсий отклоняют, иначе оставляют. Главное - не перепутать, какая дисперсия в числителе и какие степени свободы ей соответствуют, а при двусторонней альтернативе брать уровень $\alpha/2$ .

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Критерий Фишера: сравнение двух дисперсий

Что проверяет критерий Фишера

Формула F-статистики и степени свободы

Критическое значение и правило вывода

Односторонний и двусторонний варианты

Пример решения типовой задачи

Частые ошибки

FAQ

Коротко

Читайте также

Сравнение двух коэффициентов корреляции: критерий Фишера

Распределение Фишера: критические значения и F-квантили

Частный F-критерий: значимость фактора в регрессии