EssayAI
Блог
Блог
Математика и алгоритмы

Критерий Фишера: сравнение двух дисперсий

11 июня 2026Время чтения: 8 минут
#критерий фишера#сравнение дисперсий#f-распределение#проверка гипотез#степени свободы

Критерий Фишера (F-критерий) отвечает на простой вопрос: можно ли считать, что две выборки имеют одинаковый разброс, или одна из них «гуляет» заметно сильнее другой. В основе лежит одна идея: если поделить большую выборочную дисперсию на меньшую, то при равных генеральных дисперсиях это отношение не должно сильно отличаться от единицы. Чем дальше отношение уходит вправо, тем меньше верится в равенство дисперсий. Ниже разберём, как составить F-статистику, какие степени свободы у неё бывают, как найти критическое значение и сделать вывод, а также где студенты чаще всего ошибаются. Чтобы сразу почувствовать связь дисперсий, объёмов выборок и порога значимости, покрутите калькулятор ниже: он считает F, критическое значение и p-значение и показывает, попало ли наблюдённое F в критический хвост.

Что проверяет критерий Фишера

Пусть из двух нормально распределённых генеральных совокупностей взяты независимые выборки и по ним посчитаны исправленные выборочные дисперсии s12s_1^2 и s22s_2^2. Нулевая гипотеза утверждает, что генеральные дисперсии равны:

H0:σ12=σ22,H1:σ12σ22.H_0: \sigma_1^2 = \sigma_2^2, \qquad H_1: \sigma_1^2 \ne \sigma_2^2.

Содержательно это вопрос об однородности точности или стабильности: одинаково ли точны два прибора, два станка, два метода измерения. Если разброс данных значимо разный, то и сравнивать средние этих выборок обычным способом уже нельзя, поэтому проверку равенства дисперсий часто делают первым шагом анализа. Похожую задачу для трёх и более групп решает однофакторный дисперсионный анализ ANOVA, а более устойчивый к ненормальности вариант для двух выборок даёт тест Левена на равенство дисперсий.

Формула F-статистики и степени свободы

Сама статистика критерия - это отношение двух выборочных дисперсий, причём по соглашению в числитель ставят большую из них:

F=sб2sм2,sб2sм2.F = \frac{s_б^2}{s_м^2}, \qquad s_б^2 \ge s_м^2.

Тогда F1F \ge 1 всегда, и работать нужно только с правым хвостом распределения - это заметно упрощает работу с таблицами. У статистики две степени свободы: одна у числителя, другая у знаменателя. Каждая равна объёму своей выборки минус единица:

df1=nб1,df2=nм1,df_1 = n_б - 1, \qquad df_2 = n_м - 1,

где nбn_б - объём той выборки, чья дисперсия оказалась больше (она в числителе), а nмn_м - объём второй. Порядок здесь критичен: df1df_1 относится именно к числителю. Если при равенстве генеральных дисперсий многократно повторять эксперимент, значения FF складываются в распределение Фишера F(df1,df2)F(df_1, df_2) - несимметричную кривую, прижатую к нулю слева и с длинным хвостом справа.

По кривой F-распределения едет золотой маркер наблюдённого F. Пока отношение дисперсий невелико, F сидит у вершины и различие не значимо; когда отношение растёт и F пересекает критический порог Fкр, оно попадает в красную зону отклонения H0

На анимации видно главное: пока выборочные дисперсии близки, отношение FF держится около единицы, у вершины кривой, и попадает в типичные значения. Но стоит разбросу одной выборки заметно превысить разброс другой, как FF уезжает вправо и в какой-то момент пересекает критическую границу. Именно положение этой границы и решает, считать различие случайным или значимым.

Критическое значение и правило вывода

Критическое значение FкрF_{кр} - это квантиль распределения Фишера, правее которого лежит ровно доля α\alpha всей площади под кривой (уровень значимости, обычно 0.05 или 0.01). Его берут из таблицы критических значений распределения Фишера на пересечении столбца df1df_1 и строки df2df_2 либо считают численно. Подробно про чтение таблицы - в разборе про критические значения распределения Фишера.

Кривая F-распределения с критическим хвостом: правее Fкр лежит площадь, равная уровню значимости α = 0.05, и попадание наблюдённого F в эту зону означает отклонение H0
Кривая F-распределения с критическим хвостом: правее Fкр лежит площадь, равная уровню значимости α = 0.05, и попадание наблюдённого F в эту зону означает отклонение H0

Правило принятия решения простое и сводится к одному сравнению:

  • если F>FкрF > F_{кр}, наблюдённое значение попало в критический хвост - нулевую гипотезу отклоняют, дисперсии различаются значимо;
  • если FFкрF \le F_{кр}, оснований отклонить H0H_0 нет - различие разбросов считают случайным.

Тот же вывод можно получить через p-значение: это вероятность увидеть FF не меньше наблюдённого при верной H0H_0, то есть площадь правого хвоста за точкой FF. Если p<αp < \alpha, гипотезу отклоняют. Калькулятор выше показывает обе величины одновременно, чтобы было видно, как они согласуются: F>FкрF > F_{кр} и p<αp < \alpha всегда срабатывают вместе.

Односторонний и двусторонний варианты

Здесь кроется тонкость, на которой легко споткнуться. Записывая F=sб2/sм2F = s_б^2 / s_м^2 с большей дисперсией в числителе, мы заранее «подсматриваем» в данные и выбираем направление. Поэтому при двусторонней альтернативе H1:σ12σ22H_1: \sigma_1^2 \ne \sigma_2^2 критическое значение нужно брать на уровне α/2\alpha/2, а не α\alpha: вся вероятность ошибки распределена на два хвоста, но мы свернули задачу к одному. Если же по смыслу задачи заранее известно, какая дисперсия должна быть больше (например, проверяем, что новый метод не ухудшил точность), альтернатива односторонняя, и критическое значение берут на полном уровне α\alpha. В типовых учебных задачах формулировка обычно двусторонняя, и грамотнее использовать α/2\alpha/2; в калькуляторе для наглядности порог считается по выбранному α\alpha напрямую, поэтому при строгой двусторонней постановке выбирайте, например, α=0.025\alpha = 0.025 вместо 0.05.

Пример решения типовой задачи

Разберём стандартную формулировку: два станка изготавливают детали, и по выборкам получены исправленные дисперсии размера s12=4,8s_1^2 = 4{,}8 при n1=10n_1 = 10 и s22=1,2s_2^2 = 1{,}2 при n2=10n_2 = 10. Нужно при α=0,05\alpha = 0{,}05 проверить, одинакова ли точность станков.

Большая дисперсия - у первого станка, ставим её в числитель:

F=s12s22=4,81,2=4,0.F = \frac{s_1^2}{s_2^2} = \frac{4{,}8}{1{,}2} = 4{,}0.

Степени свободы: df1=n11=9df_1 = n_1 - 1 = 9 для числителя и df2=n21=9df_2 = n_2 - 1 = 9 для знаменателя. По таблице распределения Фишера для уровня значимости 0.05 и степеней свободы (9,9)(9, 9) находим критическое значение:

Fкр(0,05;9,9)3,18.F_{кр}(0{,}05;\, 9,\, 9) \approx 3{,}18.

Сравниваем: F=4,0>3,18=FкрF = 4{,}0 > 3{,}18 = F_{кр}. Наблюдённое значение попало в критический хвост, поэтому нулевую гипотезу о равенстве дисперсий отклоняем: точность станков различается значимо. Достигнутый уровень значимости здесь p0,026p \approx 0{,}026, что меньше 0.05 и подтверждает тот же вывод. Если бы отношение оказалось, скажем, F=2,5F = 2{,}5, оно не дотянуло бы до порога, и гипотезу о равной точности пришлось бы оставить.

Частые ошибки

  • Меньшая дисперсия в числителе. По соглашению в числитель ставят большую выборочную дисперсию, чтобы F1F \ge 1. Если перевернуть дробь, выйдет F<1F < 1, и сравнение с табличным FкрF_{кр} (рассчитанным для правого хвоста) даст бессмысленный результат.
  • Перепутаны степени свободы. df1df_1 всегда относится к числителю, df2df_2 - к знаменателю. В таблице они стоят на разных осях, и перестановка (df1,df2)(df2,df1)(df_1, df_2) \to (df_2, df_1) при неравных nn даёт другое критическое значение.
  • Использование nn вместо n1n-1. Степень свободы равна объёму выборки минус единица, а не самому объёму. Эта же поправка уже заложена в исправленную дисперсию s2s^2.
  • Игнор уровня α/2\alpha/2 при двусторонней проверке. Раз большая дисперсия выбрана по данным, для альтернативы σ12σ22\sigma_1^2 \ne \sigma_2^2 критическое значение берут на уровне α/2\alpha/2, иначе фактическая вероятность ошибки I рода вдвое выше заявленной.
  • Применение критерия к ненормальным данным. F-критерий очень чувствителен к отклонению от нормальности. Если есть сомнения в распределении, надёжнее тест Левена или Брауна-Форсайта.

FAQ

Какую дисперсию ставить в числитель критерия Фишера? Большую из двух выборочных дисперсий. Тогда статистика F=sб2/sм2F = s_б^2 / s_м^2 всегда не меньше единицы, и достаточно работать только с правым критическим значением из таблицы. Степени свободы числителя при этом берутся у той выборки, чья дисперсия попала в числитель.

Чем критерий Фишера отличается от критерия Стьюдента? Критерий Стьюдента сравнивает средние двух выборок, а критерий Фишера - их дисперсии (разбросы). Часто их применяют по очереди: сначала F-критерием проверяют равенство дисперсий, и от результата зависит, какую версию t-критерия использовать для средних.

Что делать, если F получилось меньше единицы? Это признак того, что в числитель попала меньшая дисперсия. Поменяйте выборки местами так, чтобы большая дисперсия была сверху, и одновременно переставьте степени свободы - числитель и знаменатель должны соответствовать своим выборкам.

Коротко

Критерий Фишера сравнивает две дисперсии через отношение F=sб2/sм2F = s_б^2 / s_м^2, где большая выборочная дисперсия стоит в числителе, а степени свободы равны df1=nб1df_1 = n_б - 1 и df2=nм1df_2 = n_м - 1. Наблюдённое значение сравнивают с критическим Fкр(α;df1,df2)F_{кр}(\alpha; df_1, df_2) из таблицы распределения Фишера: если F>FкрF > F_{кр}, гипотезу о равенстве дисперсий отклоняют, иначе оставляют. Главное - не перепутать, какая дисперсия в числителе и какие степени свободы ей соответствуют, а при двусторонней альтернативе брать уровень α/2\alpha/2.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также