Критерий Фишера: сравнение двух дисперсий
Критерий Фишера (F-критерий) отвечает на простой вопрос: можно ли считать, что две выборки имеют одинаковый разброс, или одна из них «гуляет» заметно сильнее другой. В основе лежит одна идея: если поделить большую выборочную дисперсию на меньшую, то при равных генеральных дисперсиях это отношение не должно сильно отличаться от единицы. Чем дальше отношение уходит вправо, тем меньше верится в равенство дисперсий. Ниже разберём, как составить F-статистику, какие степени свободы у неё бывают, как найти критическое значение и сделать вывод, а также где студенты чаще всего ошибаются. Чтобы сразу почувствовать связь дисперсий, объёмов выборок и порога значимости, покрутите калькулятор ниже: он считает F, критическое значение и p-значение и показывает, попало ли наблюдённое F в критический хвост.
Что проверяет критерий Фишера
Пусть из двух нормально распределённых генеральных совокупностей взяты независимые выборки и по ним посчитаны исправленные выборочные дисперсии и . Нулевая гипотеза утверждает, что генеральные дисперсии равны:
Содержательно это вопрос об однородности точности или стабильности: одинаково ли точны два прибора, два станка, два метода измерения. Если разброс данных значимо разный, то и сравнивать средние этих выборок обычным способом уже нельзя, поэтому проверку равенства дисперсий часто делают первым шагом анализа. Похожую задачу для трёх и более групп решает однофакторный дисперсионный анализ ANOVA, а более устойчивый к ненормальности вариант для двух выборок даёт тест Левена на равенство дисперсий.
Формула F-статистики и степени свободы
Сама статистика критерия - это отношение двух выборочных дисперсий, причём по соглашению в числитель ставят большую из них:
Тогда всегда, и работать нужно только с правым хвостом распределения - это заметно упрощает работу с таблицами. У статистики две степени свободы: одна у числителя, другая у знаменателя. Каждая равна объёму своей выборки минус единица:
где - объём той выборки, чья дисперсия оказалась больше (она в числителе), а - объём второй. Порядок здесь критичен: относится именно к числителю. Если при равенстве генеральных дисперсий многократно повторять эксперимент, значения складываются в распределение Фишера - несимметричную кривую, прижатую к нулю слева и с длинным хвостом справа.
На анимации видно главное: пока выборочные дисперсии близки, отношение держится около единицы, у вершины кривой, и попадает в типичные значения. Но стоит разбросу одной выборки заметно превысить разброс другой, как уезжает вправо и в какой-то момент пересекает критическую границу. Именно положение этой границы и решает, считать различие случайным или значимым.
Критическое значение и правило вывода
Критическое значение - это квантиль распределения Фишера, правее которого лежит ровно доля всей площади под кривой (уровень значимости, обычно 0.05 или 0.01). Его берут из таблицы критических значений распределения Фишера на пересечении столбца и строки либо считают численно. Подробно про чтение таблицы - в разборе про критические значения распределения Фишера.

Правило принятия решения простое и сводится к одному сравнению:
- если , наблюдённое значение попало в критический хвост - нулевую гипотезу отклоняют, дисперсии различаются значимо;
- если , оснований отклонить нет - различие разбросов считают случайным.
Тот же вывод можно получить через p-значение: это вероятность увидеть не меньше наблюдённого при верной , то есть площадь правого хвоста за точкой . Если , гипотезу отклоняют. Калькулятор выше показывает обе величины одновременно, чтобы было видно, как они согласуются: и всегда срабатывают вместе.
Односторонний и двусторонний варианты
Здесь кроется тонкость, на которой легко споткнуться. Записывая с большей дисперсией в числителе, мы заранее «подсматриваем» в данные и выбираем направление. Поэтому при двусторонней альтернативе критическое значение нужно брать на уровне , а не : вся вероятность ошибки распределена на два хвоста, но мы свернули задачу к одному. Если же по смыслу задачи заранее известно, какая дисперсия должна быть больше (например, проверяем, что новый метод не ухудшил точность), альтернатива односторонняя, и критическое значение берут на полном уровне . В типовых учебных задачах формулировка обычно двусторонняя, и грамотнее использовать ; в калькуляторе для наглядности порог считается по выбранному напрямую, поэтому при строгой двусторонней постановке выбирайте, например, вместо 0.05.
Пример решения типовой задачи
Разберём стандартную формулировку: два станка изготавливают детали, и по выборкам получены исправленные дисперсии размера при и при . Нужно при проверить, одинакова ли точность станков.
Большая дисперсия - у первого станка, ставим её в числитель:
Степени свободы: для числителя и для знаменателя. По таблице распределения Фишера для уровня значимости 0.05 и степеней свободы находим критическое значение:
Сравниваем: . Наблюдённое значение попало в критический хвост, поэтому нулевую гипотезу о равенстве дисперсий отклоняем: точность станков различается значимо. Достигнутый уровень значимости здесь , что меньше 0.05 и подтверждает тот же вывод. Если бы отношение оказалось, скажем, , оно не дотянуло бы до порога, и гипотезу о равной точности пришлось бы оставить.
Частые ошибки
- Меньшая дисперсия в числителе. По соглашению в числитель ставят большую выборочную дисперсию, чтобы . Если перевернуть дробь, выйдет , и сравнение с табличным (рассчитанным для правого хвоста) даст бессмысленный результат.
- Перепутаны степени свободы. всегда относится к числителю, - к знаменателю. В таблице они стоят на разных осях, и перестановка при неравных даёт другое критическое значение.
- Использование вместо . Степень свободы равна объёму выборки минус единица, а не самому объёму. Эта же поправка уже заложена в исправленную дисперсию .
- Игнор уровня при двусторонней проверке. Раз большая дисперсия выбрана по данным, для альтернативы критическое значение берут на уровне , иначе фактическая вероятность ошибки I рода вдвое выше заявленной.
- Применение критерия к ненормальным данным. F-критерий очень чувствителен к отклонению от нормальности. Если есть сомнения в распределении, надёжнее тест Левена или Брауна-Форсайта.
FAQ
Какую дисперсию ставить в числитель критерия Фишера? Большую из двух выборочных дисперсий. Тогда статистика всегда не меньше единицы, и достаточно работать только с правым критическим значением из таблицы. Степени свободы числителя при этом берутся у той выборки, чья дисперсия попала в числитель.
Чем критерий Фишера отличается от критерия Стьюдента? Критерий Стьюдента сравнивает средние двух выборок, а критерий Фишера - их дисперсии (разбросы). Часто их применяют по очереди: сначала F-критерием проверяют равенство дисперсий, и от результата зависит, какую версию t-критерия использовать для средних.
Что делать, если F получилось меньше единицы? Это признак того, что в числитель попала меньшая дисперсия. Поменяйте выборки местами так, чтобы большая дисперсия была сверху, и одновременно переставьте степени свободы - числитель и знаменатель должны соответствовать своим выборкам.
Коротко
Критерий Фишера сравнивает две дисперсии через отношение , где большая выборочная дисперсия стоит в числителе, а степени свободы равны и . Наблюдённое значение сравнивают с критическим из таблицы распределения Фишера: если , гипотезу о равенстве дисперсий отклоняют, иначе оставляют. Главное - не перепутать, какая дисперсия в числителе и какие степени свободы ей соответствуют, а при двусторонней альтернативе брать уровень .
Читайте также

Сравнение двух коэффициентов корреляции: критерий Фишера
Как сравнить два коэффициента корреляции: z-преобразование Фишера, формула Z-статистики через объёмы выборок, расчёт p-value и проверка значимости различия независимых и зависимых r.

Распределение Фишера: критические значения и F-квантили
Распределение Фишера и его критические значения: что такое F-распределение, как читать таблицу по двум степеням свободы и применять F-квантили в F-тесте дисперсий и ANOVA.

Частный F-критерий: значимость фактора в регрессии
Частный F-критерий проверяет значимость отдельного фактора или группы факторов в множественной регрессии. Формула, сравнение с t-критерием, пошаговый пример расчёта и типичные ошибки.