Распределение Фишера критические значения: как искать F-квантили

Когда нужно сравнить две дисперсии или проверить значимость факторов в дисперсионном анализе, на сцену выходит распределение Фишера (F-распределение), а его критические значения определяют границу между «случайным разбросом» и «статистически значимым эффектом». Ниже разберём, что такое распределение Фишера, откуда берутся его две степени свободы, как читать таблицу критических значений F-распределения и как корректно применять F-квантили в F-критерии равенства дисперсий и в ANOVA.
Что такое распределение Фишера
Распределение Фишера возникает как отношение двух независимых хи-квадрат величин, поделённых на свои степени свободы. Если и независимы, то
имеет распределение Фишера с степенями свободы в числителе и степенями свободы в знаменателе. Обозначают это . Поскольку числитель и знаменатель - суммы квадратов, F-величина всегда неотрицательна, а её плотность асимметрична и сосредоточена в области положительных значений:
где - бета-функция. Ключевая особенность: распределение задаётся двумя параметрами степеней свободы, и критическое значение зависит от обоих сразу.
Если нужно быстро найти критическое значение для своих степеней свободы или прогнать F-критерий по двум выборкам, соберите запрос в калькуляторе ниже - он подставит ваши числа и распишет решение по шагам.
Две степени свободы и их роль
В отличие от нормального или экспоненциального закона, распределение Фишера управляется парой чисел . Первое - степени свободы числителя - связано с количеством сравниваемых групп или оцениваемых параметров. Второе - степени свободы знаменателя - отражает объём данных, по которому оценивается остаточная (внутригрупповая) дисперсия.
Порядок параметров важен: и - это разные распределения с разными критическими значениями. При работе с таблицей всегда сначала находят столбец по (числитель), затем строку по (знаменатель), либо наоборот - но строго в соответствии с тем, какая величина стоит в числителе вашей F-статистики. Перепутанный порядок - самая частая причина неверного вывода.
Критические значения: что это и как их читать
Критическое значение - это квантиль уровня , то есть такое число, что . Площадь под правым хвостом плотности равна выбранному уровню значимости . Если наблюдённая F-статистика превышает критическое значение, нулевую гипотезу отвергают.
Таблицы критических значений распределения Фишера обычно строят для фиксированных (чаще всего и ): на пересечении столбца и строки стоит соответствующий квантиль. Например, , а . Видно, что с ростом степеней свободы знаменателя критическое значение убывает: больше данных в остатке - меньше требуемый порог.
Если в вашей версии таблицы нет нужного уровня значимости для левого хвоста, используйте свойство $F_{1-\alpha}(d_1, d_2) = 1 / F_{\alpha}(d_2, d_1)$ - оно позволяет получить нижний критический квантиль через верхний с переставленными степенями свободы.
Применение в F-критерии равенства дисперсий
Классическое применение - проверка гипотезы о равенстве дисперсий двух генеральных совокупностей . Статистика критерия - отношение выборочных дисперсий:
где в числитель по соглашению ставят большую из двух дисперсий, чтобы . Тогда степени свободы числителя равны , а знаменателя - , где - объёмы соответствующих выборок. Полученное значение сравнивают с критическим : если , дисперсии признают статистически различными.
Этот критерий чувствителен к отклонению данных от нормальности, поэтому при «тяжёлых хвостах» предпочтительнее робастные альтернативы (тест Левена, Брауна - Форсайта). Тем не менее F-критерий остаётся базовым инструментом и напрямую опирается на критические значения распределения Фишера.
Применение в дисперсионном анализе
В однофакторном дисперсионном анализе F-статистика - это отношение межгрупповой дисперсии к внутригрупповой:
где - средний квадрат отклонений между группами, а - средний квадрат внутри групп. При группах и общем объёме степени свободы равны (числитель) и (знаменатель). Большое значение говорит, что различия между групповыми средними велики по сравнению со случайным разбросом внутри групп.
Решение принимают по тому же правилу: сравнивают с . Подробный разбор всей процедуры - в материале про однофакторный дисперсионный анализ ANOVA. Поскольку квадрат t-величины с степенями свободы есть , F-критерий тесно связан с t-тестом - см. разбор про распределение Стьюдента и степени свободы.
Связь критического значения и p-уровня
На практике вместо сравнения с табличным критическим значением часто считают p-уровень: - вероятность получить наблюдённое или большее значение при верной . Эти два подхода эквивалентны: условие означает то же самое, что . Критическое значение - это «граница», а p-уровень - «насколько далеко мы за неё зашли». Статистические пакеты возвращают именно p-уровень, поэтому таблицы критических значений сегодня нужны в основном для понимания логики и для ручных расчётов на экзаменах.
Как ведёт себя критическое значение
Полезно держать в голове несколько закономерностей поведения :
- При фиксированном и росте (степеней свободы знаменателя) критическое значение убывает и стремится к пределу, зависящему от .
- При величина ведёт себя как , поэтому критическое значение приближается к .
- Уменьшение (с до ) увеличивает критическое значение - порог значимости становится строже.
- Математическое ожидание F-распределения равно при , то есть центр распределения чуть больше единицы.
Частые ошибки
- Путают порядок степеней свободы. . Сначала определите, что стоит в числителе вашей статистики, и только потом ищите столбец/строку в таблице.
- Берут вместо . Степени свободы для F-критерия дисперсий - это и , а не объёмы выборок.
- Сравнивают с двусторонним квантилем. F-критерий по построению односторонний (правый хвост), поэтому критическое значение берут для уровня , а не , если в числитель поставлена бо́льшая дисперсия.
- Игнорируют требование нормальности. F-критерий равенства дисперсий чувствителен к негауссовым данным; на «тяжёлых хвостах» он завышает частоту ложных срабатываний.
- Путают критическое значение и p-уровень. Это два эквивалентных, но разных по смыслу числа: одно - порог, другое - достигнутая значимость.
FAQ
Чем распределение Фишера отличается от хи-квадрат и Стьюдента? Распределение Фишера - это отношение двух нормированных хи-квадрат величин, поэтому у него две степени свободы, а не одна. Квадрат t-величины с степенями свободы равен , что связывает F-распределение с распределением Стьюдента.
Почему в числитель F-статистики ставят большую дисперсию? Чтобы получить и работать с правым хвостом распределения, для которого и составлены стандартные таблицы критических значений. Это удобное соглашение, делающее критерий односторонним.
Как найти критическое значение, если в таблице нет нужных степеней свободы? Можно интерполировать между ближайшими строками и столбцами таблицы либо вычислить точный квантиль через обратную функцию F-распределения в статистическом пакете. Для нижнего хвоста используют свойство .
Коротко
Распределение Фишера описывает отношение двух нормированных хи-квадрат величин и задаётся парой степеней свободы - числителя и знаменателя. Его критическое значение отсекает правый хвост площадью и служит порогом значимости: если наблюдённая F-статистика его превышает, нулевую гипотезу отвергают. В F-критерии равенства дисперсий степени свободы равны и , в дисперсионном анализе - и . Порядок параметров и правильный уровень значимости критичны: перепутанные степени свободы или двусторонний квантиль вместо одностороннего ведут к неверному выводу.
Читайте также

Распределение хи-квадрат таблица значений: как читать
Распределение хи-квадрат и таблица критических значений: как пользоваться таблицей по степеням свободы и уровню значимости, где брать квантили χ² и как применять их в критерии согласия Пирсона.

Распределение Стьюдента степени свободы: как они задают форму
Распределение Стьюдента и его степени свободы: что такое параметр df, как он меняет форму t-распределения, как считать критические значения и применять в t-тестах и доверительных интервалах.

Как работает ANOVA однофакторный дисперсионный анализ
ANOVA однофакторный дисперсионный анализ сравнивает средние в трёх и более группах. Разбираем суммы квадратов, F-критерий и условия применимости на примере с расчётом.