Как работает ANOVA однофакторный дисперсионный анализ

ANOVA однофакторный дисперсионный анализ - это метод проверки гипотезы о равенстве средних значений в трёх и более группах одновременно. Вместо того чтобы попарно сравнивать группы t-критерием и накапливать ошибку первого рода, анализ раскладывает общую изменчивость данных на две части - связанную с влиянием фактора и случайную - и сравнивает их через отношение дисперсий. Ниже разберём логику метода, формулы сумм квадратов, F-статистику, условия применимости и типичные ошибки интерпретации.
Что такое однофакторный дисперсионный анализ
Однофакторный дисперсионный анализ (one-way ANOVA) изучает влияние одного качественного фактора с несколькими уровнями (группами) на одну количественную зависимую переменную. Например, фактор «удобрение» с уровнями A, B, C, а зависимая переменная - урожайность. Метод отвечает на вопрос: различаются ли средние урожайности между типами удобрения сильнее, чем это можно объяснить случайным разбросом внутри групп.
Ключевая идея ANOVA - разложение общей дисперсии. Если общая изменчивость данных объясняется в основном различиями между группами, а не разбросом внутри них, фактор считается значимым. Формально метод оперирует не самими дисперсиями, а суммами квадратов отклонений, которые затем нормируют на число степеней свободы.
Гипотезы дисперсионного анализа
Однофакторный анализ проверяет нулевую гипотезу о равенстве всех групповых средних:
Альтернативная гипотеза утверждает, что хотя бы одно среднее отличается от остальных. Важно: не говорит, какое именно среднее или сколько их - она лишь отрицает полное равенство. Поэтому значимый результат ANOVA сам по себе не показывает, между какими группами есть разница; для этого нужны апостериорные (post-hoc) сравнения.
Хотите быстро прикинуть F-критерий и решение по своим группам? Соберите данные ниже - калькулятор посчитает суммы квадратов и сформулирует вывод.
Разложение сумм квадратов
Пусть есть групп, в группе - наблюдений, - среднее группы, - общее среднее по всем наблюдениям. Общая сумма квадратов раскладывается так:
Межгрупповая сумма квадратов отражает разброс групповых средних относительно общего среднего:
Внутригрупповая сумма квадратов - это суммарный разброс наблюдений вокруг своих групповых средних (остаточная, «случайная» изменчивость):
Чем больше доля в общей сумме, тем сильнее фактор влияет на отклик.
Средние квадраты и F-критерий
Суммы квадратов делят на степени свободы и получают средние квадраты (дисперсии). Межгрупповые степени свободы , внутригрупповые :
F-критерий - это отношение межгрупповой дисперсии к внутригрупповой:
Если верна, обе оценки оценивают одну и ту же дисперсию ошибок, и . Чем сильнее различаются средние, тем больше числитель и тем больше . Наблюдаемое значение сравнивают с критическим значением распределения Фишера или смотрят p-значение.
F-критерий всегда односторонний: значимость означает большое значение F. Маленькое F (близкое к нулю) о различиях не говорит - оно лишь подтверждает однородность средних.
Условия применимости
ANOVA опирается на три предпосылки, и при их нарушении вывод может быть некорректным:
- Нормальность: остатки внутри каждой группы распределены приблизительно нормально. При больших выборках метод устойчив к умеренным отклонениям.
- Гомогенность дисперсий (гомоскедастичность): дисперсии во всех группах примерно равны. Проверяется тестом Левена или критерием Бартлетта.
- Независимость наблюдений: значения не должны быть связаны (не повторные измерения на одних и тех же объектах - для них есть ANOVA с повторными измерениями).
При сильном нарушении гомогенности применяют поправку Уэлча, а при нарушении нормальности - непараметрический аналог, критерий Краскела-Уоллиса.
Таблица ANOVA и интерпретация
Результат обычно сводят в таблицу с источниками изменчивости - «между группами», «внутри групп» и «всего». В ней указывают суммы квадратов, степени свободы, средние квадраты, значение и p-значение. Решающее правило простое: если (обычно ), нулевую гипотезу отвергают и заключают, что фактор влияет на отклик.
После отклонения переходят к апостериорным тестам (Тьюки HSD, Шеффе, Бонферрони), чтобы выяснить, какие именно пары групп различаются. Полезно также оценить размер эффекта - например , показывающий долю объяснённой дисперсии.
Связь с t-критерием и регрессией
Для двух групп () однофакторный дисперсионный анализ полностью эквивалентен двухвыборочному t-критерию: при этом . ANOVA можно рассматривать как частный случай линейной регрессии с категориальным предиктором, закодированным фиктивными (dummy) переменными. Это объясняет, почему многие статистические пакеты выдают для ANOVA те же , и , что и регрессионная модель.
Частые ошибки
- Множественные t-тесты вместо ANOVA. Попарные сравнения всех групп раздувают суммарную ошибку первого рода; именно для этого и нужен единый F-критерий.
- Остановка на значимом F. Само по себе не указывает различающиеся пары - без post-hoc вывод неполный.
- Игнорирование предпосылок. Применение ANOVA при резко неравных дисперсиях или зависимых наблюдениях даёт заниженное p-значение.
- Путаница и . Числитель F - межгрупповой средний квадрат, знаменатель - внутригрупповой; перестановка инвертирует смысл.
- Вывод о размере эффекта по p-значению. При большом значимым становится даже крошечное различие - нужен или другой показатель эффекта.
FAQ
Чем однофакторный анализ отличается от двухфакторного? Однофакторный учитывает один фактор, двухфакторный - два фактора и их взаимодействие. Если в вашем плане один группирующий признак - нужен именно one-way ANOVA.
Что делать, если дисперсии групп неравны? Используйте поправку Уэлча (Welch's ANOVA), которая не требует гомогенности дисперсий, либо непараметрический критерий Краскела-Уоллиса.
Можно ли применять ANOVA к двум группам? Можно, но это эквивалентно t-критерию: и p-значения совпадают. Для двух групп проще и привычнее использовать t-тест.
Коротко
ANOVA однофакторный дисперсионный анализ сравнивает средние нескольких групп, раскладывая общую изменчивость на межгрупповую и внутригрупповую составляющие. Отношение соответствующих средних квадратов даёт F-статистику: большое и малое p-значение говорят о влиянии фактора. Метод требует нормальности, равенства дисперсий и независимости наблюдений, а после отклонения дополняется апостериорными сравнениями и оценкой размера эффекта.
Читайте также

Распределение Фишера критические значения: как искать F-квантили
Распределение Фишера и его критические значения: что такое F-распределение, как читать таблицу критических значений по двум степеням свободы, как применять F-квантили в F-тесте на равенство дисперсий и в дисперсионном анализе.

Критерий согласия Колмогорова-Смирнова: проверка распределения
Критерий согласия Колмогорова-Смирнова: как проверить гипотезу о виде распределения по статистике D, как считать эмпирическую функцию распределения, читать критические значения и интерпретировать p-уровень в одновыборочном и двухвыборочном вариантах.

Распределение Стьюдента степени свободы: как они задают форму
Распределение Стьюдента и его степени свободы: что такое параметр df, как он меняет форму t-распределения, как считать критические значения и применять в t-тестах и доверительных интервалах.