Тест Левена: проверка равенства дисперсий

Тест Левена на равенство дисперсий - это способ проверить, одинаков ли разброс значений в нескольких группах, прежде чем сравнивать их средние. Многие классические методы - от -критерия Стьюдента до однофакторного дисперсионного анализа - опираются на предпосылку гомогенности дисперсий (homoscedasticity). Если этот контроль проигнорировать, выводы о различии групп могут оказаться ложными. Критерий Левена привлекателен тем, что слабо чувствителен к отклонению данных от нормального распределения, в отличие от старого теста Бартлетта. Ниже разберём идею критерия, формулу -статистики, варианты по среднему и медиане, проверку гипотез, число степеней свободы и типичные ошибки интерпретации.
Зачем проверять равенство дисперсий
Равенство (гомогенность) дисперсий - это требование, чтобы случайный разброс наблюдений внутри каждой сравниваемой группы был примерно одинаков. Формально нулевая гипотеза однородности записывается как равенство генеральных дисперсий всех групп:
Это условие лежит в основе объединённой оценки дисперсии, которую используют и -тест для двух выборок, и однофакторный дисперсионный анализ ANOVA. Когда дисперсии резко различаются, объединять их в одну оценку некорректно: -статистика ANOVA смещается, а реальный уровень значимости перестаёт совпадать с заявленным . Поэтому проверку гомогенности дисперсий выполняют как предварительный шаг - и здесь чаще всего применяют именно тест Левена.
Хотите быстро проверить свои группы на равенство дисперсий? Укажите данные и вариант критерия ниже - инструмент соберёт корректную постановку теста Левена, посчитает -статистику и подскажет, как трактовать результат.
Идея критерия Левена
Тест Левена (Levene's test), предложенный Говардом Левеном в 1960 году, сводит проверку равенства дисперсий к проверке равенства средних - но не самих наблюдений, а их абсолютных отклонений от центра группы. Логика проста: если разброс во всех группах одинаков, то и среднее абсолютное отклонение от центра должно быть примерно равным; если же в какой-то группе данные «разбегаются» сильнее, её отклонения в среднем будут больше.
Для каждого наблюдения (-е наблюдение в -й группе) вычисляют абсолютное отклонение от центра группы:
где - среднее (или другой центр) -й группы. После этого к новым величинам применяют обычный однофакторный дисперсионный анализ. Именно эта замена «исходных данных на отклонения» и делает критерий устойчивым: проверка дисперсий превращается в привычную проверку средних.
Формула F-статистики
Статистика теста Левена строится точно так же, как -отношение в ANOVA, но для преобразованных величин . Если всего наблюдений, групп, наблюдений в -й группе, - среднее отклонений по группе, а - общее среднее всех , то
В числителе - межгрупповая изменчивость отклонений, в знаменателе - внутригрупповая. Если дисперсии групп равны, оба источника изменчивости сопоставимы и близка к единице. Чем сильнее различаются дисперсии, тем больше межгрупповой разброс отклонений и тем больше значение .
Обратите внимание: формула не использует напрямую выборочные дисперсии . Именно переход к абсолютным отклонениям освобождает критерий от жёсткой опоры на нормальность - в отличие от теста Бартлетта, где статистика строится на логарифмах самих дисперсий и потому резко реагирует на тяжёлые хвосты распределения. Численный пример: пусть в трёх группах средние отклонения равны , , при . Большой разрыв второй группы от остальных даст крупное значение и, скорее всего, отвержение - то есть данные сигнализируют, что во второй группе разброс заметно выше.
Варианты: среднее, медиана и Браун-Форсайт
У критерия есть несколько версий, отличающихся выбором центра группы в формуле отклонения :
- По среднему () - исходный вариант Левена. Самый мощный при симметричных, близких к нормальному распределениях.
- По медиане () - модификация Брауна-Форсайта (Brown-Forsythe, 1974). Центром служит медиана группы, поэтому критерий устойчив к выбросам и асимметрии. Это вариант по умолчанию во многих пакетах (например, в SciPy).
- По усечённому среднему (10%-trimmed mean) - компромисс для распределений с тяжёлыми хвостами.
На практике для произвольных данных рекомендуют именно версию Брауна-Форсайта по медиане: она сохраняет корректный уровень значимости даже при заметной асимметрии. Версию по среднему стоит выбирать, только если есть уверенность в симметричности распределения.
Степени свободы и проверка гипотез
Статистика при справедливой приближённо распределена по закону Фишера с числом степеней свободы числителя и знаменателя . Алгоритм проверки гипотезы стандартный:
- Сформулировать гипотезы: - все дисперсии равны; - хотя бы одна дисперсия отличается.
- Вычислить наблюдаемое значение по преобразованным отклонениям.
- Найти критическое значение или -значение.
- Если (эквивалентно ) - отвергнуть : дисперсии неоднородны. Иначе оснований отвергать однородность нет.
Важно помнить логику: «хороший» для нас результат - это , то есть неотвержение , дающее право применять ANOVA или -тест в их обычной форме. Это противоположно привычной ситуации, когда исследователь надеется отвергнуть нулевую гипотезу.
Если тест Левена отверг равенство дисперсий, не отказывайтесь от анализа: используйте robust-альтернативы - критерий Уэлча (Welch ANOVA) или $t$-тест Уэлча с поправкой Сатертуэйта на степени свободы.
Тест Левена и предпосылки ANOVA
Гомогенность дисперсий - лишь одна из трёх предпосылок дисперсионного анализа наряду с независимостью наблюдений и нормальностью остатков. Тест Левена закрывает именно её. Если данные грубо ненормальны, проверять равенство дисперсий тестом Бартлетта нельзя - он крайне чувствителен к отклонению от нормальности и часто ложно «находит» неоднородность. Критерий Левена (особенно вариант Брауна-Форсайта) в этой роли надёжнее и потому стал отраслевым стандартом для предварительной диагностики перед ANOVA.
Связь с ANOVA здесь двойная. Во-первых, тест Левена сам по себе устроен как дисперсионный анализ над отклонениями - это буквально та же -механика, что и при сравнении средних. Во-вторых, его результат определяет, в какой форме применять основной анализ: при подтверждённой однородности используют классический -критерий с объединённой оценкой дисперсии, а при нарушении - переходят к ANOVA Уэлча, которая не требует равных дисперсий и корректирует степени свободы знаменателя. Удобно проводить проверку Левена и основной анализ в одном пакете (SPSS, R, Python/SciPy), чтобы согласованно выбрать центр группы и уровень значимости.
Частые ошибки
- Путают направление вывода. Малое -значение здесь - плохая новость: оно означает неоднородность дисперсий и нарушение предпосылки, а не «успешный» результат.
- Берут версию по среднему для асимметричных данных. При выбросах и скошенности нужна модификация Брауна-Форсайта по медиане, иначе тест завышает долю ложных срабатываний.
- Проверяют дисперсии тестом Бартлетта при ненормальных данных. Бартлетт чувствителен к нарушению нормальности; для таких данных корректен именно тест Левена.
- Считают неравные дисперсии приговором. Отвержение не запрещает сравнивать средние - оно лишь требует перейти к robust-методам (Уэлч, поправка Сатертуэйта).
- Игнорируют размер выборки. На очень больших выборках тест Левена отвергает даже при практически незначимых различиях; смотрите и на величину эффекта, а не только на .
FAQ
Чем тест Левена отличается от теста Бартлетта? Оба проверяют равенство дисперсий, но Бартлетт предполагает нормальность данных и очень чувствителен к её нарушению. Тест Левена работает с абсолютными отклонениями и потому устойчив к ненормальности, что делает его предпочтительным для реальных данных.
Что такое модификация Брауна-Форсайта? Это вариант теста Левена, где центром группы берётся медиана, а не среднее. Замена делает критерий устойчивым к выбросам и асимметрии; именно эту версию большинство статистических пакетов используют по умолчанию.
Что делать, если тест показал неравенство дисперсий? Не отказываться от сравнения групп, а перейти к методам, не требующим гомогенности: ANOVA Уэлча, -критерий Уэлча с поправкой Сатертуэйта на степени свободы или непараметрические критерии (Краскела-Уоллиса).
Коротко
Тест Левена проверяет нулевую гипотезу о равенстве дисперсий нескольких групп, заменяя исходные данные их абсолютными отклонениями от центра (среднего или, в модификации Брауна-Форсайта, медианы) и прогоняя через них однофакторный ANOVA. Статистика распределена как ; малое -значение говорит о неоднородности дисперсий и нарушении предпосылки ANOVA. Благодаря устойчивости к ненормальности критерий Левена вытеснил тест Бартлетта как стандартный инструмент диагностики перед сравнением средних.
Читайте также

Распределение Стьюдента степени свободы: как они задают форму
Распределение Стьюдента и его степени свободы: что такое параметр df, как он меняет форму t-распределения, как считать критические значения и применять в t-тестах и доверительных интервалах.

Как работает ANOVA однофакторный дисперсионный анализ
ANOVA однофакторный дисперсионный анализ сравнивает средние в трёх и более группах. Разбираем суммы квадратов, F-критерий и условия применимости на примере с расчётом.

Алгоритм Рабина-Карпа: поиск подстроки за O(n+m)
Разбираем алгоритм Рабина-Карпа: как полиномиальный хеш и скользящее окно ускоряют поиск подстроки до O(n+m) в среднем, почему бывают ложные совпадения и при чём тут плагиат.