EssayAI
Блог
Блог
Математика и алгоритмы

Тест Левена: проверка равенства дисперсий

29 марта 2026Время чтения: 7 минут
#тест левена#равенство дисперсий#гомогенность#браун-форсайт#статистика
Тест Левена: проверка равенства дисперсий

Тест Левена на равенство дисперсий - это способ проверить, одинаков ли разброс значений в нескольких группах, прежде чем сравнивать их средние. Многие классические методы - от tt-критерия Стьюдента до однофакторного дисперсионного анализа - опираются на предпосылку гомогенности дисперсий (homoscedasticity). Если этот контроль проигнорировать, выводы о различии групп могут оказаться ложными. Критерий Левена привлекателен тем, что слабо чувствителен к отклонению данных от нормального распределения, в отличие от старого теста Бартлетта. Ниже разберём идею критерия, формулу FF-статистики, варианты по среднему и медиане, проверку гипотез, число степеней свободы и типичные ошибки интерпретации.

Зачем проверять равенство дисперсий

Равенство (гомогенность) дисперсий - это требование, чтобы случайный разброс наблюдений внутри каждой сравниваемой группы был примерно одинаков. Формально нулевая гипотеза однородности записывается как равенство генеральных дисперсий всех kk групп:

H0: σ12=σ22==σk2.H_0:\ \sigma_1^2 = \sigma_2^2 = \dots = \sigma_k^2.

Это условие лежит в основе объединённой оценки дисперсии, которую используют и tt-тест для двух выборок, и однофакторный дисперсионный анализ ANOVA. Когда дисперсии резко различаются, объединять их в одну оценку некорректно: FF-статистика ANOVA смещается, а реальный уровень значимости перестаёт совпадать с заявленным α\alpha. Поэтому проверку гомогенности дисперсий выполняют как предварительный шаг - и здесь чаще всего применяют именно тест Левена.

Хотите быстро проверить свои группы на равенство дисперсий? Укажите данные и вариант критерия ниже - инструмент соберёт корректную постановку теста Левена, посчитает FF-статистику и подскажет, как трактовать результат.

Идея критерия Левена

Тест Левена (Levene's test), предложенный Говардом Левеном в 1960 году, сводит проверку равенства дисперсий к проверке равенства средних - но не самих наблюдений, а их абсолютных отклонений от центра группы. Логика проста: если разброс во всех группах одинаков, то и среднее абсолютное отклонение от центра должно быть примерно равным; если же в какой-то группе данные «разбегаются» сильнее, её отклонения в среднем будут больше.

Для каждого наблюдения xijx_{ij} (jj-е наблюдение в ii-й группе) вычисляют абсолютное отклонение от центра группы:

zij=xijxˉi,z_{ij} = \left| x_{ij} - \bar{x}_i \right|,

где xˉi\bar{x}_i - среднее (или другой центр) ii-й группы. После этого к новым величинам zijz_{ij} применяют обычный однофакторный дисперсионный анализ. Именно эта замена «исходных данных на отклонения» и делает критерий устойчивым: проверка дисперсий превращается в привычную проверку средних.

Формула F-статистики

Статистика теста Левена строится точно так же, как FF-отношение в ANOVA, но для преобразованных величин zijz_{ij}. Если всего NN наблюдений, kk групп, NiN_i наблюдений в ii-й группе, zˉi\bar{z}_i - среднее отклонений по группе, а zˉ\bar{z} - общее среднее всех zijz_{ij}, то

W=(Nk)(k1)i=1kNi(zˉizˉ)2i=1kj=1Ni(zijzˉi)2.W = \frac{(N-k)}{(k-1)} \cdot \frac{\sum_{i=1}^{k} N_i (\bar{z}_i - \bar{z})^2}{\sum_{i=1}^{k} \sum_{j=1}^{N_i} (z_{ij} - \bar{z}_i)^2}.

В числителе - межгрупповая изменчивость отклонений, в знаменателе - внутригрупповая. Если дисперсии групп равны, оба источника изменчивости сопоставимы и WW близка к единице. Чем сильнее различаются дисперсии, тем больше межгрупповой разброс отклонений и тем больше значение WW.

Обратите внимание: формула не использует напрямую выборочные дисперсии si2s_i^2. Именно переход к абсолютным отклонениям zijz_{ij} освобождает критерий от жёсткой опоры на нормальность - в отличие от теста Бартлетта, где статистика строится на логарифмах самих дисперсий и потому резко реагирует на тяжёлые хвосты распределения. Численный пример: пусть в трёх группах средние отклонения равны zˉ1=1,2\bar{z}_1 = 1{,}2, zˉ2=4,0\bar{z}_2 = 4{,}0, zˉ3=1,0\bar{z}_3 = 1{,}0 при zˉ=2,07\bar{z} = 2{,}07. Большой разрыв второй группы от остальных даст крупное значение WW и, скорее всего, отвержение H0H_0 - то есть данные сигнализируют, что во второй группе разброс заметно выше.

Варианты: среднее, медиана и Браун-Форсайт

У критерия есть несколько версий, отличающихся выбором центра группы в формуле отклонения zijz_{ij}:

  • По среднему (xˉi\bar{x}_i) - исходный вариант Левена. Самый мощный при симметричных, близких к нормальному распределениях.
  • По медиане (x~i\tilde{x}_i) - модификация Брауна-Форсайта (Brown-Forsythe, 1974). Центром служит медиана группы, поэтому критерий устойчив к выбросам и асимметрии. Это вариант по умолчанию во многих пакетах (например, в SciPy).
  • По усечённому среднему (10%-trimmed mean) - компромисс для распределений с тяжёлыми хвостами.

На практике для произвольных данных рекомендуют именно версию Брауна-Форсайта по медиане: она сохраняет корректный уровень значимости даже при заметной асимметрии. Версию по среднему стоит выбирать, только если есть уверенность в симметричности распределения.

Степени свободы и проверка гипотез

Статистика WW при справедливой H0H_0 приближённо распределена по закону Фишера F(k1, Nk)F(k-1,\ N-k) с числом степеней свободы числителя df1=k1df_1 = k-1 и знаменателя df2=Nkdf_2 = N-k. Алгоритм проверки гипотезы стандартный:

  1. Сформулировать гипотезы: H0H_0 - все дисперсии равны; H1H_1 - хотя бы одна дисперсия отличается.
  2. Вычислить наблюдаемое значение WW по преобразованным отклонениям.
  3. Найти критическое значение Fкр=Fα(k1,Nk)F_{\text{кр}} = F_{\alpha}(k-1, N-k) или pp-значение.
  4. Если W>FкрW > F_{\text{кр}} (эквивалентно p<αp < \alpha) - отвергнуть H0H_0: дисперсии неоднородны. Иначе оснований отвергать однородность нет.

Важно помнить логику: «хороший» для нас результат - это p>αp > \alpha, то есть неотвержение H0H_0, дающее право применять ANOVA или tt-тест в их обычной форме. Это противоположно привычной ситуации, когда исследователь надеется отвергнуть нулевую гипотезу.

Если тест Левена отверг равенство дисперсий, не отказывайтесь от анализа: используйте robust-альтернативы - критерий Уэлча (Welch ANOVA) или $t$-тест Уэлча с поправкой Сатертуэйта на степени свободы.

Тест Левена и предпосылки ANOVA

Гомогенность дисперсий - лишь одна из трёх предпосылок дисперсионного анализа наряду с независимостью наблюдений и нормальностью остатков. Тест Левена закрывает именно её. Если данные грубо ненормальны, проверять равенство дисперсий тестом Бартлетта нельзя - он крайне чувствителен к отклонению от нормальности и часто ложно «находит» неоднородность. Критерий Левена (особенно вариант Брауна-Форсайта) в этой роли надёжнее и потому стал отраслевым стандартом для предварительной диагностики перед ANOVA.

Связь с ANOVA здесь двойная. Во-первых, тест Левена сам по себе устроен как дисперсионный анализ над отклонениями zijz_{ij} - это буквально та же FF-механика, что и при сравнении средних. Во-вторых, его результат определяет, в какой форме применять основной анализ: при подтверждённой однородности используют классический FF-критерий с объединённой оценкой дисперсии, а при нарушении - переходят к ANOVA Уэлча, которая не требует равных дисперсий и корректирует степени свободы знаменателя. Удобно проводить проверку Левена и основной анализ в одном пакете (SPSS, R, Python/SciPy), чтобы согласованно выбрать центр группы и уровень значимости.

Частые ошибки

  • Путают направление вывода. Малое pp-значение здесь - плохая новость: оно означает неоднородность дисперсий и нарушение предпосылки, а не «успешный» результат.
  • Берут версию по среднему для асимметричных данных. При выбросах и скошенности нужна модификация Брауна-Форсайта по медиане, иначе тест завышает долю ложных срабатываний.
  • Проверяют дисперсии тестом Бартлетта при ненормальных данных. Бартлетт чувствителен к нарушению нормальности; для таких данных корректен именно тест Левена.
  • Считают неравные дисперсии приговором. Отвержение H0H_0 не запрещает сравнивать средние - оно лишь требует перейти к robust-методам (Уэлч, поправка Сатертуэйта).
  • Игнорируют размер выборки. На очень больших выборках тест Левена отвергает H0H_0 даже при практически незначимых различиях; смотрите и на величину эффекта, а не только на pp.

FAQ

Чем тест Левена отличается от теста Бартлетта? Оба проверяют равенство дисперсий, но Бартлетт предполагает нормальность данных и очень чувствителен к её нарушению. Тест Левена работает с абсолютными отклонениями и потому устойчив к ненормальности, что делает его предпочтительным для реальных данных.

Что такое модификация Брауна-Форсайта? Это вариант теста Левена, где центром группы берётся медиана, а не среднее. Замена делает критерий устойчивым к выбросам и асимметрии; именно эту версию большинство статистических пакетов используют по умолчанию.

Что делать, если тест показал неравенство дисперсий? Не отказываться от сравнения групп, а перейти к методам, не требующим гомогенности: ANOVA Уэлча, tt-критерий Уэлча с поправкой Сатертуэйта на степени свободы или непараметрические критерии (Краскела-Уоллиса).

Коротко

Тест Левена проверяет нулевую гипотезу о равенстве дисперсий нескольких групп, заменяя исходные данные их абсолютными отклонениями от центра (среднего или, в модификации Брауна-Форсайта, медианы) и прогоняя через них однофакторный ANOVA. Статистика WW распределена как F(k1,Nk)F(k-1, N-k); малое pp-значение говорит о неоднородности дисперсий и нарушении предпосылки ANOVA. Благодаря устойчивости к ненормальности критерий Левена вытеснил тест Бартлетта как стандартный инструмент диагностики перед сравнением средних.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также