EssayAI
Блог
Блог
Математика и алгоритмы

Тест Бройша-Пагана: проверка гетероскедастичности

17 июня 2026Время чтения: 7 минут
#тест Бройша-Пагана#гетероскедастичность#эконометрика#регрессия#остатки
Тест Бройша-Пагана: проверка гетероскедастичности

Тест Бройша-Пагана - один из наиболее распространённых способов выявить гетероскедастичность в регрессионных моделях. Разработанный в 1979 году Тревором Бройшем и Адрианом Паганом, он проверяет, остаётся ли дисперсия ошибок постоянной, или систематически меняется вместе с факторами модели. Нарушение гомоскедастичности не делает оценки МНК смещёнными, но лишает их свойства эффективности и искажает стандартные ошибки коэффициентов - а значит, tt-тесты и FF-тест теряют надёжность. Ниже разберём логику теста, формулу статистики, число степеней свободы и сравнение с тестом Уайта. Используйте инструмент ниже, чтобы проверить свою модель прямо сейчас.

Что такое гетероскедастичность

В классической линейной регрессии yi=β0+β1x1i++βkxki+εiy_i = \beta_0 + \beta_1 x_{1i} + \dots + \beta_k x_{ki} + \varepsilon_i предполагается, что ошибки εi\varepsilon_i независимы и имеют одинаковую дисперсию:

Var(εi)=σ2=const.\operatorname{Var}(\varepsilon_i) = \sigma^2 = \text{const.}

Это условие гомоскедастичности. При гетероскедастичности дисперсия меняется от наблюдения к наблюдению:

Var(εi)=σi2,\operatorname{Var}(\varepsilon_i) = \sigma_i^2,

и часто зависит от одного или нескольких регрессоров. Типичные примеры: расходы домохозяйств растут с доходом и «расходятся» сильнее, объём продаж крупных компаний варьируется шире, чем малых. На графике остатков против подогнанных значений гетероскедастичность проявляется как «воронка» или нарастающий разброс.

Диаграмма гетероскедастичности: остатки расширяются воронкой с ростом фактора x
Диаграмма гетероскедастичности: остатки расширяются воронкой с ростом фактора x

Идея теста Бройша-Пагана

Ключевая гипотеза теста: если дисперсия гомоскедастична, квадрат остатка ei2e_i^2 не должен систематически зависеть от объясняющих переменных. Бройш и Паган предложили проверить это через вспомогательную регрессию. Алгоритм состоит из нескольких шагов.

Шаг 1. Оцените исходную регрессию МНК и получите остатки ei=yiy^ie_i = y_i - \hat{y}_i.

Шаг 2. Вычислите максимально правдоподобную оценку дисперсии:

σ^ML2=1ni=1nei2.\hat{\sigma}^2_{ML} = \frac{1}{n} \sum_{i=1}^n e_i^2.

Шаг 3. Постройте вспомогательную регрессию нормированных квадратов остатков pi=ei2/σ^ML2p_i = e_i^2 / \hat{\sigma}^2_{ML} на исходные факторы x1,,xkx_1, \dots, x_k:

pi=α0+α1x1i++αkxki+ui.p_i = \alpha_0 + \alpha_1 x_{1i} + \dots + \alpha_k x_{ki} + u_i.

Шаг 4. Найдите объяснённую сумму квадратов (ESS) вспомогательной регрессии и вычислите статистику множителей Лагранжа:

LM=ESS2.LM = \frac{ESS}{2}.

При нулевой гипотезе о гомоскедастичности статистика LMLM асимптотически распределена как χ2(k)\chi^2(k), где kk - число объясняющих переменных (без константы).

Модификация Кенкера

В 1981 году Роберт Кенкер предложил более робастную версию теста, не требующую предположения о нормальности ошибок. В ней вспомогательная регрессия строится не по нормированным pip_i, а по самим квадратам остатков ei2e_i^2, а статистика вычисляется как:

LM=nRaux2,LM = n \cdot R^2_{aux},

где Raux2R^2_{aux} - коэффициент детерминации вспомогательной регрессии. Эта форма совпадает с принципом, используемым в тесте Уайта, но вспомогательная регрессия включает только линейные члены xjx_j (без квадратов и кросс-произведений).

Модификацию Кенкера реализуют большинство статистических пакетов: в R функция bptest() из пакета lmtest по умолчанию использует именно её, в Stata - команда estat hettest. При нормальных ошибках обе версии дают одинаковые выводы, но на практике модификация Кенкера предпочтительнее, поскольку устойчива к ненормальности.

Схема вспомогательной регрессии теста Бройша-Пагана: остатки, квадрирование, регрессия на факторы, LM-статистика
Схема вспомогательной регрессии теста Бройша-Пагана: остатки, квадрирование, регрессия на факторы, LM-статистика

Статистика LM и распределение хи-квадрат

При нулевой гипотезе H0H_0: σi2=σ2\sigma_i^2 = \sigma^2 для всех ii статистика LMLM имеет предельное распределение χ2(k)\chi^2(k). Решающее правило:

  • Если LM>χα2(k)LM > \chi^2_{\alpha}(k) (критическое значение), нулевая гипотеза отвергается - гетероскедастичность значима.
  • Если LMχα2(k)LM \leq \chi^2_{\alpha}(k) - гомоскедастичность не опровергнута.

Например, при k=2k = 2 и α=0,05\alpha = 0{,}05 критическое значение χ0,052(2)5,99\chi^2_{0,05}(2) \approx 5{,}99. Если вычисленная статистика LM=7,2>5,99LM = 7{,}2 > 5{,}99, мы отвергаем H0H_0 и заключаем, что дисперсия ошибок не постоянна. Аналогично смотрят на pp-значение: p<αp < \alpha означает значимую гетероскедастичность.

Число степеней свободы критерия равно числу регрессоров вспомогательной регрессии без константы. В стандартном варианте это kk - тех же, что в исходной модели. Если включают квадраты или взаимодействия, число степеней свободы растёт.

Сравнение с тестом Уайта

Тест Бройша-Пагана и тест Уайта направлены на одну проблему, но устроены по-разному. Тест Бройша-Пагана использует линейную вспомогательную регрессию (только xjx_j), поэтому хорошо выявляет линейную зависимость дисперсии от факторов и остаётся мощным при малых выборках: число параметров вспомогательной модели равно k+1k + 1. Тест Уайта добавляет квадраты и кросс-произведения, что делает его универсальнее для нелинейной гетероскедастичности, но число степеней свободы растёт быстро - при k=3k = 3 вспомогательная регрессия включает уже 9 дополнительных регрессоров. На малой выборке это снижает мощность.

Практическое правило: начинайте с теста Бройша-Пагана. Если он не обнаруживает гетероскедастичность, но экономическая логика подсказывает нелинейную зависимость дисперсии - проверьте тестом Уайта.

Коррекция гетероскедастичности

Если тест Бройша-Пагана отвергает гомоскедастичность, есть три основных подхода.

Робастные стандартные ошибки Уайта (HC). Сохраняем МНК-оценки коэффициентов, но пересчитываем дисперсии с поправкой на гетероскедастичность: V^HC=(XX)1XΩ^X(XX)1\hat{V}_{HC} = (X'X)^{-1} X' \hat{\Omega} X (X'X)^{-1}, где Ω^=diag(e12,,en2)\hat{\Omega} = \operatorname{diag}(e_1^2, \dots, e_n^2). Это быстрый способ получить корректные tt-тесты без смены оценщика.

Взвешенный МНК (WLS). Если форма гетероскедастичности известна (например, σi2xi\sigma_i^2 \propto x_i), умножаем каждое наблюдение на вес wi=1/σ^iw_i = 1 / \hat{\sigma}_i. WLS эффективнее обычного МНК, когда предположение о форме дисперсии верно.

Преобразование переменных. Логарифмирование зависимой переменной (lny\ln y вместо yy) часто само по себе стабилизирует дисперсию в моделях с мультипликативной структурой ошибок - классика для моделей заработной платы или цен.

Ограничения теста Бройша-Пагана

Несмотря на широкое применение, тест имеет известные ограничения. Во-первых, классическая версия предполагает нормальность ошибок: при тяжёлых хвостах статистика LMLM размером ESS/2ESS/2 становится несостоятельной. Именно поэтому модификацию Кенкера рекомендуют как умолчание. Во-вторых, тест обнаруживает только линейную зависимость дисперсии от регрессоров: нелинейные формы (например, U-образная) могут ускользнуть. В-третьих, при очень маленьких выборках (n<20n < 20) асимптотика χ2\chi^2 плохо работает, и выводы ненадёжны.

Таблица сравнения теста Бройша-Пагана и теста Уайта по мощности и числу степеней свободы
Таблица сравнения теста Бройша-Пагана и теста Уайта по мощности и числу степеней свободы

Пример применения

Рассмотрим модель потребительских расходов: Ci=β0+β1Доходi+β2Состав семьиi+εiC_i = \beta_0 + \beta_1 \cdot \text{Доход}_i + \beta_2 \cdot \text{Состав семьи}_i + \varepsilon_i, n=50n = 50. МНК даёт остатки eie_i. Находим σ^ML2=150ei2=144\hat{\sigma}^2_{ML} = \frac{1}{50}\sum e_i^2 = 144. Строим вспомогательную регрессию pi=ei2/144p_i = e_i^2 / 144 на Доход и Состав семьи. Пусть ESSaux=11,4ESS_{aux} = 11{,}4. Тогда LM=11,4/2=5,7LM = 11{,}4 / 2 = 5{,}7.

Критическое значение χ0,052(2)=5,99\chi^2_{0,05}(2) = 5{,}99. Поскольку LM=5,7<5,99LM = 5{,}7 < 5{,}99, нулевая гипотеза не отвергается при α=0,05\alpha = 0{,}05. Но при α=0,10\alpha = 0{,}10 критическое значение χ0,102(2)=4,61<5,7\chi^2_{0,10}(2) = 4{,}61 < 5{,}7 - и здесь мы уже видим значимую гетероскедастичность. Это демонстрирует, как выбор уровня значимости влияет на вывод, и почему эконометристы часто смотрят на pp-значение целиком.

Частые ошибки

  • Не нормировать остатки. В оригинальном тесте Бройша-Пагана регрессируют pi=ei2/σ^ML2p_i = e_i^2 / \hat{\sigma}^2_{ML}, а не просто ei2e_i^2. Пропуск деления изменяет масштаб статистики.
  • Неверное число степеней свободы. Степеней свободы у χ2\chi^2 столько, сколько регрессоров во вспомогательной регрессии без константы. Если включить квадраты факторов, это 2k2k или больше.
  • Путать ESS/2 и n·R². В классической версии статистика LM=ESS/2LM = ESS/2; в модификации Кенкера LM=nRaux2LM = n \cdot R^2_{aux}. Эти формулы дают разные числа на одних данных.
  • Делать выводы при малой выборке. При n<30n < 30 асимптотика хи-квадрат ненадёжна; используйте ресэмплинг или точные тесты.
  • Игнорировать нелинейную гетероскедастичность. Отрицательный результат теста Бройша-Пагана не означает отсутствия гетероскедастичности вообще - только линейной. Дополняйте тестом Уайта при подозрении на нелинейность.

FAQ

Зачем нужен тест Бройша-Пагана, если можно посмотреть на график остатков? График остатков - первичная диагностика, но субъективная. Тест Бройша-Пагана даёт формальный статистический критерий с уровнем значимости, что позволяет корректно принять или отвергнуть нулевую гипотезу и документировать результат в академической работе.

Что делать, если тест даёт значимый результат, но форма гетероскедастичности неизвестна? Применяйте робастные стандартные ошибки Уайта (HC3 - наиболее консервативный вариант). Это корректирует дисперсии коэффициентов без предположений о форме σi2\sigma_i^2. В R это опция coeftest(model, vcov = hccm(model, type = "HC3")).

Влияет ли порядок включения факторов во вспомогательную регрессию на результат? Нет. Статистика LMLM зависит от R2R^2 или ESSESS вспомогательной регрессии, которые не зависят от порядка включения переменных.

Коротко

Тест Бройша-Пагана проверяет гомоскедастичность через вспомогательную регрессию квадратов остатков на объясняющие переменные модели. Статистика LM=ESS/2LM = ESS/2 (или nR2n \cdot R^2 в модификации Кенкера) сравнивается с χ2(k)\chi^2(k). При значимом результате используйте робастные ошибки Уайта, взвешенный МНК или логарифмирование переменных. Тест эффективен при линейной гетероскедастичности; для нелинейной дополняйте его тестом Уайта.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также