Тест Бройша-Пагана: проверка гетероскедастичности

Тест Бройша-Пагана - один из наиболее распространённых способов выявить гетероскедастичность в регрессионных моделях. Разработанный в 1979 году Тревором Бройшем и Адрианом Паганом, он проверяет, остаётся ли дисперсия ошибок постоянной, или систематически меняется вместе с факторами модели. Нарушение гомоскедастичности не делает оценки МНК смещёнными, но лишает их свойства эффективности и искажает стандартные ошибки коэффициентов - а значит, -тесты и -тест теряют надёжность. Ниже разберём логику теста, формулу статистики, число степеней свободы и сравнение с тестом Уайта. Используйте инструмент ниже, чтобы проверить свою модель прямо сейчас.
Что такое гетероскедастичность
В классической линейной регрессии предполагается, что ошибки независимы и имеют одинаковую дисперсию:
Это условие гомоскедастичности. При гетероскедастичности дисперсия меняется от наблюдения к наблюдению:
и часто зависит от одного или нескольких регрессоров. Типичные примеры: расходы домохозяйств растут с доходом и «расходятся» сильнее, объём продаж крупных компаний варьируется шире, чем малых. На графике остатков против подогнанных значений гетероскедастичность проявляется как «воронка» или нарастающий разброс.

Идея теста Бройша-Пагана
Ключевая гипотеза теста: если дисперсия гомоскедастична, квадрат остатка не должен систематически зависеть от объясняющих переменных. Бройш и Паган предложили проверить это через вспомогательную регрессию. Алгоритм состоит из нескольких шагов.
Шаг 1. Оцените исходную регрессию МНК и получите остатки .
Шаг 2. Вычислите максимально правдоподобную оценку дисперсии:
Шаг 3. Постройте вспомогательную регрессию нормированных квадратов остатков на исходные факторы :
Шаг 4. Найдите объяснённую сумму квадратов (ESS) вспомогательной регрессии и вычислите статистику множителей Лагранжа:
При нулевой гипотезе о гомоскедастичности статистика асимптотически распределена как , где - число объясняющих переменных (без константы).
Модификация Кенкера
В 1981 году Роберт Кенкер предложил более робастную версию теста, не требующую предположения о нормальности ошибок. В ней вспомогательная регрессия строится не по нормированным , а по самим квадратам остатков , а статистика вычисляется как:
где - коэффициент детерминации вспомогательной регрессии. Эта форма совпадает с принципом, используемым в тесте Уайта, но вспомогательная регрессия включает только линейные члены (без квадратов и кросс-произведений).
Модификацию Кенкера реализуют большинство статистических пакетов: в R функция bptest() из пакета lmtest по умолчанию использует именно её, в Stata - команда estat hettest. При нормальных ошибках обе версии дают одинаковые выводы, но на практике модификация Кенкера предпочтительнее, поскольку устойчива к ненормальности.

Статистика LM и распределение хи-квадрат
При нулевой гипотезе : для всех статистика имеет предельное распределение . Решающее правило:
- Если (критическое значение), нулевая гипотеза отвергается - гетероскедастичность значима.
- Если - гомоскедастичность не опровергнута.
Например, при и критическое значение . Если вычисленная статистика , мы отвергаем и заключаем, что дисперсия ошибок не постоянна. Аналогично смотрят на -значение: означает значимую гетероскедастичность.
Число степеней свободы критерия равно числу регрессоров вспомогательной регрессии без константы. В стандартном варианте это - тех же, что в исходной модели. Если включают квадраты или взаимодействия, число степеней свободы растёт.
Сравнение с тестом Уайта
Тест Бройша-Пагана и тест Уайта направлены на одну проблему, но устроены по-разному. Тест Бройша-Пагана использует линейную вспомогательную регрессию (только ), поэтому хорошо выявляет линейную зависимость дисперсии от факторов и остаётся мощным при малых выборках: число параметров вспомогательной модели равно . Тест Уайта добавляет квадраты и кросс-произведения, что делает его универсальнее для нелинейной гетероскедастичности, но число степеней свободы растёт быстро - при вспомогательная регрессия включает уже 9 дополнительных регрессоров. На малой выборке это снижает мощность.
Практическое правило: начинайте с теста Бройша-Пагана. Если он не обнаруживает гетероскедастичность, но экономическая логика подсказывает нелинейную зависимость дисперсии - проверьте тестом Уайта.
Коррекция гетероскедастичности
Если тест Бройша-Пагана отвергает гомоскедастичность, есть три основных подхода.
Робастные стандартные ошибки Уайта (HC). Сохраняем МНК-оценки коэффициентов, но пересчитываем дисперсии с поправкой на гетероскедастичность: , где . Это быстрый способ получить корректные -тесты без смены оценщика.
Взвешенный МНК (WLS). Если форма гетероскедастичности известна (например, ), умножаем каждое наблюдение на вес . WLS эффективнее обычного МНК, когда предположение о форме дисперсии верно.
Преобразование переменных. Логарифмирование зависимой переменной ( вместо ) часто само по себе стабилизирует дисперсию в моделях с мультипликативной структурой ошибок - классика для моделей заработной платы или цен.
Ограничения теста Бройша-Пагана
Несмотря на широкое применение, тест имеет известные ограничения. Во-первых, классическая версия предполагает нормальность ошибок: при тяжёлых хвостах статистика размером становится несостоятельной. Именно поэтому модификацию Кенкера рекомендуют как умолчание. Во-вторых, тест обнаруживает только линейную зависимость дисперсии от регрессоров: нелинейные формы (например, U-образная) могут ускользнуть. В-третьих, при очень маленьких выборках () асимптотика плохо работает, и выводы ненадёжны.

Пример применения
Рассмотрим модель потребительских расходов: , . МНК даёт остатки . Находим . Строим вспомогательную регрессию на Доход и Состав семьи. Пусть . Тогда .
Критическое значение . Поскольку , нулевая гипотеза не отвергается при . Но при критическое значение - и здесь мы уже видим значимую гетероскедастичность. Это демонстрирует, как выбор уровня значимости влияет на вывод, и почему эконометристы часто смотрят на -значение целиком.
Частые ошибки
- Не нормировать остатки. В оригинальном тесте Бройша-Пагана регрессируют , а не просто . Пропуск деления изменяет масштаб статистики.
- Неверное число степеней свободы. Степеней свободы у столько, сколько регрессоров во вспомогательной регрессии без константы. Если включить квадраты факторов, это или больше.
- Путать ESS/2 и n·R². В классической версии статистика ; в модификации Кенкера . Эти формулы дают разные числа на одних данных.
- Делать выводы при малой выборке. При асимптотика хи-квадрат ненадёжна; используйте ресэмплинг или точные тесты.
- Игнорировать нелинейную гетероскедастичность. Отрицательный результат теста Бройша-Пагана не означает отсутствия гетероскедастичности вообще - только линейной. Дополняйте тестом Уайта при подозрении на нелинейность.
FAQ
Зачем нужен тест Бройша-Пагана, если можно посмотреть на график остатков? График остатков - первичная диагностика, но субъективная. Тест Бройша-Пагана даёт формальный статистический критерий с уровнем значимости, что позволяет корректно принять или отвергнуть нулевую гипотезу и документировать результат в академической работе.
Что делать, если тест даёт значимый результат, но форма гетероскедастичности неизвестна?
Применяйте робастные стандартные ошибки Уайта (HC3 - наиболее консервативный вариант). Это корректирует дисперсии коэффициентов без предположений о форме . В R это опция coeftest(model, vcov = hccm(model, type = "HC3")).
Влияет ли порядок включения факторов во вспомогательную регрессию на результат? Нет. Статистика зависит от или вспомогательной регрессии, которые не зависят от порядка включения переменных.
Коротко
Тест Бройша-Пагана проверяет гомоскедастичность через вспомогательную регрессию квадратов остатков на объясняющие переменные модели. Статистика (или в модификации Кенкера) сравнивается с . При значимом результате используйте робастные ошибки Уайта, взвешенный МНК или логарифмирование переменных. Тест эффективен при линейной гетероскедастичности; для нелинейной дополняйте его тестом Уайта.
Читайте также

Тест Бройша-Пагана: проверка гетероскедастичности
Тест Бройша-Пагана выявляет гетероскедастичность остатков регрессии. Разбираем формулу LM-статистики, интерпретацию p-значения, варианты теста и типичные ошибки.

Гетероскедастичность тест Уайта: проверка дисперсии
Гетероскедастичность тест Уайта: разбираем вспомогательную регрессию, статистику nR², число степеней свободы и проверку гипотез по хи-квадрат в эконометрике.

Тест Глейзера: проверка гетероскедастичности МНК
Тест Глейзера для выявления гетероскедастичности: три формы вспомогательной регрессии, t-критерий значимости, сравнение с тестом Уайта и Бройша-Пагана, пример расчёта.