Тест Бройша-Годфри: проверка остатков на автокорреляцию

Когда вы оцениваете регрессию по временным рядам, остатки часто оказываются связаны во времени: ошибка одного периода тянет за собой ошибку следующего. Это автокорреляция, и она делает обычные стандартные ошибки заниженными, а t-статистики - обманчиво большими. Тест Бройша-Годфри (Breusch-Godfrey) - самый универсальный способ проверить остатки регрессии на автокорреляцию любого порядка. Ниже разберём логику теста, формулу LM-статистики, выбор числа лагов и чем он лучше классического Дарбина-Уотсона. Калькулятор сразу под введением посчитает статистику и p-значение по вашим числам.
Что проверяет тест Бройша-Годфри
Тест Бройша-Годфри - это тест множителей Лагранжа (LM-тест) на наличие автокорреляции в остатках регрессии. Нулевая гипотеза утверждает, что остатки не коррелированы во времени: коэффициенты при лагах ошибки равны нулю. Альтернатива - присутствует автокорреляция порядка до включительно.
Формально модель ошибки записывается как авторегрессия порядка :
Нулевая гипотеза - это . Тест проверяет её совместно для всех лагов сразу, поэтому он чувствителен и к простой автокорреляции первого порядка, и к более сложным сезонным структурам.

Как устроена вспомогательная регрессия
Процедура теста состоит из двух шагов и опирается на вспомогательную регрессию - в этом её сила.
- Оцениваем исходную модель обычным МНК и сохраняем остатки .
- Строим вспомогательную регрессию: остатки объясняем всеми исходными регрессорами и лагами самих остатков .
Из вспомогательной регрессии берём коэффициент детерминации . LM-статистика теста:
где - число наблюдений, - порядок проверяемой автокорреляции (число добавленных лагов). При справедливости статистика асимптотически распределена как хи-квадрат с степенями свободы:
Ключевая идея: если лаги остатков ничего не добавляют к объяснению, вспомогательной регрессии близок к нулю, и мала. Если же остатки «помнят» своё прошлое, растёт, и статистика выходит в хвост распределения. Похожую конструкцию « против хи-квадрат» использует и тест Бройша-Пагана - только там вспомогательная регрессия объясняет квадраты остатков, а проверяется гетероскедастичность.
Правило принятия решения
Решение принимается сравнением статистики с критическим значением хи-квадрат либо по p-значению:
- Если (эквивалентно ) - нулевая гипотеза отвергается, автокорреляция присутствует.
- Если - оснований отвергать нет, остатки можно считать некоррелированными.
При уровне значимости и одном лаге критическое значение . Для двух лагов оно равно , для четырёх - . Чем больше лагов вы проверяете, тем выше планка: добавляя степени свободы, вы требуете более выраженного сигнала.

Как выбрать число лагов
Выбор - главный практический вопрос. Слишком мало лагов - пропустите автокорреляцию высокого порядка; слишком много - потеряете мощность теста на лишних степенях свободы.
- Годовые данные - обычно , реже .
- Квартальные данные - берут , чтобы поймать сезонную автокорреляцию.
- Месячные данные - для проверки годовой сезонности.
- Эмпирическое правило - можно взять или ориентироваться на правило Шверта.
Разумная стратегия - начать с лага, соответствующего периодичности данных, и проверить устойчивость вывода при соседних значениях . Если вывод о наличии автокорреляции не меняется при , он надёжен.
Чем тест лучше Дарбина-Уотсона
Тест Бройша-Годфри вытеснил классический критерий Дарбина-Уотсона по нескольким причинам.
- Любой порядок автокорреляции. Дарбин-Уотсон проверяет только автокорреляцию первого порядка; Бройша-Годфри - произвольный порядок .
- Работает с лагированной зависимой переменной. Если среди регрессоров есть (динамические модели), статистика Дарбина-Уотсона смещена к 2 и не работает; LM-тест корректен.
- Нет зоны неопределённости. У Дарбина-Уотсона есть «серая зона» между нижней и верхней критическими границами, где вывод невозможен. У Бройша-Годфри есть чёткое p-значение.
- Учитывает регрессоры. Вспомогательная регрессия включает исходные , что устраняет смещение от их влияния.
Дарбин-Уотсон остаётся полезен как быстрый ориентир: значение около 2 говорит об отсутствии автокорреляции первого порядка, ближе к 0 - о положительной, ближе к 4 - об отрицательной. Но для формального вывода в современной эконометрике используют именно LM-тест.
Пример пошагового расчёта
Пусть оценена регрессия объёма продаж от рекламных расходов по 60 квартальным наблюдениям. Подозревается сезонная связь, поэтому проверяем автокорреляцию порядка .
- Сохраняем остатки исходной модели.
- Строим вспомогательную регрессию остатков на исходный регрессор и четыре лага ; получаем .
- Считаем статистику: .
- Критическое значение .
- Поскольку , p-значение меньше - нулевая гипотеза отвергается, сезонная автокорреляция присутствует.
Дальше остаётся выбрать способ коррекции. Заметьте: если бы мы проверяли только , лаг 4 остался бы незамеченным, и мы бы ошибочно приняли остатки за «чистые». Это типичная ситуация для квартальных данных.
Что делать, если автокорреляция найдена
Отвержение не означает, что модель надо выбросить. Стандартные пути коррекции:
- Робастные стандартные ошибки Ньюи-Уэста (HAC) - самый частый приём: оценки коэффициентов сохраняются, но стандартные ошибки корректируются на автокорреляцию и гетероскедастичность.
- Обобщённый МНК (GLS) / процедура Кохрейна-Оркатта - явно моделируют структуру ошибки через коэффициент .
- Добавить лаги зависимой или объясняющих переменных - часто автокорреляция остатков сигналит о пропущенной динамике, а не о «плохих» ошибках.
- Пересмотреть спецификацию - пропущенная переменная или неверная функциональная форма нередко проявляются как автокорреляция.
Частые ошибки
- Путают порядок лагов с числом регрессоров. Степени свободы хи-квадрат равны числу проверяемых лагов , а не числу объясняющих переменных модели.
- Берут один лаг для квартальных данных. Сезонная автокорреляция на лаге 4 останется незамеченной, если проверять только .
- Применяют к малой выборке без оговорок. LM-тест асимптотический; при выводы шаткие, лучше использовать поправку и осторожно трактовать p-значение.
- Считают, что значимый результат «ломает» модель. Автокорреляция влияет на стандартные ошибки, а не на состоятельность МНК-оценок коэффициентов - их часто можно спасти HAC-коррекцией.
- Игнорируют лагированную зависимую переменную. Именно здесь Дарбина-Уотсона нельзя, а Бройша-Годфри - можно и нужно.
FAQ
Чем тест Бройша-Годфри отличается от теста Бройша-Пагана? Это разные тесты с похожей LM-конструкцией. Бройша-Годфри проверяет автокорреляцию остатков (связь во времени), а Бройша-Пагана - гетероскедастичность (непостоянство дисперсии). У первого вспомогательная регрессия включает лаги остатков, у второго - объясняет квадраты остатков.
Какое число лагов брать по умолчанию? Для годовых данных начните с , для квартальных - , для месячных - . Полезно проверить устойчивость вывода при нескольких соседних значениях.
Можно ли применять тест к моделям с лагированной зависимой переменной? Да, и это одно из главных преимуществ. В отличие от Дарбина-Уотсона, тест Бройша-Годфри остаётся корректным, когда среди регрессоров присутствует .
Коротко
Тест Бройша-Годфри - LM-тест на автокорреляцию остатков регрессии произвольного порядка. Остатки исходной модели регрессируют на её регрессоры и собственные лаги; из вспомогательной регрессии берут и считают статистику , которая при распределена как . Если превышает критическое значение (p-значение меньше ), автокорреляция присутствует. Тест работает для любого порядка лагов и для динамических моделей с лагированной зависимой переменной, где Дарбина-Уотсона неприменим. При обнаружении автокорреляции корректируют стандартные ошибки методом Ньюи-Уэста или явно моделируют структуру ошибки.
Читайте также

Тест Дарбина-Уотсона: автокорреляция остатков
Тест Дарбина-Уотсона показывает, есть ли автокорреляция остатков регрессии. Разбираем статистику DW, границы dL и dU, проверку гипотез и как не ошибиться в выводах.

Доверительный интервал коэффициента регрессии: расчёт
Как рассчитать доверительный интервал коэффициента регрессии: формула через стандартную ошибку и критическое значение Стьюдента, пример вычисления и проверка значимости.

Ловушка фиктивных переменных: причина и как избежать
Что такое ловушка фиктивных переменных в регрессии: почему полный набор дамми с константой даёт мультиколлинеарность и как выбрать базовую категорию, чтобы её избежать.