Коэффициент автокорреляции остатков: формула и интерпретация

Коэффициент автокорреляции остатков первого порядка - центральный параметр в анализе временных рядов и эконометрике. Он показывает, насколько тесно текущий остаток регрессии связан с предыдущим, и напрямую определяет, можно ли доверять стандартным ошибкам МНК-оценок. Проверьте остатки своей модели с помощью инструмента ниже - введите значения и получите расчёт.
Что измеряет коэффициент автокорреляции первого порядка
Предположим, что регрессионная модель имеет структуру ошибок вида:
где - остаток в момент , - коэффициент автокорреляции первого порядка, - белый шум. Это и есть процесс AR(1) для остатков.
Параметр лежит в диапазоне . При остатки независимы - предпосылка МНК выполнена. При (положительная автокорреляция) большой остаток в периоде влечёт большой остаток в периоде : на временном графике видны «волны» одного знака. При знаки регулярно чередуются.

Формула оценки коэффициента автокорреляции
Прямая выборочная оценка строится как коэффициент корреляции Пирсона между соседними остатками:
Знаменатель берётся по всем наблюдениям, числитель - по парам. Это приближённая оценка, достаточная для практических нужд.
Более точная формулировка учитывает дисперсию соседних наблюдений отдельно:
где - среднее остатков (обычно близко к нулю при МНК-оценке с константой). На практике обе формулы дают близкие результаты.
Связь с тестом Дарбина-Уотсона
Тест Дарбина-Уотсона использует статистику , которая аппроксимируется через :
При имеем , при - , при - . Это позволяет переводить результаты теста Дарбина-Уотсона в оценку коэффициента автокорреляции и обратно.
Обратная формула: . Если тест показал , оценка коэффициента автокорреляции составит .
Подробнее о границах теста и зонах неопределённости - в статье об автокорреляции остатков и критерии Дарбина-Уотсона.
Последствия ненулевого коэффициента автокорреляции
Присутствие автокорреляции в остатках не смещает МНК-оценки коэффициентов регрессии: по-прежнему несмещены. Проблема в другом - стандартные ошибки оказываются заниженными, что ведёт к следующим последствиям:
- -статистики коэффициентов завышены, поэтому незначимые переменные кажутся значимыми.
- Интервалы доверия для уже, чем должны быть.
- -тест значимости регрессии в целом также некорректен.
- Прогноз становится менее эффективным.
При положительной автокорреляции (ρ > 0, типичной для макроэкономических временных рядов) стандартные ошибки занижаются особенно сильно. Переменная с p-value = 0,03 по обычному МНК может оказаться незначимой при корректном расчёте ошибок.

Оценка методом Кохрена-Оркатта и Прейса-Уинстена
Когда известен, классический способ устранить автокорреляцию - преобразование Кохрена-Оркатта. Исходная модель:
Вычтем из уравнения для уравнение для , умноженное на :
Получаем новую регрессию квазиразностей. Если известно, оценки для квазиразностей эффективны и несмещены. На практике не известно заранее: его оценивают итерационно (метод Кохрена-Оркатта) или применяют метод Прейса-Уинстена, который сохраняет первое наблюдение.
Альтернативный подход - обобщённый МНК (GLS) или HAC-оценки стандартных ошибок (Ньюи-Уэст), которые корректируют ошибки без изменения точечных оценок коэффициентов.
Интерпретация значений коэффициента
На практике принято следующее разграничение по абсолютному значению :
- - слабая автокорреляция; МНК-оценки достаточно надёжны.
- - умеренная автокорреляция; стоит скорректировать стандартные ошибки.
- - сильная автокорреляция; требуется преобразование модели.
При близком к единице следует также проверить, нет ли в данных единичного корня: ряды, нестационарные по уровню, закономерно дают остатки с высокой автокорреляцией. В таком случае решение - первые разности или коинтеграционный анализ.
Откуда берётся автокорреляция в реальных данных
Автокорреляция остатков - это симптом, а не причина. Её появление чаще всего сигнализирует об одной из следующих проблем в спецификации модели:
Упущенный тренд или сезонность. Если зависимая переменная содержит детерминированный тренд, а он не включён в регрессию, остатки будут систематически положительны в начале ряда и отрицательны в конце (или наоборот). Коэффициент автокорреляции окажется высоким, хотя сам по себе не является источником проблемы.
Неверная функциональная форма. Если истинная зависимость нелинейна, а модель линейна, в остатках появится систематический паттерн: они будут положительны в середине диапазона значений регрессора и отрицательны на краях (или наоборот). При упорядоченных данных по времени это визуально выглядит как автокорреляция.
Ошибка в структуре запаздывания. В моделях с временным лагом (когда потребление реагирует на изменение дохода не мгновенно, а через квартал-два) неправильный выбор лага приводит к автокоррелированным остаткам.
Нестационарность ряда. Ряды с единичным корнем при оценке МНК порождают остатки, которые «помнят» своё прошлое. В этом случае коэффициент автокорреляции остатков близок к 1, и его нельзя устранить простым преобразованием Кохрена-Оркатта - необходима работа с самой структурой данных.
Диагностика причины важнее немедленного «лечения»: если автокорреляция вызвана упущенной переменной, её нужно включить в модель, а не корректировать ошибки.
Автокорреляция высших порядков
AR(1) - простейший случай. Процесс AR(p) описывается уравнением:
Коэффициенты - автокорреляции соответствующих лагов. Для проверки наличия автокорреляции высших порядков используется тест Бройша-Годфри, который оценивает вспомогательную регрессию остатков на остатки лагов 1, 2, ..., p. В отличие от теста Дарбина-Уотсона, Бройш-Годфри работает при наличии лагированной зависимой переменной в регрессоре.

Частые ошибки
- Путать коэффициент автокорреляции остатков с коэффициентом корреляции регрессоров. Первый измеряет зависимость ошибок во времени, второй - мультиколлинеарность предикторов. Это разные проблемы с разными последствиями.
- Делать вывод об отсутствии автокорреляции только по значению . Тест Дарбина-Уотсона имеет зону неопределённости: если попадает между и , вывод о наличии или отсутствии автокорреляции невозможен.
- Применять итерацию Кохрена-Оркатта без проверки сходимости. Если оценка не стабилизируется за 5-7 итераций, модель требует переспецификации, а не улучшения оценки .
- Игнорировать знак . Положительная автокорреляция сигнализирует об упущенном тренде или сезонности; отрицательная - о возможной перекорректировке или нестационарности.
- Использовать тест Дарбина-Уотсона, когда в модели есть лагированная зависимая переменная. В этом случае тест смещён; применяйте тест Бройша-Годфри.
FAQ
Почему коэффициент автокорреляции остатков не совпадает с DW/2 точно? Формула - приближение. Точная связь нелинейна и зависит от числа наблюдений и числа регрессоров. При малых выборках () расхождение может достигать 0,05-0,1.
Можно ли иметь значимую автокорреляцию при ? Да. Высокий коэффициент детерминации не гарантирует отсутствия автокорреляции. Типичная ситуация: оба ряда - нестационарные, регрессия ложная, а остатки автокоррелированы именно потому, что модель неверно специфицирована.
Как выбрать между HAC-оценками и преобразованием Кохрена-Оркатта? HAC-оценки (Ньюи-Уэст) предпочтительны, когда цель - корректные стандартные ошибки без изменения точечных оценок. Кохрен-Оркатт уместен, если важна эффективность (BLUE) и структура AR(1) правдоподобна. При неопределённости используйте HAC - они устойчивы к более широкому классу нарушений.
Коротко
Коэффициент автокорреляции остатков первого порядка измеряет линейную зависимость между соседними ошибками регрессии. Он напрямую связан со статистикой Дарбина-Уотсона формулой . Ненулевой не смещает МНК-оценки коэффициентов, но делает стандартные ошибки недостоверными. Устранение автокорреляции - преобразование Кохрена-Оркатта, обобщённый МНК или HAC-коррекция. При необходима также проверка на единичный корень.
Читайте также

Автокорреляция остатков: критерий Дарбина-Уотсона
Автокорреляция остатков в регрессии и критерий Дарбина-Уотсона: формула статистики d, зоны принятия решений, таблица критических значений, причины нарушения и способы устранения в МНК.

Связь коэффициента корреляции и детерминации: r и R²
Как связаны коэффициент корреляции и детерминации в парной регрессии: почему R квадрат равен квадрату r, что показывает каждый и где это правило ломается.

Тест Бройша-Годфри: проверка остатков на автокорреляцию
Тест Бройша-Годфри на автокорреляцию остатков регрессии: LM-статистика n·R², выбор числа лагов, сравнение с хи-квадрат, отличие от Дарбина-Уотсона и интерпретация p-значения.