Расширенный тест Дики-Фуллера: проверка на единичный корень
Расширенный тест Дики-Фуллера (ADF, augmented Dickey-Fuller) - это статистический критерий, который проверяет, есть ли у временного ряда единичный корень, то есть является ли ряд нестационарным. Это первый шаг почти любого анализа временных рядов: пока вы не убедились, что ряд стационарен, регрессии по нему дают мнимые зависимости, а прогнозы расходятся. Слово «расширенный» означает, что к исходному тесту Дики-Фуллера добавляют лаги разностей ряда, чтобы убрать автокорреляцию остатков. Ниже разберём, что такое единичный корень, как строится ADF-регрессия, как считается статистика и почему её сравнивают не с таблицей Стьюдента, а с критическими значениями MacKinnon. Чтобы сразу почувствовать связь между коэффициентом авторегрессии и выводом теста, покрутите калькулятор: он строит ряд, считает ADF-статистику и показывает, по какую сторону критического значения она оказалась.
Что такое единичный корень и зачем его искать
Простейшая модель временного ряда - авторегрессия первого порядка AR(1):
где - коэффициент авторегрессии, а - белый шум. Поведение ряда целиком определяется значением . Если , ряд стационарен: любое отклонение со временем затухает, и ряд возвращается к своему среднему уровню. Если же , мы получаем случайное блуждание - у такого ряда единичный корень, отклонения не затухают, а накапливаются, и ряд медленно уплывает в сторону без всякой тенденции к возврату. Именно случай и проверяет тест: наличие единичного корня означает нестационарность.
Различие между двумя режимами видно невооружённым глазом, если менять и смотреть на форму ряда - мень-реверсивный ряд жмётся к среднему, а блуждание разбредается.
Как строится ADF-регрессия
Вычитая из обеих частей уравнения AR(1), удобно переписать модель через разности. Обозначим , тогда
где . Теперь нулевая гипотеза о единичном корне превращается в простое и удобное условие . Если , разности зависят только от шума - это и есть случайное блуждание. Если же (то есть ), ряд стационарен. Расширенная версия добавляет в регрессию лагов разностей, чтобы поглотить автокорреляцию остатков, плюс при необходимости константу и тренд :
Это и есть полная ADF-регрессия. Лаговые члены - единственное, чем расширенный тест отличается от обычного теста Дики-Фуллера: они нужны, чтобы остатки оставались некоррелированными, иначе статистика теста будет смещена. Число лагов выбирают так, чтобы остатки очистились, но не раздувать модель лишними параметрами.
Как считается ADF-статистика
Коэффициенты ADF-регрессии оценивают обычным методом наименьших квадратов. Тестовая статистика - это t-отношение для коэффициента при :
где - оценка коэффициента, а - его стандартная ошибка. Логика простая: если значимо отрицателен, значит, ряд возвращается к среднему и единичного корня нет. Поэтому статистика всегда сравнивается с отрицательными критическими значениями, а гипотеза отвергается, когда ADF оказывается достаточно глубоко в отрицательной зоне.

Правило решения наглядно ложится на числовую ось. Слева от критического значения находится область отвержения: если наблюдаемая ADF-статистика попала в неё, единичный корень отвергаем и считаем ряд стационарным. Если же статистика правее критического значения (ближе к нулю), отвергнуть гипотезу не удаётся - данных не хватает, чтобы отличить ряд от случайного блуждания.
Критические значения MacKinnon
Здесь кроется главная тонкость теста. При ряд нестационарен, поэтому стандартная теория t-статистики не работает: распределение ADF-статистики при единичном корне несимметрично и смещено влево, его табулировал Дики-Фуллер, а уточнил MacKinnon. Поэтому ADF-статистику нельзя сравнивать с обычной таблицей Стьюдента - нужны специальные критические значения. Для спецификации с константой и большого числа наблюдений они примерно равны:
Конкретные числа зависят от спецификации (без константы, с константой, с константой и трендом) и от длины ряда, поэтому в отчётах ADF-теста критические значения всегда приводятся рядом со статистикой. В калькуляторе выше переключение уровня значимости меняет именно эту границу: чем строже уровень (1% против 10%), тем дальше влево должна уйти статистика, чтобы отвергнуть единичный корень.
Динамику решения удобно проследить на одной оси: пока коэффициент падает от единицы, ADF-статистика едет влево и в какой-то момент пересекает критическую черту.
Как читать вывод теста на практике
Сравнение статистики с критическим значением можно записать через p-value, которое выдают статистические пакеты (adfuller в Python, ur.df в R). Если p-value меньше выбранного уровня значимости, единичный корень отвергается и ряд стационарен. Если ряд оказался нестационарным, его обычно приводят к стационарности взятием разностей: . Часто одной разности достаточно - такой ряд называют интегрированным первого порядка, . После дифференцирования тест прогоняют заново и убеждаются, что единичный корень больше не обнаруживается. Этот же ход рассуждений лежит в основе моделей ARIMA, где буква I как раз отвечает за число взятых разностей. Полезно помнить, что тест проверяет именно нестационарность по причине единичного корня, а не нестационарность вообще: ряд с детерминированным трендом - отдельный случай, для которого в регрессию добавляют член .
Частые ошибки
- Перепутана нулевая гипотеза. В тесте Дики-Фуллера - это наличие единичного корня (ряд нестационарен), а не наоборот. Маленькое p-value означает стационарность, а не её отсутствие.
- Сравнение со Стьюдентом. ADF-статистику нельзя сверять с обычными критическими значениями t-распределения: при единичном корне распределение другое, нужны значения MacKinnon.
- Не та спецификация. Для ряда с явным трендом нужна спецификация с трендом, иначе тест систематически не отвергает единичный корень. Лишняя константа или тренд, наоборот, снижают мощность.
- Слишком мало или слишком много лагов. При недостатке лагов остатки автокоррелированы и статистика смещена, при избытке падает мощность теста. Число подбирают по критериям AIC или BIC.
- Вывод по одному тесту. ADF имеет низкую мощность при близком к единице, поэтому его результат полезно подкреплять тестом KPSS, у которого нулевая гипотеза обратная.
FAQ
Что означает, если расширенный тест Дики-Фуллера не отверг единичный корень? Это значит, что данных не хватило, чтобы отличить ряд от случайного блуждания: ряд считают нестационарным. Обычно берут первую разность и прогоняют тест снова. Важно, что неотвержение не доказывает наличие единичного корня, а лишь не опровергает его.
Чем расширенный тест Дики-Фуллера отличается от обычного? Расширенная версия добавляет в регрессию лаги разностей . Они нужны, чтобы убрать автокорреляцию остатков, которая в простом тесте Дики-Фуллера смещает статистику. На стационарных рядах с автокорреляцией расширенный вариант надёжнее, поэтому на практике используют именно его.
Как выбрать число лагов в ADF-тесте? Чаще всего по информационным критериям: перебирают значения и берут то, что минимизирует AIC или BIC, либо начинают с верхней границы и убирают незначимые лаги. Цель - добиться некоррелированных остатков минимальным числом параметров, чтобы не терять мощность теста.
Коротко
Расширенный тест Дики-Фуллера проверяет нулевую гипотезу о единичном корне в регрессии . Статистика считается как t-отношение и сравнивается с критическими значениями MacKinnon, а не с таблицей Стьюдента. Если статистика ниже критической, единичный корень отвергаем и ряд считаем стационарным; иначе ряд приводят к стационарности взятием разностей. Лаги разностей в расширенной версии нужны, чтобы остатки оставались некоррелированными, а число лагов подбирают по информационным критериям.
Читайте также

Тест Филлипса-Перрона: проверка единичного корня
Тест Филлипса-Перрона простыми словами: что такое единичный корень, как непараметрическая поправка убирает автокорреляцию, чем тест отличается от теста Дики-Фуллера и где ошибаются студенты.

Тест Грейнджера на причинность: как проверить связь рядов
Тест Грейнджера на причинность простыми словами: что значит, что один временной ряд по Грейнджеру причиняет другой, как строить лаги, читать F-статистику и p-value, какие условия нужны.

Модель GARCH волатильность: условная дисперсия ряда
Модель GARCH и волатильность: уравнение условной дисперсии, переход от ARCH к GARCH(1,1), условие стационарности, персистентность и прогноз волатильности.