Тест Филлипса-Перрона: проверка единичного корня

Тест Филлипса-Перрона (PP, Phillips-Perron) - это статистический критерий, который проверяет, есть ли у временного ряда единичный корень, то есть является ли ряд нестационарным. Он решает ту же задачу, что и тест Дики-Фуллера, но иначе борется с главной помехой - автокорреляцией остатков. Вместо того чтобы добавлять в регрессию лаги разностей, тест Филлипса-Перрона оставляет исходную регрессию простой, а саму статистику правит непараметрической поправкой, которая учитывает и автокорреляцию, и гетероскедастичность остатков. Ниже разберём, что такое единичный корень, как устроена эта поправка, чем тест отличается от расширенного теста Дики-Фуллера и почему его статистику сравнивают не с таблицей Стьюдента, а с критическими значениями MacKinnon. Чтобы сразу почувствовать связь между коэффициентом авторегрессии и выводом теста, покрутите калькулятор: он строит ряд, считает PP-статистику и показывает, по какую сторону критического значения она оказалась.
Что такое единичный корень
Простейшая модель временного ряда - авторегрессия первого порядка AR(1):
где - коэффициент авторегрессии, а - случайный шум. Поведение ряда целиком определяется значением . Если , ряд стационарен: любое отклонение со временем затухает, и ряд возвращается к своему среднему уровню. Если же , мы получаем случайное блуждание - у такого ряда единичный корень, отклонения не затухают, а накапливаются, и ряд медленно уплывает в сторону без всякой тенденции к возврату. Именно случай и проверяет тест: наличие единичного корня означает нестационарность, а на нестационарных рядах регрессии дают мнимые зависимости и расходящиеся прогнозы.
Как и в тесте Дики-Фуллера, удобно вычесть из обеих частей и обозначить . Тогда базовая регрессия записывается через разности:
где , а - константа. Нулевая гипотеза о единичном корне превращается в простое условие . Если , разности зависят только от шума - это случайное блуждание. Если же , ряд возвращается к среднему и стационарен.
Чем тест Филлипса-Перрона отличается от ADF
Главная проблема обоих тестов в том, что реальные остатки почти никогда не бывают чистым белым шумом: они автокоррелированы. Если это игнорировать, статистика теста смещается и вывод о стационарности становится ненадёжным. Два теста решают эту проблему принципиально по-разному.

Расширенный тест Дики-Фуллера идёт параметрическим путём: он добавляет в регрессию лагов разностей , чтобы те поглотили автокорреляцию, и только потом считает статистику по очищенным остаткам. Тест Филлипса-Перрона выбирает непараметрический путь: регрессия остаётся короткой, без лагов, а вся коррекция переносится на саму статистику - её домножают на поправочный множитель, который оценивает долгосрочную дисперсию остатков напрямую из данных. Грубо говоря, ADF чистит модель, а PP чистит результат.
У такого разделения труда есть практическое следствие. Тест Филлипса-Перрона не требует выбирать число лагов разностей и устойчив не только к автокорреляции, но и к гетероскедастичности остатков. За это приходится платить: на малых выборках и при сильной отрицательной автокорреляции PP-тест чаще ошибается, чем аккуратно настроенный ADF. Поэтому на практике их нередко применяют вместе и смотрят, согласуются ли выводы.
Как считается PP-статистика
Сначала оценивают ту же регрессию обычным методом наименьших квадратов и берут привычное t-отношение для коэффициента :
Если бы остатки были белым шумом, на этом можно было бы остановиться. Но они автокоррелированы, поэтому тест Филлипса-Перрона вводит две оценки дисперсии. Первая - обычная (краткосрочная) дисперсия остатков , которую даёт МНК. Вторая - долгосрочная дисперсия , она учитывает не только мгновенный разброс, но и то, как остатки коррелируют с собственным прошлым:
где - автоковариации остатков, а - убывающие веса (чаще всего ядро Бартлетта, тот же приём, что в оценке Ньюи-Уэста). Параметр задаёт ширину окна - сколько лагов автоковариации учитывать. Скорректированная PP-статистика получается из обычного t-отношения масштабированием на отношение этих двух дисперсий плюс поправка смещения:
Формула выглядит громоздко, но идея простая: если остатки автокоррелированы, отличается от , и поправка возвращает статистике правильный масштаб. Когда остатки уже близки к белому шуму, , и поправка почти ничего не меняет - PP-статистика совпадает с обычным тестом Дики-Фуллера.
Критические значения MacKinnon
Здесь кроется та же тонкость, что и в тесте Дики-Фуллера. При ряд нестационарен, поэтому стандартная теория t-статистики не работает: распределение статистики при единичном корне несимметрично и смещено влево. Поэтому PP-статистику нельзя сравнивать с обычной таблицей Стьюдента - нужны специальные критические значения, которые табулировал Дики-Фуллер и уточнил MacKinnon. Замечательно, что у теста Филлипса-Перрона критические значения те же самые, что у теста Дики-Фуллера: вся работа непараметрической поправки как раз в том и состоит, чтобы вернуть статистику к этому распределению. Для спецификации с константой и большого числа наблюдений они примерно равны:
Конкретные числа зависят от спецификации (без константы, с константой, с константой и трендом) и от длины ряда, поэтому в отчётах PP-теста критические значения всегда приводятся рядом со статистикой.

Правило решения наглядно ложится на числовую ось. Слева от критического значения находится область отвержения: если наблюдаемая PP-статистика попала в неё, единичный корень отвергаем и считаем ряд стационарным. Если же статистика правее критического значения (ближе к нулю), отвергнуть гипотезу не удаётся - данных не хватает, чтобы отличить ряд от случайного блуждания. В калькуляторе выше переключение уровня значимости сдвигает именно эту границу: чем строже уровень (1 % против 10 %), тем дальше влево должна уйти статистика, чтобы отвергнуть единичный корень.
Как читать вывод теста на практике
Сравнение статистики с критическим значением статистические пакеты обычно сворачивают в p-value (PhillipsPerron в Python-пакете arch, pp.test и ur.pp в R). Если p-value меньше выбранного уровня значимости, единичный корень отвергается и ряд стационарен. Если ряд оказался нестационарным, его приводят к стационарности взятием разностей: . Часто одной разности достаточно - такой ряд называют интегрированным первого порядка, . После дифференцирования тест прогоняют заново и убеждаются, что единичный корень больше не обнаруживается.
Полезно помнить, что тест проверяет именно нестационарность по причине единичного корня, а не нестационарность вообще: ряд с детерминированным трендом - отдельный случай, для которого в регрессию добавляют член . И ещё: и PP, и ADF имеют низкую мощность, когда близок к единице, поэтому вывод полезно подкреплять тестом KPSS, у которого нулевая гипотеза обратная - там утверждает стационарность.
Частые ошибки
- Перепутана нулевая гипотеза. В тесте Филлипса-Перрона - это наличие единичного корня (ряд нестационарен), а не наоборот. Маленькое p-value означает стационарность, а не её отсутствие.
- Сравнение со Стьюдентом. PP-статистику нельзя сверять с обычными критическими значениями t-распределения: при единичном корне распределение другое, нужны значения MacKinnon (те же, что у теста Дики-Фуллера).
- Думают, что лаги нужно подбирать как в ADF. В PP-тесте нет лагов разностей в регрессии - там настраивается ширина окна для долгосрочной дисперсии. Это разные параметры, и путать их не стоит.
- Не та спецификация. Для ряда с явным трендом нужна спецификация с трендом, иначе тест систематически не отвергает единичный корень. Лишняя константа или тренд, наоборот, снижают мощность.
- Вывод по одному тесту. При сильной отрицательной автокорреляции PP-тест склонен ошибочно отвергать , поэтому его результат полезно подкреплять ADF и KPSS.
FAQ
Чем тест Филлипса-Перрона отличается от расширенного теста Дики-Фуллера? Оба проверяют одну и ту же нулевую гипотезу о единичном корне и используют одни критические значения. Разница в том, как они борются с автокорреляцией остатков: ADF добавляет в регрессию лаги разностей (параметрический путь), а PP оставляет регрессию короткой и правит саму статистику непараметрической поправкой на долгосрочную дисперсию. PP не требует выбирать число лагов и устойчив к гетероскедастичности, но на малых выборках бывает менее надёжен.
Что означает, если тест Филлипса-Перрона не отверг единичный корень? Это значит, что данных не хватило, чтобы отличить ряд от случайного блуждания: ряд считают нестационарным. Обычно берут первую разность и прогоняют тест снова. Неотвержение не доказывает наличие единичного корня, а лишь не опровергает его.
Нужно ли выбирать число лагов в тесте Филлипса-Перрона? В самой регрессии лаги разностей не используются, поэтому привычного выбора , как в ADF, тут нет. Но есть параметр - ширина окна для оценки долгосрочной дисперсии . Его задают по эмпирическому правилу от длины ряда (например, ) или подбирают, проверяя устойчивость вывода.
Коротко
Тест Филлипса-Перрона проверяет нулевую гипотезу о единичном корне в регрессии . В отличие от расширенного теста Дики-Фуллера он не добавляет лаги разностей, а правит обычную t-статистику непараметрической поправкой: масштабирует её на отношение краткосрочной дисперсии к долгосрочной и убирает смещение. Скорректированную статистику сравнивают с теми же критическими значениями MacKinnon: если она ниже критической, единичный корень отвергаем и ряд считаем стационарным, иначе ряд приводят к стационарности взятием разностей. PP не требует выбирать число лагов и устойчив к гетероскедастичности, но на малых выборках его выводы полезно подкреплять тестами ADF и KPSS.
Читайте также

Расширенный тест Дики-Фуллера: проверка на единичный корень
Расширенный тест Дики-Фуллера простыми словами: что такое единичный корень, как строится ADF-регрессия, как считается статистика и сравнивается с критическими значениями, и где студенты ошибаются.

Тест Грейнджера на причинность: как проверить связь рядов
Тест Грейнджера на причинность простыми словами: что значит, что один временной ряд по Грейнджеру причиняет другой, как строить лаги, читать F-статистику и p-value, какие условия нужны.

Модель GARCH волатильность: условная дисперсия ряда
Модель GARCH и волатильность: уравнение условной дисперсии, переход от ARCH к GARCH(1,1), условие стационарности, персистентность и прогноз волатильности.