Частный F-критерий: значимость фактора в регрессии

Множественная регрессия включает несколько объясняющих переменных, и возникает закономерный вопрос: действительно ли каждый фактор улучшает модель, или его можно исключить без потери качества? Общий F-критерий проверяет всю модель целиком, а частный F-критерий прицельно тестирует значимость одного регрессора или группы регрессоров. Это один из ключевых инструментов спецификации модели - проверьте свою задачу с помощью инструмента ниже.
Что такое частный F-критерий
Частный F-критерий (partial F-test) - это тест для сравнения двух вложенных регрессионных моделей: полной (unrestricted) и ограниченной (restricted). Ограниченная модель получается из полной исключением одного или нескольких регрессоров, то есть наложением ограничений вида .
Формально проверяется гипотеза:
против альтернативы, что хотя бы один из коэффициентов не равен нулю. Если верна, исключённые переменные не несут информации сверх той, что уже учтена другими регрессорами.
Логика теста опирается на сравнение сумм квадратов остатков: если включение группы переменных существенно снижает RSS, то эти переменные значимы.

Формула частного F-критерия
Обозначим:
- - остаточная сумма квадратов полной модели (unrestricted)
- - остаточная сумма квадратов ограниченной модели (restricted)
- - число проверяемых ограничений (количество исключённых переменных)
- - число регрессоров в полной модели (без константы)
- - число наблюдений
Тогда частная F-статистика:
Числитель показывает среднее прирощение RSS при исключении переменных; знаменатель - несмещённую оценку дисперсии ошибки в полной модели .
При истинности статистика следует F-распределению с и степенями свободы. Критическое значение находят по таблице F-распределения при выбранном уровне значимости .
Правило решения: если , гипотеза отвергается - проверяемые факторы совместно значимы.
Связь с коэффициентами детерминации
Когда во всех моделях одинаковое число наблюдений (что всегда выполнено при вложенности), формулу частного F-критерия можно переписать через :
Это эквивалентная запись, удобная, если в условии задачи даны коэффициенты детерминации, а не суммы квадратов. Поскольку и одинакова для обеих моделей (зависимая переменная одна и та же), числители и знаменатели пересчитываются через .
Пример: пусть , (полная), , (исключили один фактор, ).
При критическое значение . Так как , фактор значим.
Частный F-критерий против t-критерия
Для одного регрессора () частная F-статистика связана с t-статистикой соотношением . Оба теста дают одинаковый вывод, и при выбор между ними - дело вкуса: t-критерий удобнее, потому что допускает одностороннюю альтернативу ( или ).
Принципиальное преимущество частного F-критерия возникает при : он тестирует группу ограничений одновременно. Последовательные t-тесты для каждого коэффициента в отдельности накапливают ошибку первого рода: если каждый тест проводить на уровне 5%, то при переменных вероятность хотя бы одного ложного отклонения значительно превышает 5%. Частный F-критерий контролирует совместную ошибку.
Подробнее о роли обеих процедур рассказано в материалах по эконометрическому анализу.
Пошаговая процедура расчёта
- Оценить полную модель и записать (или ) и степени свободы .
- Оценить ограниченную модель - исключить проверяемых переменных, записать .
- Вычислить F-статистику по формуле выше.
- Найти критическое значение из таблицы F-распределения или через функцию
=F.ОБР.ПХ(alpha; q; n-k-1)в Excel. - Сравнить и : если , группа переменных совместно значима на уровне .
Для проверки точечного ограничения вида (не обязательно равных нулю) нужно преобразовать модель к стандартному виду и применить ту же процедуру к преобразованной ограниченной модели.

Интерпретация результата
Отклонение означает, что исключённые переменные совместно объясняют значимую долю вариации сверх вклада оставшихся регрессоров. Это не означает, что каждая из них значима по отдельности: одна может быть высокозначимой, остальные - нет, но суммарный вклад группы проходит порог.
Напротив, не отклонение (низкое ) говорит о том, что включение данных переменных не улучшает модель значимо. Принцип бережливости (Occam's razor) предписывает исключить их из спецификации. Следует, однако, помнить, что при мультиколлинеарности t-критерии и частный F-критерий могут давать противоречивые результаты: частный F-тест для целой группы мультиколлинеарных переменных нередко отклоняет , тогда как каждый t-тест по отдельности - нет.
Всегда указывайте в решении число степеней свободы числителя q и знаменателя n-k-1. Без этих чисел критическое значение определить невозможно, и вывод будет неполным.
Применение в спецификации модели
Частный F-критерий используется в нескольких сценариях:
Проверка блока переменных. В макроэкономической регрессии ВВП включаются переменные денежной политики: денежная масса, процентная ставка, обменный курс. Частный F-тест проверяет, значим ли этот блок в целом, прежде чем углубляться в отдельные коэффициенты.
Сравнение линейной и полиномиальной спецификации. Полная модель содержит , , ; ограниченная - только . Частный F-тест для ограничений определяет, нужны ли нелинейные члены.
Тест структурных изменений (тест Чоу). Данные делятся на два периода, оцениваются раздельные и совместная регрессии. Разность RSS даёт F-статистику для гипотезы о стабильности коэффициентов - это тоже частный F-критерий в общей форме.
Исключение лаговых переменных (тест Грейнджера). В модели авторегрессии проверяется, улучшает ли добавление лагов переменной прогноз . Нулевая гипотеза - коэффициенты при всех лагах равны нулю, что снова сводится к частному F-тесту.
Частые ошибки
- Перепутать и . В знаменателе дроби всегда (от полной модели), в числителе - (число ограничений, а не регрессоров в ограниченной модели). Ошибка в степенях свободы меняет критическое значение и вывод.
- Использовать разные выборки. Полная и ограниченная модели должны оцениваться на идентичных наблюдениях. Если при добавлении переменной с пропусками уменьшается, RSS становятся несопоставимыми.
- Сравнивать напрямую без F-теста. не убывает при добавлении регрессоров по определению, поэтому полная модель всегда имеет . Значимость прироста должна подтверждаться именно F-тестом.
- Не проверять вложенность. Частный F-критерий применим только к вложенным (nested) моделям, где ограниченная получена из полной. Для невложенных моделей нужны информационные критерии (AIC, BIC) или специальные тесты (тест Дэвидсона-Маккиннона).
- Игнорировать степени свободы при малых . При распределение F смещается влево, критические значения существенно выше табличных для больших выборок. Выводы в таких случаях особенно чувствительны к спецификации.
FAQ
Чем частный F-критерий отличается от общего? Общий F-критерий проверяет, значима ли регрессия в целом: . Частный F-критерий - подмножество этой задачи: проверяет, вносит ли конкретная группа из переменных значимый дополнительный вклад при уже включённых остальных регрессорах.
Как рассчитать , если программа выдаёт только ? Из определения следует . TSS одинакова для обеих моделей: . Вычислив TSS из данных или из и , найдите .
Что делать, если F-критерий не отвергает , но теория требует включить переменную? Содержательная теория имеет приоритет над механическим статистическим тестом при малых выборках. Если переменная теоретически обоснована, а критерий её не поддерживает из-за мультиколлинеарности или малого , переменную оставляют с пометкой об ограничениях данных. Статистическая незначимость не равна экономической незначимости.
Коротко
Частный F-критерий сравнивает полную и ограниченную регрессию по разности RSS, нормированной на дисперсию ошибки. Статистика имеет F-распределение с и степенями свободы. Для одного фактора он эквивалентен квадрату t-критерия, но при тестирует совместную значимость группы переменных без накопления ошибки первого рода. Главные ловушки - перепутать степени свободы, сравнивать модели на разных выборках и забыть проверить вложенность.
Читайте также

Множественная регрессия: расчёт коэффициентов методом МНК
Расчёт коэффициентов множественной регрессии: нормальная система уравнений, матричная формула b = (XтX)⁻¹Xтy, пример с двумя факторами, R² и интерпретация наклонов.

Нормальные уравнения МНК: множественная регрессия пошагово
Как вывести и решить нормальные уравнения МНК для множественной регрессии: система уравнений, матричная запись, пример расчёта с двумя факторами и проверка.

Скорректированный коэффициент детерминации: формула R²_adj
Скорректированный коэффициент детерминации: формула R²_adj через R, число факторов k и объём выборки n, зачем нужен штраф за факторы, расчёт и когда значение становится отрицательным.