EssayAI
Блог
Блог
Математика и алгоритмы

Частный F-критерий: значимость фактора в регрессии

17 июня 2026Время чтения: 7 минут
#частный F-критерий#значимость фактора#множественная регрессия#эконометрика#проверка гипотез
Частный F-критерий: значимость фактора в регрессии

Множественная регрессия включает несколько объясняющих переменных, и возникает закономерный вопрос: действительно ли каждый фактор улучшает модель, или его можно исключить без потери качества? Общий F-критерий проверяет всю модель целиком, а частный F-критерий прицельно тестирует значимость одного регрессора или группы регрессоров. Это один из ключевых инструментов спецификации модели - проверьте свою задачу с помощью инструмента ниже.

Что такое частный F-критерий

Частный F-критерий (partial F-test) - это тест для сравнения двух вложенных регрессионных моделей: полной (unrestricted) и ограниченной (restricted). Ограниченная модель получается из полной исключением одного или нескольких регрессоров, то есть наложением ограничений вида βj=0\beta_j = 0.

Формально проверяется гипотеза:

H0:βj1=βj2==βjq=0H_0:\, \beta_{j_1} = \beta_{j_2} = \dots = \beta_{j_q} = 0

против альтернативы, что хотя бы один из qq коэффициентов не равен нулю. Если H0H_0 верна, исключённые переменные не несут информации сверх той, что уже учтена другими регрессорами.

Логика теста опирается на сравнение сумм квадратов остатков: если включение группы переменных существенно снижает RSS, то эти переменные значимы.

Полная и ограниченная регрессия: разность RSS как основа частного F-критерия
Полная и ограниченная регрессия: разность RSS как основа частного F-критерия

Формула частного F-критерия

Обозначим:

  • RSSURRSS_{UR} - остаточная сумма квадратов полной модели (unrestricted)
  • RSSRRSS_R - остаточная сумма квадратов ограниченной модели (restricted)
  • qq - число проверяемых ограничений (количество исключённых переменных)
  • kk - число регрессоров в полной модели (без константы)
  • nn - число наблюдений

Тогда частная F-статистика:

F=(RSSRRSSUR)/qRSSUR/(nk1)F = \frac{(RSS_R - RSS_{UR})/q}{RSS_{UR}/(n - k - 1)}

Числитель показывает среднее прирощение RSS при исключении qq переменных; знаменатель - несмещённую оценку дисперсии ошибки в полной модели σ^2=RSSUR/(nk1)\hat{\sigma}^2 = RSS_{UR}/(n-k-1).

При истинности H0H_0 статистика FF следует F-распределению с qq и (nk1)(n-k-1) степенями свободы. Критическое значение Fкр(q,nk1)F_{\text{кр}}(q,\, n-k-1) находят по таблице F-распределения при выбранном уровне значимости α\alpha.

Правило решения: если F>FкрF > F_{\text{кр}}, гипотеза H0H_0 отвергается - проверяемые факторы совместно значимы.

Связь с коэффициентами детерминации

Когда во всех моделях одинаковое число наблюдений (что всегда выполнено при вложенности), формулу частного F-критерия можно переписать через R2R^2:

F=(RUR2RR2)/q(1RUR2)/(nk1)F = \frac{(R^2_{UR} - R^2_R)/q}{(1 - R^2_{UR})/(n - k - 1)}

Это эквивалентная запись, удобная, если в условии задачи даны коэффициенты детерминации, а не суммы квадратов. Поскольку R2=1RSS/TSSR^2 = 1 - RSS/TSS и TSSTSS одинакова для обеих моделей (зависимая переменная одна и та же), числители и знаменатели пересчитываются через TSSTSS.

Пример: пусть n=50n = 50, k=3k = 3 (полная), RUR2=0,82R^2_{UR} = 0{,}82, RR2=0,75R^2_R = 0{,}75 (исключили один фактор, q=1q = 1).

F=(0,820,75)/1(10,82)/(5031)=0,070,18/46=0,070,0039117,9F = \frac{(0{,}82 - 0{,}75)/1}{(1 - 0{,}82)/(50 - 3 - 1)} = \frac{0{,}07}{0{,}18/46} = \frac{0{,}07}{0{,}00391} \approx 17{,}9

При α=0,05\alpha = 0{,}05 критическое значение F(1,46)4,05F(1,\, 46) \approx 4{,}05. Так как 17,9>4,0517{,}9 > 4{,}05, фактор значим.

Частный F-критерий против t-критерия

Для одного регрессора (q=1q = 1) частная F-статистика связана с t-статистикой соотношением F=t2F = t^2. Оба теста дают одинаковый вывод, и при q=1q = 1 выбор между ними - дело вкуса: t-критерий удобнее, потому что допускает одностороннюю альтернативу (βj>0\beta_j > 0 или βj<0\beta_j < 0).

Принципиальное преимущество частного F-критерия возникает при q2q \geq 2: он тестирует группу ограничений одновременно. Последовательные t-тесты для каждого коэффициента в отдельности накапливают ошибку первого рода: если каждый тест проводить на уровне 5%, то при q=5q = 5 переменных вероятность хотя бы одного ложного отклонения H0H_0 значительно превышает 5%. Частный F-критерий контролирует совместную ошибку.

Подробнее о роли обеих процедур рассказано в материалах по эконометрическому анализу.

Пошаговая процедура расчёта

  1. Оценить полную модель и записать RSSURRSS_{UR} (или RUR2R^2_{UR}) и степени свободы nk1n-k-1.
  2. Оценить ограниченную модель - исключить qq проверяемых переменных, записать RSSRRSS_R.
  3. Вычислить F-статистику по формуле выше.
  4. Найти критическое значение Fкр(α;q,nk1)F_{\text{кр}}(\alpha;\, q,\, n-k-1) из таблицы F-распределения или через функцию =F.ОБР.ПХ(alpha; q; n-k-1) в Excel.
  5. Сравнить FF и FкрF_{\text{кр}}: если F>FкрF > F_{\text{кр}}, группа переменных совместно значима на уровне α\alpha.

Для проверки точечного ограничения вида β2=β3\beta_2 = \beta_3 (не обязательно равных нулю) нужно преобразовать модель к стандартному виду и применить ту же процедуру к преобразованной ограниченной модели.

Распределение F-статистики с критической областью для принятия решения
Распределение F-статистики с критической областью для принятия решения

Интерпретация результата

Отклонение H0H_0 означает, что исключённые переменные совместно объясняют значимую долю вариации yy сверх вклада оставшихся регрессоров. Это не означает, что каждая из них значима по отдельности: одна может быть высокозначимой, остальные - нет, но суммарный вклад группы проходит порог.

Напротив, не отклонение H0H_0 (низкое FF) говорит о том, что включение данных переменных не улучшает модель значимо. Принцип бережливости (Occam's razor) предписывает исключить их из спецификации. Следует, однако, помнить, что при мультиколлинеарности t-критерии и частный F-критерий могут давать противоречивые результаты: частный F-тест для целой группы мультиколлинеарных переменных нередко отклоняет H0H_0, тогда как каждый t-тест по отдельности - нет.

Всегда указывайте в решении число степеней свободы числителя q и знаменателя n-k-1. Без этих чисел критическое значение определить невозможно, и вывод будет неполным.

Применение в спецификации модели

Частный F-критерий используется в нескольких сценариях:

Проверка блока переменных. В макроэкономической регрессии ВВП включаются переменные денежной политики: денежная масса, процентная ставка, обменный курс. Частный F-тест проверяет, значим ли этот блок в целом, прежде чем углубляться в отдельные коэффициенты.

Сравнение линейной и полиномиальной спецификации. Полная модель содержит xx, x2x^2, x3x^3; ограниченная - только xx. Частный F-тест для q=2q = 2 ограничений определяет, нужны ли нелинейные члены.

Тест структурных изменений (тест Чоу). Данные делятся на два периода, оцениваются раздельные и совместная регрессии. Разность RSS даёт F-статистику для гипотезы о стабильности коэффициентов - это тоже частный F-критерий в общей форме.

Исключение лаговых переменных (тест Грейнджера). В модели авторегрессии проверяется, улучшает ли добавление лагов переменной zz прогноз yy. Нулевая гипотеза - коэффициенты при всех лагах zz равны нулю, что снова сводится к частному F-тесту.

Частые ошибки

  • Перепутать qq и kk. В знаменателе дроби всегда nk1n-k-1 (от полной модели), в числителе - qq (число ограничений, а не регрессоров в ограниченной модели). Ошибка в степенях свободы меняет критическое значение и вывод.
  • Использовать разные выборки. Полная и ограниченная модели должны оцениваться на идентичных наблюдениях. Если при добавлении переменной с пропусками nn уменьшается, RSS становятся несопоставимыми.
  • Сравнивать R2R^2 напрямую без F-теста. R2R^2 не убывает при добавлении регрессоров по определению, поэтому полная модель всегда имеет R2RR2R^2 \geq R^2_R. Значимость прироста должна подтверждаться именно F-тестом.
  • Не проверять вложенность. Частный F-критерий применим только к вложенным (nested) моделям, где ограниченная получена из полной. Для невложенных моделей нужны информационные критерии (AIC, BIC) или специальные тесты (тест Дэвидсона-Маккиннона).
  • Игнорировать степени свободы при малых nn. При nk1<20n-k-1 < 20 распределение F смещается влево, критические значения существенно выше табличных для больших выборок. Выводы в таких случаях особенно чувствительны к спецификации.

FAQ

Чем частный F-критерий отличается от общего? Общий F-критерий проверяет, значима ли регрессия в целом: H0:β1=β2==βk=0H_0: \beta_1 = \beta_2 = \dots = \beta_k = 0. Частный F-критерий - подмножество этой задачи: проверяет, вносит ли конкретная группа из qq переменных значимый дополнительный вклад при уже включённых остальных kqk-q регрессорах.

Как рассчитать RSSRRSS_R, если программа выдаёт только R2R^2? Из определения R2=1RSS/TSSR^2 = 1 - RSS/TSS следует RSS=TSS(1R2)RSS = TSS \cdot (1 - R^2). TSS одинакова для обеих моделей: TSS=(yiyˉ)2TSS = \sum(y_i - \bar{y})^2. Вычислив TSS из данных или из RSSURRSS_{UR} и RUR2R^2_{UR}, найдите RSSR=TSS(1RR2)RSS_R = TSS \cdot (1 - R^2_R).

Что делать, если F-критерий не отвергает H0H_0, но теория требует включить переменную? Содержательная теория имеет приоритет над механическим статистическим тестом при малых выборках. Если переменная теоретически обоснована, а критерий её не поддерживает из-за мультиколлинеарности или малого nn, переменную оставляют с пометкой об ограничениях данных. Статистическая незначимость не равна экономической незначимости.

Коротко

Частный F-критерий сравнивает полную и ограниченную регрессию по разности RSS, нормированной на дисперсию ошибки. Статистика F=(RSSRRSSUR)/q÷RSSUR/(nk1)F = (RSS_R - RSS_{UR})/q \div RSS_{UR}/(n-k-1) имеет F-распределение с qq и nk1n-k-1 степенями свободы. Для одного фактора он эквивалентен квадрату t-критерия, но при q2q \geq 2 тестирует совместную значимость группы переменных без накопления ошибки первого рода. Главные ловушки - перепутать степени свободы, сравнивать модели на разных выборках и забыть проверить вложенность.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также