Значимость коэффициента корреляции: t-критерий Стьюдента

Обнаружить корреляцию между двумя переменными - только первый шаг. Важнее другое: убедиться, что найденная связь не случайна, а статистически значима. Именно для этого применяют t-критерий Стьюдента для коэффициента корреляции. Ниже разберём формулу, логику проверки и типичные ловушки, с которыми сталкиваются студенты при работе с малыми выборками.
Почему одного числа r недостаточно
Коэффициент корреляции Пирсона принимает значения от до . Кажется, чем ближе к единице, тем надёжнее вывод. Но это ловушка: при маленькой выборке может оказаться случайным совпадением, а при большой - статистически значимо.
Логика проверки такова. Нулевая гипотеза утверждает, что в генеральной совокупности (линейной связи нет). Критерий Стьюдента показывает, насколько маловероятно получить именно такое при случайной выборке из несвязанных переменных.
Теоретически: если и совместно нормально распределены и , то статистика имеет точное распределение Стьюдента с степенями свободы. Условие нормальности или большая выборка () обеспечивают корректность теста.
Значимость не равна силе. Значимый r = 0,1 в огромной выборке говорит лишь о том, что связь ненулевая - не обязательно о том, что она практически важна.
Формула t-статистики для корреляции
Для коэффициента корреляции Пирсона при объёме выборки наблюдаемая t-статистика вычисляется по формуле:
Полученное значение сравнивают с критическим из таблицы распределения Стьюдента, где - уровень значимости (обычно 0,05 или 0,01), а степени свободы .
Чем больше , тем сильнее данные противоречат . Если , корреляция признаётся значимой.

Степени свободы: почему n - 2
При проверке корреляции теряются две степени свободы: по одной на каждую из двух оцениваемых переменных. Если , то . Критическое значение , тогда как при уже .
Именно поэтому при малой выборке требования к величине для получения значимости гораздо строже. При нужен ; при достаточно .
Интуитивное объяснение: если в выборке всего две точки (), через них всегда проходит прямая с - это не говорит ни о чём. Каждая дополнительная точка уменьшает «везение»; при достаточно большом даже слабая корреляция перестаёт укладываться в диапазон случайного разброса.
Двусторонний и односторонний критерий
По умолчанию применяют двусторонний критерий: проверяют, что , не уточняя знак. Если теория заранее предсказывает направление связи (например, рост доходов точно положительно связан с потреблением), допустим односторонний критерий - он строже требует обоснования, но имеет бо́льшую мощность при правильном знаке.
В большинстве учебных и прикладных задач по эконометрике используют двусторонний вариант. При выборе одностороннего критерия важно обосновать направление заранее - до сбора данных. Выбор более выгодного направления уже после просмотра данных искусственно занижает p-значение и делает результат недостоверным.
p-значение и его интерпретация
Программные пакеты (R, SPSS, Python) автоматически выводят p-значение - вероятность получить не меньше наблюдаемого при истинной .
- - корреляция значима на уровне 5%;
- - значима на уровне 1%;
- - нет оснований отвергнуть .
Обратите внимание: p-значение не показывает вероятность того, что истинна. Это распространённое заблуждение. p описывает данные при условии нулевой гипотезы, а не вероятность самой гипотезы.

Пример расчёта вручную
Пусть по 15 наблюдениям получен . Подставим в формулу:
При критическое значение . Так как , корреляция значима на уровне 5%. Более того, - и это пороговое значение тоже превышено, то есть корреляция значима и на уровне 1%.
Схожий подход применяется при сравнении двух коэффициентов корреляции, когда нужно выяснить, различаются ли в двух группах.
Таблица минимального |r| для значимости при α = 0,05
Удобный ориентир на практике:
| 5 | 3 | 0,878 |
| 10 | 8 | 0,632 |
| 20 | 18 | 0,444 |
| 30 | 28 | 0,361 |
| 50 | 48 | 0,279 |
| 100 | 98 | 0,197 |
Эти пороговые значения получены непосредственно из формулы t-статистики при подстановке критического .

Связь с t-критерием в регрессии
В линейной парной регрессии коэффициент наклона проверяется тем же t-тестом:
где - стандартная ошибка коэффициента. Оказывается, для парной регрессии это в точности эквивалентно t-критерию для : оба критерия проверяют одну и ту же нулевую гипотезу. Числовые значения t-статистики совпадут: неважно, вычислять ли её через или через .
Это следствие того, что для двух переменных , а F-критерий для всей регрессии и t-критерий для единственного предиктора тоже эквивалентны: . Подробнее о расчёте ошибок коэффициентов - в материале про доверительный интервал коэффициента регрессии.
В множественной регрессии ситуация принципиально иная: t-критерий для каждого коэффициента проверяет его значимость при фиксированных остальных. Там нет простой связи с попарными коэффициентами корреляции. Предиктор может быть высоко коррелирован с , но в присутствии другого предиктора оказаться незначимым из-за автокорреляции остатков или мультиколлинеарности.
Частые ошибки
- «Чем больше |r|, тем он значим». Не всегда: при даже может оказаться незначимым (, критическое при равно ).
- «Незначимая корреляция означает отсутствие связи». Нет: связь может быть нелинейной, а t-тест проверяет только линейную.
- «p-значение - вероятность нулевой гипотезы». Нет. p - условная вероятность данных при .
- «Двусторонний и односторонний критерий дают одно и то же». Нет: p односторонний = p двустороннего / 2, поэтому путаница приводит к ошибочному выводу о значимости.
- «При больших n всё значимо, значит результат ценный». Статистическая значимость при не означает практической значимости - может быть значимым, но бессодержательным.
FAQ
Как найти p-значение по t-статистике и df вручную?
Использовать таблицы критических значений t-распределения или онлайн-калькуляторы. В Excel функция =T.DIST.2T(t;df) возвращает двустороннее p-значение напрямую.
Применим ли этот t-тест для ранговых коэффициентов (Спирмен, Кендалл)? Для коэффициента Спирмена применяется та же формула приближённо, и это допустимо при . Для точных результатов используют специальные таблицы критических значений для рангового коэффициента корреляции Спирмена.
Что делать, если выборка маленькая (n < 10)? При t-приближение менее надёжно. Рекомендуют либо увеличить выборку, либо использовать точные таблицы критических значений (таблицы Фишера-Йейтса), либо применять перестановочные тесты.
Коротко
Значимость коэффициента корреляции Пирсона проверяется t-критерием с : вычисляется , и если , корреляция признаётся статистически значимой. При этом значимость зависит не только от , но и от объёма выборки: чем меньше , тем выше порог для . Ошибочно отождествлять статистическую значимость с практической важностью и p-значение с вероятностью нулевой гипотезы.
Читайте также

Частный F-критерий: значимость фактора в регрессии
Частный F-критерий проверяет значимость отдельного фактора или группы факторов в множественной регрессии. Формула, сравнение с t-критерием, пошаговый пример расчёта и типичные ошибки.

Сравнение двух коэффициентов корреляции: критерий Фишера
Как сравнить два коэффициента корреляции: z-преобразование Фишера, формула Z-статистики через объёмы выборок, расчёт p-value и проверка значимости различия независимых и зависимых r.

Агрегатный индекс цен Ласпейреса: формула и расчёт
Агрегатный индекс цен Ласпейреса: формула с весами базисного периода, пошаговый расчёт на числовом примере, сравнение с Пааше и Фишером, применение в ИПЦ и дефляторе ВВП.