Частный коэффициент корреляции: расчёт и формула

Когда две переменные движутся вместе, это ещё не значит, что они влияют друг на друга напрямую. Часто за совместным движением стоит третий фактор, который тянет обе сразу. Частный коэффициент корреляции отвечает на вопрос: какова связь между и , если убрать влияние переменной ? Это рабочий инструмент эконометрики, который отделяет настоящую зависимость от мнимой. Ниже разберём формулу через парные коэффициенты, геометрический смысл через остатки регрессии, проверку значимости и типовой расчёт. Чтобы не считать вручную, ниже есть калькулятор: задайте три парных коэффициента и сразу увидите очищенную связь.
Что такое частный коэффициент корреляции
Частный (парциальный) коэффициент корреляции измеряет линейную связь между двумя переменными при фиксированном значении одной или нескольких других переменных. Обозначается обычно : связь между переменными 1 и 2 при исключённом влиянии переменной 3 (точка перед индексом исключаемой переменной - стандартная нотация).
Идея простая. Обычный (парный) коэффициент показывает совместное движение и как есть - со всеми посторонними влияниями. Частный коэффициент мысленно «замораживает» третий фактор и смотрит, что останется от связи. Если после исключения связь почти исчезает, исходная корреляция была во многом наведённой.
Классический пример из экономики: потребление мороженого и число утоплений в водоёмах коррелируют положительно. Но стоит зафиксировать температуру воздуха - связь обнуляется. Жара поднимает и то и другое; прямой зависимости нет. Частная корреляция - формальный способ это показать.
Формула через парные коэффициенты
Самый быстрый путь к расчёту - когда уже известны три парных коэффициента. Для трёх переменных частный коэффициент корреляции между 1 и 2 при исключённой 3 считается так:
Здесь - парная корреляция между интересующими переменными, и - корреляции каждой из них с исключаемой переменной. Числитель вычитает из исходной связи ту часть, которую можно объяснить через общий фактор (произведение ). Знаменатель нормирует результат, чтобы он, как и обычный коэффициент, лежал в диапазоне от до .
Формула симметрична: чтобы исключить другую переменную, просто переставьте индексы. Например, связь 1 и 3 при исключённой 2:

Если знаменатель близок к нулю (одна из переменных почти полностью объясняется исключаемой), коэффициент становится неустойчивым - это сигнал мультиколлинеарности, которую отдельно диагностируют через коэффициент инфляции дисперсии VIF.
Геометрический смысл: корреляция остатков
За формулой стоит наглядная картина. Частный коэффициент - это обычная корреляция между остатками двух регрессий: регрессии на и регрессии на .
Алгоритм такой. Сначала строим регрессию и берём остатки - то, что в не объяснено через . Потом строим регрессию и берём остатки . Корреляция между и и есть частный коэффициент. Мы буквально вычищаем из обеих переменных всё, что несёт в себе , и смотрим на связь очищенных частей.

Эта интерпретация важна для понимания регрессии: коэффициент при факторе в множественной модели отражает именно частную связь - вклад фактора при уже учтённых остальных. Подробнее о том, как факторы влияют друг на друга, - в материале про отбор факторов в множественной регрессии.
Расчёт по шагам: пример
Пусть мы изучаем зависимость объёма продаж () от расходов на рекламу () и хотим исключить влияние сезонности (). Известны парные коэффициенты:
- (продажи и реклама),
- (реклама и сезон),
- (продажи и сезон).
Подставляем в формулу. Числитель:
Знаменатель:
Итого:
Связь рекламы и продаж после очистки от сезонности упала с до . Часть исходной корреляции действительно объяснялась общим сезонным циклом, но значимая прямая связь сохранилась - реклама работает и сама по себе.
Проверка значимости
Полученное число - выборочная оценка. Нужно понять, отличается ли частная корреляция от нуля статистически значимо. Используют -критерий:
где - число наблюдений, - количество исключаемых переменных (для одной это ). Число степеней свободы - . Расчётное сравнивают с табличным значением распределения Стьюдента при выбранном уровне значимости (обычно ).
Если , частная связь значима: фиксация не убивает зависимость. Логика проверки та же, что для парного коэффициента, - отличается только число степеней свободы за счёт исключённых переменных.
Частная корреляция и множественная
Частный коэффициент не стоит путать с множественным. Множественный коэффициент корреляции измеряет совокупную связь одной переменной со всеми остальными сразу и всегда неотрицателен. Частный - связь двух конкретных переменных при фиксированных прочих, и может быть как положительным, так и отрицательным.
Эти величины связаны: через набор частных коэффициентов можно собрать множественный, и наоборот. Если интересует именно совокупная теснота, см. коэффициент множественной корреляции и его формулу. Для одной задачи часто считают оба: множественный показывает общую объяснённость, частные - вклад каждого фактора по отдельности.
Знак и величина: как читать результат
Интерпретация частного коэффициента такая же, как у обычного: ближе к - теснее линейная связь, ближе к 0 - слабее. Но смысл другой - это связь «при прочих равных».
Особенно показательны случаи, когда знак частного коэффициента отличается от знака парного. Это парадокс Симпсона в корреляционной форме: общая зависимость может быть положительной, а после фиксации скрытого фактора - отрицательной. Такой разворот знака - сильный сигнал, что третья переменная искажала картину и без её учёта выводы были бы ошибочными.
Величина частного коэффициента почти всегда меньше парного по модулю, если третья переменная действительно вносит вклад. Если же , значит ни на что не влияет - исходная связь была прямой.
Частые ошибки
- Путают индексы. В переменные до точки - те, между которыми ищем связь, после точки - исключаемые. Перестановка и даёт совершенно разные ответы.
- Считают частную корреляцию доказательством причинности. Она лишь очищает связь от одного учтённого фактора. Неучтённые скрытые переменные по-прежнему могут искажать результат - корреляция, даже частная, не равна причинности.
- Игнорируют значимость. Высокий коэффициент на малой выборке может оказаться статистически незначимым. Без -проверки число само по себе мало что говорит.
- Забывают про линейность. Как и парный коэффициент, частный ловит только линейную связь. Сильная нелинейная зависимость может дать при реально существующей связи.
- Применяют к мультиколлинеарным данным без оглядки. Когда или близки к 1, знаменатель формулы стремится к нулю и оценка становится крайне неустойчивой.
FAQ
Чем частный коэффициент отличается от парного? Парный коэффициент измеряет связь и как есть, со всеми посторонними влияниями. Частный убирает влияние переменной и показывает «чистую» связь при фиксированном . Если посторонних факторов нет, обе величины совпадают.
Может ли частный коэффициент быть больше парного? Да, хотя обычно он меньше по модулю. Если третья переменная подавляла связь (эффект супрессии), её исключение усиливает корреляцию - частный коэффициент оказывается выше парного. Это нормальная ситуация, а не ошибка расчёта.
Сколько переменных можно исключать одновременно? Любое число, если хватает наблюдений. Частный коэффициент второго порядка исключает сразу две переменные, его считают рекурсивно через коэффициенты первого порядка. На практике с ростом числа исключаемых переменных растёт требование к объёму выборки.
Коротко
Частный коэффициент корреляции измеряет линейную связь между двумя переменными при исключённом влиянии третьей. Базовая формула для трёх переменных - . Геометрически это корреляция остатков двух регрессий на исключаемую переменную. Результат лежит в диапазоне от до , проверяется -критерием с степенями свободы. Главное применение в эконометрике - отличать настоящую зависимость от мнимой, наведённой общим скрытым фактором, и оценивать вклад отдельного фактора при прочих равных.
Читайте также

Тест Бройша-Годфри: проверка остатков на автокорреляцию
Тест Бройша-Годфри на автокорреляцию остатков регрессии: LM-статистика n·R², выбор числа лагов, сравнение с хи-квадрат, отличие от Дарбина-Уотсона и интерпретация p-значения.

Частный F-критерий: значимость фактора в регрессии
Частный F-критерий проверяет значимость отдельного фактора или группы факторов в множественной регрессии. Формула, сравнение с t-критерием, пошаговый пример расчёта и типичные ошибки.

Доверительный интервал коэффициента регрессии: расчёт
Как рассчитать доверительный интервал коэффициента регрессии: формула через стандартную ошибку и критическое значение Стьюдента, пример вычисления и проверка значимости.