Сравнение двух коэффициентов корреляции: критерий Фишера
Допустим, в одной выборке связь между переменными оказалась сильнее, чем в другой: коэффициент корреляции против . Заманчиво сразу сказать, что связь в первой группе «реально» крепче. Но выборочный коэффициент корреляции - случайная величина: при повторе эксперимента он будет колебаться, и часть разницы между и может объясняться простой выборочной изменчивостью. Сравнение двух коэффициентов корреляции - это статистическая проверка гипотезы о том, отличаются ли они достоверно или различие случайно. Ключевая идея в том, что сами напрямую вычитать нельзя: их распределение скошено, поэтому каждый сначала переводят в z-преобразование Фишера. Покрутите калькулятор ниже, чтобы увидеть, как при одних и тех же значимость различия меняется с объёмом выборки.
Почему нельзя просто вычесть один r из другого
Коэффициент корреляции Пирсона ограничен отрезком от до , и чем ближе к границам, тем менее симметрично распределена его выборочная оценка. У около нуля разброс почти симметричен, а у оценка «упирается» в единицу и скашивается влево. Из-за этой неравномерности разность не имеет простого, удобного для проверки распределения: одинаковая на вид разница в области слабых и сильных связей означает разную «дистанцию» в терминах значимости.
Чтобы обойти эту проблему, Рональд Фишер предложил преобразование, которое выпрямляет шкалу. После него оценка ведёт себя почти как нормальная величина с дисперсией, зависящей только от объёма выборки, и тогда разность уже можно стандартизировать и сравнивать с нормальным распределением.
Z-преобразование Фишера
Преобразование Фишера переводит коэффициент корреляции в величину по формуле:
Главное свойство: для нормально распределённых данных оценка приближённо нормальна, а её дисперсия равна и не зависит от истинного значения корреляции. Именно это и делает удобной шкалой - на ней «ширина» разброса задаётся только числом наблюдений, а не самой величиной связи.
На анимации видно суть критерия: положения пиков (сами и ) не двигаются, а вот ширина каждой «горки» - стандартная ошибка - сжимается с ростом . Когда выборки маленькие, распределения широкие и сильно перекрываются: такую разницу легко получить случайно. Когда велик, горки узкие, перекрытие исчезает, и тот же разрыв оказывается достоверным.
Формула сравнения двух независимых коэффициентов
Если две корреляции получены на разных, не пересекающихся выборках (например, отдельно у мужчин и у женщин), коэффициенты независимы. Тогда стандартная ошибка разности складывается из дисперсий обеих оценок:
а тестовая статистика - это стандартизованная разность z-значений:
При справедливости нулевой гипотезы (истинные корреляции равны) величина подчиняется стандартному нормальному распределению. Поэтому различие значимо на уровне , если превышает критическое значение нормального распределения: для двустороннего критерия при это . Двусторонний уровень значимости считается как , где - функция стандартного нормального распределения. Эта же логика проверки гипотезы о равенстве двух характеристик лежит в основе и критерия Фишера для сравнения двух дисперсий, только там вместо сравниваются разбросы.

На этой схеме разность пиков измерена в единицах стандартной ошибки: , а , поэтому отношение даёт . Оно чуть больше , и при в каждой группе различие признаётся значимым - но запас невелик, и при меньших выборках того же различия уже не хватило бы.
Разбор типовой задачи
Сравним () и () на уровне . Сначала переводим оба коэффициента в z-шкалу:
Затем считаем стандартную ошибку разности и саму статистику:
Поскольку , нулевая гипотеза о равенстве корреляций отклоняется: . Вывод - связь в первой группе достоверно сильнее. Калькулятор выше собирает ровно эту цепочку и заодно показывает на втором графике, как с ростом статистика поднимается над порогом.
Полезно проверить чувствительность вывода к объёму выборки: если уменьшить обе выборки до , стандартная ошибка вырастет до , и тогда уже не дотягивает до порога. Различие в коэффициентах осталось прежним, но достоверным быть перестало - это наглядно показывает, почему вывод о значимости всегда нужно делать вместе с объёмом наблюдений, а не по одной только разнице .
Сравнение зависимых корреляций и со значением
Формула выше работает для независимых выборок. Если же оба коэффициента посчитаны на одной и той же выборке (например, корреляция переменной с и её же корреляция с ), коэффициенты зависимы, и нужно учитывать ещё и корреляцию между предикторами. Для такого случая применяют формулу Стайгера или критерий Уильямса - они включают третий коэффициент и дают более точную оценку.
Отдельный частый сценарий - проверить, отличается ли выборочный от заранее известного теоретического значения . Тогда сравнивают одно z-значение с константой: , где . Это уже одновыборочная задача, и вопрос «какой критерий мощнее при простой альтернативе» разбирается через лемму Неймана-Пирсона.
Частые ошибки
- Вычитают сами коэффициенты без преобразования. Разность нельзя напрямую делить на стандартную ошибку: распределение скошено. Сначала переводим оба в -Фишера.
- Используют формулу для независимых выборок там, где корреляции зависимы. Если оба получены на одной выборке, нужна формула Стайгера или Уильямса с учётом , иначе значимость завышается.
- Берут вместо . В дисперсии z-оценки знаменатель именно . Подстановка занижает стандартную ошибку и завышает .
- Путают односторонний и двусторонний критерий. Если гипотеза просто «корреляции различаются», критерий двусторонний и порог . Для «» порог меняется на .
- Делают вывод о причинности. Значимое различие корреляций говорит о силе связи, но не о том, что в одной группе одна переменная «влияет» сильнее.
FAQ
Какой критерий используется для сравнения двух коэффициентов корреляции? Для двух независимых коэффициентов - критерий Фишера на основе z-преобразования: каждый переводят в , считают и сравнивают с нормальным распределением. Для зависимых корреляций берут формулу Стайгера или Уильямса.
Что показывает z-преобразование Фишера? Оно выпрямляет шкалу коэффициента корреляции: после преобразования оценка почти нормальна, а её дисперсия равна и не зависит от величины связи. Это позволяет стандартизировать разность и проверять её значимость по нормальному распределению.
Почему различие корреляций может быть незначимым при заметной разнице r? Потому что значимость зависит не только от разности , но и от объёмов выборок. При малых стандартная ошибка велика, распределения оценок широки, и даже разрыв в по корреляции легко объясняется случайностью. С ростом та же разница становится значимой.
Коротко
Сравнение двух коэффициентов корреляции делают не вычитанием самих , а через z-преобразование Фишера , на котором оценка почти нормальна с дисперсией . Для двух независимых выборок считают и статистику , а различие признают значимым, когда превышает порог нормального распределения (для это ). Значимость растёт с объёмом выборки, а для зависимых корреляций нужна формула Стайгера или Уильямса.
Читайте также

Критерий Фишера: сравнение двух дисперсий
Критерий Фишера для сравнения двух дисперсий: как составить F-статистику, найти степени свободы и критическое значение, проверить гипотезу о равенстве разбросов и не ошибиться с числителем.

Значимость коэффициента корреляции: t-критерий Стьюдента
Как проверить статистическую значимость коэффициента корреляции Пирсона через t-критерий Стьюдента: формула, таблица, интерпретация p-значения, ошибки при малых выборках.

Частный F-критерий: значимость фактора в регрессии
Частный F-критерий проверяет значимость отдельного фактора или группы факторов в множественной регрессии. Формула, сравнение с t-критерием, пошаговый пример расчёта и типичные ошибки.