Сравнение двух коэффициентов корреляции: критерий Фишера

11 июня 2026Время чтения: 8 минут

#коэффициент корреляции#критерий фишера#z-преобразование#проверка гипотез#значимость различия

Допустим, в одной выборке связь между переменными оказалась сильнее, чем в другой: коэффициент корреляции $r_1 = 0{,}6$ против $r_2 = 0{,}3$ . Заманчиво сразу сказать, что связь в первой группе «реально» крепче. Но выборочный коэффициент корреляции - случайная величина: при повторе эксперимента он будет колебаться, и часть разницы между $r_1$ и $r_2$ может объясняться простой выборочной изменчивостью. Сравнение двух коэффициентов корреляции - это статистическая проверка гипотезы о том, отличаются ли они достоверно или различие случайно. Ключевая идея в том, что сами $r$ напрямую вычитать нельзя: их распределение скошено, поэтому каждый $r$ сначала переводят в z-преобразование Фишера. Покрутите калькулятор ниже, чтобы увидеть, как при одних и тех же $r$ значимость различия меняется с объёмом выборки.

Почему нельзя просто вычесть один r из другого

Коэффициент корреляции Пирсона ограничен отрезком от $-1$ до $1$ , и чем ближе к границам, тем менее симметрично распределена его выборочная оценка. У $r$ около нуля разброс почти симметричен, а у $r = 0{,}9$ оценка «упирается» в единицу и скашивается влево. Из-за этой неравномерности разность $r_1 - r_2$ не имеет простого, удобного для проверки распределения: одинаковая на вид разница в области слабых и сильных связей означает разную «дистанцию» в терминах значимости.

Чтобы обойти эту проблему, Рональд Фишер предложил преобразование, которое выпрямляет шкалу. После него оценка ведёт себя почти как нормальная величина с дисперсией, зависящей только от объёма выборки, и тогда разность уже можно стандартизировать и сравнивать с нормальным распределением.

Z-преобразование Фишера

Преобразование Фишера переводит коэффициент корреляции $r$ в величину $z$ по формуле:

$z = \frac{1}{2} \ln \frac{1 + r}{1 - r} = \operatorname{arctanh} r.$

Главное свойство: для нормально распределённых данных оценка $z$ приближённо нормальна, а её дисперсия равна $\dfrac{1}{n - 3}$ и не зависит от истинного значения корреляции. Именно это и делает $z$ удобной шкалой - на ней «ширина» разброса задаётся только числом наблюдений, а не самой величиной связи.

Два независимых коэффициента (r = 0,3 и r = 0,6) на шкале z-Фишера. При фиксированных корреляциях растёт объём выборки n: распределения оценок сужаются, разрыв между пиками в единицах стандартной ошибки увеличивается, и вердикт переключается с «различие не значимо» на «значимо»

На анимации видно суть критерия: положения пиков (сами $z_1$ и $z_2$ ) не двигаются, а вот ширина каждой «горки» - стандартная ошибка - сжимается с ростом $n$ . Когда выборки маленькие, распределения широкие и сильно перекрываются: такую разницу легко получить случайно. Когда $n$ велик, горки узкие, перекрытие исчезает, и тот же разрыв $z_1 - z_2$ оказывается достоверным.

Формула сравнения двух независимых коэффициентов

Если две корреляции получены на разных, не пересекающихся выборках (например, отдельно у мужчин и у женщин), коэффициенты независимы. Тогда стандартная ошибка разности $z_1 - z_2$ складывается из дисперсий обеих оценок:

$SE = \sqrt{\frac{1}{n_1 - 3} + \frac{1}{n_2 - 3}},$

а тестовая статистика - это стандартизованная разность z-значений:

$Z = \frac{z_1 - z_2}{SE}.$

При справедливости нулевой гипотезы (истинные корреляции равны) величина $Z$ подчиняется стандартному нормальному распределению. Поэтому различие значимо на уровне $\alpha$ , если $|Z|$ превышает критическое значение нормального распределения: для двустороннего критерия при $\alpha = 0{,}05$ это $1{,}96$ . Двусторонний уровень значимости считается как $p = 2\bigl(1 - \Phi(|Z|)\bigr)$ , где $\Phi$ - функция стандартного нормального распределения. Эта же логика проверки гипотезы о равенстве двух характеристик лежит в основе и критерия Фишера для сравнения двух дисперсий, только там вместо $z$ сравниваются разбросы.

Две оценки z-Фишера для r = 0,6 и r = 0,3 при n = 60 в каждой группе: скобка измеряет разность z1 - z2, равную примерно двум стандартным ошибкам, поэтому |Z| = 2,05 превышает порог 1,96

На этой схеме разность пиков измерена в единицах стандартной ошибки: $z_1 - z_2 \approx 0{,}38$ , а $SE \approx 0{,}19$ , поэтому отношение даёт $Z \approx 2{,}05$ . Оно чуть больше $1{,}96$ , и при $n = 60$ в каждой группе различие признаётся значимым - но запас невелик, и при меньших выборках того же различия уже не хватило бы.

Разбор типовой задачи

Сравним $r_1 = 0{,}6$ ( $n_1 = 60$ ) и $r_2 = 0{,}3$ ( $n_2 = 60$ ) на уровне $\alpha = 0{,}05$ . Сначала переводим оба коэффициента в z-шкалу:

$z_1 = \operatorname{arctanh} 0{,}6 = 0{,}693, \qquad z_2 = \operatorname{arctanh} 0{,}3 = 0{,}310.$

Затем считаем стандартную ошибку разности и саму статистику:

$SE = \sqrt{\frac{1}{57} + \frac{1}{57}} = 0{,}187, \qquad Z = \frac{0{,}693 - 0{,}310}{0{,}187} = 2{,}05.$

Поскольку $|Z| = 2{,}05 > 1{,}96$ , нулевая гипотеза о равенстве корреляций отклоняется: $p \approx 0{,}04 < 0{,}05$ . Вывод - связь в первой группе достоверно сильнее. Калькулятор выше собирает ровно эту цепочку и заодно показывает на втором графике, как с ростом $n$ статистика $|Z|$ поднимается над порогом.

Полезно проверить чувствительность вывода к объёму выборки: если уменьшить обе выборки до $n = 30$ , стандартная ошибка вырастет до $0{,}272$ , и тогда $Z = 0{,}383 / 0{,}272 = 1{,}41$ уже не дотягивает до порога. Различие в коэффициентах осталось прежним, но достоверным быть перестало - это наглядно показывает, почему вывод о значимости всегда нужно делать вместе с объёмом наблюдений, а не по одной только разнице $r_1 - r_2$ .

Сравнение зависимых корреляций и со значением

Формула выше работает для независимых выборок. Если же оба коэффициента посчитаны на одной и той же выборке (например, корреляция переменной $Y$ с $X_1$ и её же корреляция с $X_2$ ), коэффициенты зависимы, и нужно учитывать ещё и корреляцию между предикторами. Для такого случая применяют формулу Стайгера или критерий Уильямса - они включают третий коэффициент $r_{12}$ и дают более точную оценку.

Отдельный частый сценарий - проверить, отличается ли выборочный $r$ от заранее известного теоретического значения $\rho_0$ . Тогда сравнивают одно z-значение с константой: $Z = (z - z_{\rho_0}) \cdot \sqrt{n - 3}$ , где $z_{\rho_0} = \operatorname{arctanh}\rho_0$ . Это уже одновыборочная задача, и вопрос «какой критерий мощнее при простой альтернативе» разбирается через лемму Неймана-Пирсона.

Частые ошибки

Вычитают сами коэффициенты без преобразования. Разность $r_1 - r_2$ нельзя напрямую делить на стандартную ошибку: распределение $r$ скошено. Сначала переводим оба в $z$ -Фишера.
Используют формулу для независимых выборок там, где корреляции зависимы. Если оба $r$ получены на одной выборке, нужна формула Стайгера или Уильямса с учётом $r_{12}$ , иначе значимость завышается.
Берут $n - 1$ вместо $n - 3$ . В дисперсии z-оценки знаменатель именно $n - 3$ . Подстановка $n - 1$ занижает стандартную ошибку и завышает $|Z|$ .
Путают односторонний и двусторонний критерий. Если гипотеза просто «корреляции различаются», критерий двусторонний и порог $1{,}96$ . Для « $r_1 > r_2$ » порог меняется на $1{,}645$ .
Делают вывод о причинности. Значимое различие корреляций говорит о силе связи, но не о том, что в одной группе одна переменная «влияет» сильнее.

FAQ

Какой критерий используется для сравнения двух коэффициентов корреляции? Для двух независимых коэффициентов - критерий Фишера на основе z-преобразования: каждый $r$ переводят в $z = \operatorname{arctanh} r$ , считают $Z = (z_1 - z_2)/SE$ и сравнивают с нормальным распределением. Для зависимых корреляций берут формулу Стайгера или Уильямса.

Что показывает z-преобразование Фишера? Оно выпрямляет шкалу коэффициента корреляции: после преобразования оценка $z$ почти нормальна, а её дисперсия равна $1/(n-3)$ и не зависит от величины связи. Это позволяет стандартизировать разность и проверять её значимость по нормальному распределению.

Почему различие корреляций может быть незначимым при заметной разнице r? Потому что значимость зависит не только от разности $r_1 - r_2$ , но и от объёмов выборок. При малых $n$ стандартная ошибка велика, распределения оценок широки, и даже разрыв в $0{,}3$ по корреляции легко объясняется случайностью. С ростом $n$ та же разница становится значимой.

Коротко

Сравнение двух коэффициентов корреляции делают не вычитанием самих $r$ , а через z-преобразование Фишера $z = \operatorname{arctanh} r$ , на котором оценка почти нормальна с дисперсией $1/(n-3)$ . Для двух независимых выборок считают $SE = \sqrt{1/(n_1-3) + 1/(n_2-3)}$ и статистику $Z = (z_1 - z_2)/SE$ , а различие признают значимым, когда $|Z|$ превышает порог нормального распределения (для $\alpha = 0{,}05$ это $1{,}96$ ). Значимость растёт с объёмом выборки, а для зависимых корреляций нужна формула Стайгера или Уильямса.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Сравнение двух коэффициентов корреляции: критерий Фишера

Почему нельзя просто вычесть один r из другого

Z-преобразование Фишера

Формула сравнения двух независимых коэффициентов

Разбор типовой задачи

Сравнение зависимых корреляций и со значением

Частые ошибки

FAQ

Коротко

Читайте также

Критерий Фишера: сравнение двух дисперсий

Значимость коэффициента корреляции: t-критерий Стьюдента

Частный F-критерий: значимость фактора в регрессии