Ранговая корреляция Спирмена: формула и расчёт
Ранговая корреляция Спирмена измеряет монотонную связь между двумя переменными, не требуя нормального распределения и работая даже с порядковыми шкалами. Это делает её незаменимым инструментом в задачах, где данные нельзя считать выборкой из генеральной совокупности с нормальным законом: анкетные оценки, рейтинги, результаты ранжирования экспертами. Метод предложил Чарльз Спирмен в 1904 году как ранговый аналог корреляции Пирсона, и с тех пор остаётся стандартом непараметрического анализа в психологии, педагогике и медицинских исследованиях. Чтобы сразу увидеть, как разности рангов связаны с итоговым коэффициентом, воспользуйтесь калькулятором ниже - он пересчитывает rs в реальном времени при изменении числа пар и степени монотонной связи.
Формула коэффициента Спирмена
Коэффициент ранговой корреляции Спирмена вычисляется по формуле:
где - разность рангов -го объекта по двум переменным, - число пар наблюдений. Множитель 6 в числителе и выражение в знаменателе получаются из более общей формулы Пирсона, применённой к рангам 1, 2, ..., n.
Область значений: .
- : полная прямая монотонная связь (порядок рангов X и Y совпадает).
- : полная обратная монотонная связь (ранги Y идут в обратном порядке относительно X).
- : монотонная связь отсутствует.
Важно: измеряет именно монотонность - насколько с ростом X тенденциозно растёт или убывает Y, - а не линейность. Поэтому на данных с нелинейной, но монотонной зависимостью Спирмен даст высокое значение, тогда как Пирсон - заниженное.
Пошаговый расчёт: пример
Рассмотрим данные о баллах восьми студентов по математике и физике.
Шаг 1. Расставить ранги. Каждому значению присваивается ранг от 1 (наименьшее) до (наибольшее) внутри своей переменной. При совпадении значений (связанные ранги) всем им присваивается средний ранг.
| Студент | Математика | Ранг X | Физика | Ранг Y | ||
|---|---|---|---|---|---|---|
| 1 | 72 | 4 | 70 | 3 | 1 | 1 |
| 2 | 85 | 6 | 88 | 7 | -1 | 1 |
| 3 | 60 | 2 | 65 | 2 | 0 | 0 |
| 4 | 90 | 7 | 82 | 6 | 1 | 1 |
| 5 | 55 | 1 | 50 | 1 | 0 | 0 |
| 6 | 78 | 5 | 80 | 5 | 0 | 0 |
| 7 | 95 | 8 | 91 | 8 | 0 | 0 |
| 8 | 67 | 3 | 72 | 4 | -1 | 1 |
Шаг 2. Вычислить сумму . В примере: .
Шаг 3. Подставить в формулу:

Результат говорит об очень сильной положительной монотонной связи: студенты, получающие высокие баллы по математике, в подавляющем большинстве имеют высокие баллы и по физике.
Связанные ранги: поправка к формуле
Если среди значений одной переменной есть повторяющиеся, их ранг заменяют средним из тех рангов, которые они бы получили по очереди. Например, три значения на местах 3, 4, 5 получают ранг .
При большом числе связанных рангов стандартная формула даёт смещённую оценку. В этом случае применяется поправка Деулефё через дисперсии рангов:
где суммируется по всем группам связанных рангов с объёмом . На практике, если связанных рангов меньше 20 % от , поправкой пренебрегают.
Проверка значимости коэффициента
Вычисленный - выборочная оценка; вопрос, отличается ли она от нуля значимо, решается через -критерий Стьюдента:
Если по таблице Стьюдента для заданного уровня значимости , корреляция значима. Для примера выше: при . Критическое значение , поэтому корреляция значима.
При пользуются таблицей критических значений , специально рассчитанных для малых выборок (таблица Зар или таблица Спирмена). Для и : ; наш - значит, связь значима.
Интерпретация по шкале Чеддока
Абсолютное значение интерпретируется по шкале силы связи:
| | Характер связи | |---------|----------------| | 0,10 - 0,29 | слабая | | 0,30 - 0,49 | умеренная | | 0,50 - 0,69 | заметная | | 0,70 - 0,89 | сильная | | 0,90 - 1,00 | очень сильная |
Знак при указывает направление: «+» - прямая зависимость (высокие X сочетаются с высокими Y), «-» - обратная.
Сравнение с корреляцией Пирсона
Корреляция Пирсона измеряет линейную зависимость и требует нормальности распределения, непрерывности шкалы и отсутствия выбросов. Спирмен свободен от этих ограничений, поскольку работает с рангами - устойчивой к выбросам монотонной трансформацией.
Когда данные удовлетворяют требованиям Пирсона, точнее ( теряет часть информации при переходе к рангам). На ненормальных данных, порядковых шкалах или при наличии выбросов Спирмен предпочтительнее. Частный случай: если связь нелинейна, но монотонна, даёт более высокое значение, чем .
Частые ошибки
- Ранжируют неверно при связанных рангах. Присваивают порядковые номера вместо средних рангов - это ломает симметрию формулы и даёт неверный . Всегда проверяйте: сумма всех рангов должна равняться .
- Путают - число пар с числом переменных. В формуле - это именно количество объектов (строк в таблице), а не 2 переменные.
- Применяют формулу без поправки при многих совпадениях. Если связанных рангов много, без поправки Деулефё будет завышен.
- Интерпретируют как линейную связь. не означает «y приблизительно равно x», а только что монотонная связь очень сильная.
- Забывают проверить значимость. При даже может оказаться статистически незначимым - критическое значение велико для малых выборок.
FAQ
Можно ли применять Спирмена к данным на интервальной шкале?
Да. Если данные на интервальной или отношений шкале, но нарушается нормальность (выбросы, скошенное распределение), Спирмен является предпочтительной заменой Пирсону. Единственное условие - монотонная зависимость и порядковая интерпретируемость переменных.
Что делать, если значим, но мал по абсолюту?
Статистическая значимость и практическая значимость - разные вещи. При большом даже может оказаться значимым, но практически это слабая связь. Оценивайте и -значение, и величину эффекта по шкале Чеддока.
Как вычислить Спирмена в Excel?
Excel не имеет встроенной функции, но расчёт легко автоматизировать: столбцы РАНГ.СР() для X и Y, затем разности, их квадраты, СУММ() и формула. Либо использовать функцию КОРРЕЛ() после ранжирования - она даст тот же результат, что формула Спирмена (без поправки на связанные ранги).
Коротко
Коэффициент ранговой корреляции Спирмена вычисляется по формуле , где - разности рангов каждой пары. Он измеряет монотонную, а не обязательно линейную связь, устойчив к выбросам и не требует нормальности. Расчёт сводится к четырём шагам: присвоить ранги (с учётом связанных), найти разности, возвести в квадрат, подставить в формулу. Значимость проверяется через -критерий Стьюдента при . Результат интерпретируется по шкале Чеддока: - сильная связь, - очень сильная.
Читайте также

Ранговый коэффициент корреляции Спирмена: расчёт по шагам
Разбираем расчёт рангового коэффициента корреляции Спирмена: ранжирование, формула с разностями рангов, поправка на связанные ранги и проверка значимости с примером.

Коэффициент корреляции Кендалла: расчёт тау
Коэффициент корреляции Кендалла: расчёт тау по согласованным и несогласованным парам, формула, пример вычисления вручную, поправка на связи и проверка значимости.

Абстрактный класс и интерфейс: в чём отличие
Абстрактный класс и интерфейс: чем отличаются в ООП, когда наследовать поведение, а когда задавать контракт, как выбрать на примерах Java, C# и Python.