Дисперсионный анализ с повторными измерениями: формула F
Дисперсионный анализ с повторными измерениями (RM-ANOVA, repeated measures ANOVA) нужен, когда один и тот же испытуемый проходит все условия эксперимента: измеряем реакцию до тренировки, после первой недели и после второй; сравниваем оценку текста при трёх способах подачи; смотрим на показатель прибора в нескольких режимах. Данные оказываются связанными внутри испытуемого, поэтому обычный однофакторный анализ с независимыми выборками здесь не подходит: он не учитывает, что строки таблицы относятся к одному человеку. Главная идея метода в том, что устойчивые различия между испытуемыми выносятся в отдельный источник дисперсии и убираются из ошибки, а значит, критерий становится чувствительнее. Ниже разберём, как раскладывается сумма квадратов, как из неё получается F-отношение, чем этот анализ отличается от обычного ANOVA и где студенты чаще всего ошибаются. Чтобы сразу почувствовать связь силы эффекта, разброса между испытуемыми и значения F, покрути калькулятор ниже: он показывает профили испытуемых и разложение дисперсии и пересчитывает F при каждом движении ползунка.
Когда применяют дисперсионный анализ с повторными измерениями
Метод применяют там, где измерения внутри одной группы зависимы, потому что относятся к одному и тому же объекту. Типичные планы:
- одна группа испытуемых измеряется в нескольких точках времени (лонгитюд, до и после воздействия, динамика обучения);
- каждому испытуемому предъявляют все уровни одного фактора (within-subject дизайн, например все три типа стимула);
- сравнивают несколько связанных методик или приборов на одних и тех же образцах.
Во всех случаях наблюдения внутри испытуемого коррелируют: человек с изначально высоким результатом, скорее всего, останется выше среднего во всех условиях. Если проигнорировать эту связь и применить обычный однофакторный ANOVA, межиндивидуальный разброс попадёт в случайную ошибку, раздует знаменатель F и спрячет реальный эффект. Дисперсионный анализ с повторными измерениями как раз и решает эту проблему, отделяя постоянный вклад каждого испытуемого.
Как раскладывается сумма квадратов
Пусть испытуемых проходят условий, - результат -го испытуемого в -м условии. Полная изменчивость данных измеряется полной суммой квадратов отклонений от общего среднего :
Ключевое отличие от обычного анализа в том, что эта сумма раскладывается не на две, а на три части:
Здесь - изменчивость, объяснённая различием условий, - изменчивость, объяснённая различием между испытуемыми, - то, что осталось (взаимодействие испытуемых и условий, то есть случайные колебания внутри строки). Считаются они через средние по столбцам и по строкам :
а остаток находят вычитанием: . Именно вынос в отдельную строку и делает метод мощным.

На диаграмме видно, что золотой блок и есть проверяемый эффект, а скобка справа охватывает то, что обычный анализ свалил бы в одну ошибку. Чем больше серый блок , тем сильнее выигрыш от повторных измерений.
Подставим конкретные числа из калькулятора при настройках по умолчанию: пять испытуемых, четыре условия, умеренный эффект. Полная сумма квадратов получается , и она делится на три части: , и . Сумма трёх слагаемых в точности равна полной сумме квадратов, и это удобная проверка расчёта: если три части не складываются в , где-то ошибка в средних по строкам или столбцам. Обрати внимание на масштаб: разброс между испытуемыми оказался даже больше остатка . Именно поэтому вынос испытуемых из ошибки даёт здесь такой ощутимый эффект, ведь знаменатель F почти удваивается, если этот вклад в него вернуть.
Формула F и степени свободы
Чтобы превратить суммы квадратов в средние квадраты, каждую делят на её число степеней свободы:
Средние квадраты - это и . Наблюдаемое значение критерия равно их отношению:
Обрати внимание: в знаменателе стоит не общая ошибка, а именно остаток после выноса испытуемых. Чем больше , тем сильнее различия между условиями на фоне случайного шума. Полученное значение сравнивают с критическим при уровне значимости и тех же степенях свободы и : если , нулевую гипотезу о равенстве средних по условиям отвергают.
Доведём расчёт до конца на тех же числах. Для пяти испытуемых и четырёх условий степени свободы равны и . Средние квадраты получаются и , а их отношение даёт наблюдаемое . Такое значение заметно превышает критический порог (для и при это около ), поэтому различия между условиями признают статистически значимыми. Удобно держать перед глазами всю таблицу дисперсионного анализа: в ней по строкам идут источники изменчивости, а по столбцам , , и итоговое .

Такую таблицу выдаёт любой статистический пакет, и читать её нужно справа налево: смотрим F в строке условий, сверяем с критическим значением по степеням свободы из той же строки и строки ошибки, и только потом делаем содержательный вывод об эффекте.
Анимация показывает обе стороны процесса сразу: пока эффект условий мал, среднее по условиям почти не меняется от точки к точке, золотой блок тонкий, и близко к нулю. Стоит усилить различия между условиями, как наклон золотой линии растёт, золотой блок раздувается, а знаменатель остаётся прежним, и значение резко увеличивается.
Чем он мощнее обычного ANOVA
Сравним два анализа на одних и тех же данных. В обычном однофакторном ANOVA ошибка складывается из остатка и разброса между испытуемыми, , и её степени свободы равны . В дисперсионном анализе с повторными измерениями знаменатель состоит только из , потому что вынесен отдельно. Числитель в обоих случаях один и тот же, а знаменатель у RM-ANOVA меньше, поэтому его всегда не меньше, чем у обычного анализа. В калькуляторе выше две полосы разложения наглядно показывают этот выигрыш: верхняя полоса (RM-ANOVA) оставляет в красном знаменателе только остаток, нижняя (обычный ANOVA) добавляет к нему серый разброс испытуемых.
Выигрыш тем больше, чем сильнее различаются испытуемые между собой: если базовые уровни людей расходятся (большой ), обычный анализ тонет в этом разбросе, а повторные измерения его аккуратно убирают. Платой за мощность служат меньшие степени свободы ошибки и дополнительное допущение о структуре данных, о котором ниже.
Допущение сферичности и поправки
Главное специфическое условие метода - сферичность: дисперсии разностей между всеми парами условий должны быть примерно одинаковы. Это аналог равенства дисперсий для зависимых данных. Сферичность проверяют тестом Мокли; если его -значение меньше , допущение нарушено, и F-критерий становится слишком либеральным, то есть завышает шанс ложно значимого результата.
Лечится это поправкой степеней свободы на коэффициент эпсилон : и , и умножают на , отчего критическое значение растёт, а результат становится строже. На практике используют поправку Гринхауса-Гайссера (консервативную) или Хьюна-Фельдта (мягче, когда близко к единице). При сферичность выполняется автоматически: пара условий даёт ровно одну разность, и проверять нечего.
Частые ошибки
- Применяют обычный ANOVA к зависимым данным. Если строки таблицы относятся к одним и тем же испытуемым, независимый анализ занижает мощность и искажает ошибку, его использовать нельзя.
- Забывают про сферичность. Без проверки теста Мокли и поправки Гринхауса-Гайссера значимый результат может оказаться артефактом нарушенного допущения.
- Путают степени свободы. Знаменатель F считают по , а не по как в обычном анализе; ошибка в ведёт к неверному критическому значению.
- Берут в знаменатель. Разброс между испытуемыми выносится отдельно и в F-отношение не входит; иначе теряется весь смысл метода.
- Игнорируют пропуски. Классический RM-ANOVA требует полных данных по каждому испытуемому: один пропуск выбивает всю строку, для неполных данных нужны смешанные модели.
FAQ
Чем дисперсионный анализ с повторными измерениями отличается от парного t-критерия? Парный t-критерий сравнивает ровно два связанных условия, а RM-ANOVA обобщает его на три и более условий сразу, контролируя общую вероятность ошибки. При оба метода дают эквивалентный результат, причём .
Что делать, если нарушена сферичность? Применить поправку степеней свободы: Гринхауса-Гайссера при сильном нарушении или Хьюна-Фельдта при умеренном. Если нарушение грубое, переходят к многомерному подходу (MANOVA) или к смешанным линейным моделям, которые не требуют сферичности.
Сколько нужно испытуемых? Жёсткого минимума нет, но при малом степени свободы ошибки быстро падают, и критическое растёт. Обычно ориентируются на мощность не ниже через предварительный расчёт размера выборки по ожидаемому размеру эффекта.
Коротко
Дисперсионный анализ с повторными измерениями применяют, когда одни и те же испытуемые проходят все условия. Полная сумма квадратов раскладывается на три части: условия, испытуемые и ошибка, а критерий считается как со степенями свободы и . За счёт выноса разброса между испытуемыми из знаменателя метод мощнее обычного ANOVA на тех же данных. Цена этого - допущение сферичности, которое проверяют тестом Мокли и при нарушении правят поправкой Гринхауса-Гайссера.
Читайте также

Как работает ANOVA однофакторный дисперсионный анализ
ANOVA однофакторный дисперсионный анализ сравнивает средние в трёх и более группах. Разбираем суммы квадратов, F-критерий и условия применимости на примере с расчётом.

Критерий сферичности Бартлетта в факторном анализе
Критерий сферичности Бартлетта: зачем проверять корреляционную матрицу на единичность перед факторным анализом, формула хи-квадрат через определитель, число степеней свободы и связь с мерой KMO.

Распределение Фишера: критические значения и F-квантили
Распределение Фишера и его критические значения: что такое F-распределение, как читать таблицу по двум степеням свободы и применять F-квантили в F-тесте дисперсий и ANOVA.