Дисперсионный анализ с повторными измерениями: формула F

11 июня 2026Время чтения: 9 минут

#дисперсионный анализ#повторные измерения#rm-anova#f-критерий#сферичность

Дисперсионный анализ с повторными измерениями (RM-ANOVA, repeated measures ANOVA) нужен, когда один и тот же испытуемый проходит все условия эксперимента: измеряем реакцию до тренировки, после первой недели и после второй; сравниваем оценку текста при трёх способах подачи; смотрим на показатель прибора в нескольких режимах. Данные оказываются связанными внутри испытуемого, поэтому обычный однофакторный анализ с независимыми выборками здесь не подходит: он не учитывает, что строки таблицы относятся к одному человеку. Главная идея метода в том, что устойчивые различия между испытуемыми выносятся в отдельный источник дисперсии и убираются из ошибки, а значит, критерий становится чувствительнее. Ниже разберём, как раскладывается сумма квадратов, как из неё получается F-отношение, чем этот анализ отличается от обычного ANOVA и где студенты чаще всего ошибаются. Чтобы сразу почувствовать связь силы эффекта, разброса между испытуемыми и значения F, покрути калькулятор ниже: он показывает профили испытуемых и разложение дисперсии и пересчитывает F при каждом движении ползунка.

Когда применяют дисперсионный анализ с повторными измерениями

Метод применяют там, где измерения внутри одной группы зависимы, потому что относятся к одному и тому же объекту. Типичные планы:

одна группа испытуемых измеряется в нескольких точках времени (лонгитюд, до и после воздействия, динамика обучения);
каждому испытуемому предъявляют все уровни одного фактора (within-subject дизайн, например все три типа стимула);
сравнивают несколько связанных методик или приборов на одних и тех же образцах.

Во всех случаях наблюдения внутри испытуемого коррелируют: человек с изначально высоким результатом, скорее всего, останется выше среднего во всех условиях. Если проигнорировать эту связь и применить обычный однофакторный ANOVA, межиндивидуальный разброс попадёт в случайную ошибку, раздует знаменатель F и спрячет реальный эффект. Дисперсионный анализ с повторными измерениями как раз и решает эту проблему, отделяя постоянный вклад каждого испытуемого.

Как раскладывается сумма квадратов

Пусть $n$ испытуемых проходят $k$ условий, $x_{ij}$ - результат $i$ -го испытуемого в $j$ -м условии. Полная изменчивость данных измеряется полной суммой квадратов отклонений от общего среднего $\bar{x}$ :

$SS_{общ} = \sum_{i=1}^{n}\sum_{j=1}^{k}\left(x_{ij} - \bar{x}\right)^2.$

Ключевое отличие от обычного анализа в том, что эта сумма раскладывается не на две, а на три части:

$SS_{общ} = SS_{усл} + SS_{исп} + SS_{ошибки}.$

Здесь $SS_{усл}$ - изменчивость, объяснённая различием условий, $SS_{исп}$ - изменчивость, объяснённая различием между испытуемыми, $SS_{ошибки}$ - то, что осталось (взаимодействие испытуемых и условий, то есть случайные колебания внутри строки). Считаются они через средние по столбцам $\bar{x}_{\cdot j}$ и по строкам $\bar{x}_{i\cdot}$ :

$SS_{усл} = n\sum_{j=1}^{k}\left(\bar{x}_{\cdot j} - \bar{x}\right)^2, \qquad SS_{исп} = k\sum_{i=1}^{n}\left(\bar{x}_{i\cdot} - \bar{x}\right)^2,$

а остаток находят вычитанием: $SS_{ошибки} = SS_{общ} - SS_{усл} - SS_{исп}$ . Именно вынос $SS_{исп}$ в отдельную строку и делает метод мощным.

Полная дисперсия делится на три источника: SS условий, SS испытуемых и SS ошибки. В обычном ANOVA два последних слагаемых слились бы в одну ошибку, поэтому знаменатель F был бы больше

На диаграмме видно, что золотой блок $SS_{усл}$ и есть проверяемый эффект, а скобка справа охватывает то, что обычный анализ свалил бы в одну ошибку. Чем больше серый блок $SS_{исп}$ , тем сильнее выигрыш от повторных измерений.

Подставим конкретные числа из калькулятора при настройках по умолчанию: пять испытуемых, четыре условия, умеренный эффект. Полная сумма квадратов получается $SS_{общ} \approx 65.7$ , и она делится на три части: $SS_{усл} \approx 44.1$ , $SS_{исп} \approx 12.4$ и $SS_{ошибки} \approx 9.3$ . Сумма трёх слагаемых в точности равна полной сумме квадратов, и это удобная проверка расчёта: если три части не складываются в $SS_{общ}$ , где-то ошибка в средних по строкам или столбцам. Обрати внимание на масштаб: разброс между испытуемыми $SS_{исп} \approx 12.4$ оказался даже больше остатка $SS_{ошибки} \approx 9.3$ . Именно поэтому вынос испытуемых из ошибки даёт здесь такой ощутимый эффект, ведь знаменатель F почти удваивается, если этот вклад в него вернуть.

Формула F и степени свободы

Чтобы превратить суммы квадратов в средние квадраты, каждую делят на её число степеней свободы:

$df_{усл} = k - 1, \qquad df_{исп} = n - 1, \qquad df_{ошибки} = (k-1)(n-1).$

Средние квадраты - это $MS_{усл} = SS_{усл}/df_{усл}$ и $MS_{ошибки} = SS_{ошибки}/df_{ошибки}$ . Наблюдаемое значение критерия равно их отношению:

$F = \frac{MS_{усл}}{MS_{ошибки}}.$

Обрати внимание: в знаменателе стоит не общая ошибка, а именно остаток после выноса испытуемых. Чем больше $F$ , тем сильнее различия между условиями на фоне случайного шума. Полученное значение сравнивают с критическим $F_{кр}$ при уровне значимости $\alpha$ и тех же степенях свободы $df_{усл}$ и $df_{ошибки}$ : если $F > F_{кр}$ , нулевую гипотезу о равенстве средних по условиям отвергают.

Доведём расчёт до конца на тех же числах. Для пяти испытуемых и четырёх условий степени свободы равны $df_{усл} = k - 1 = 3$ и $df_{ошибки} = (k-1)(n-1) = 3 \cdot 4 = 12$ . Средние квадраты получаются $MS_{усл} = 44.1/3 \approx 14.7$ и $MS_{ошибки} = 9.3/12 \approx 0.77$ , а их отношение даёт наблюдаемое $F = 14.7/0.77 \approx 19$ . Такое значение заметно превышает критический порог (для $df = 3$ и $12$ при $\alpha = 0.05$ это около $3.5$ ), поэтому различия между условиями признают статистически значимыми. Удобно держать перед глазами всю таблицу дисперсионного анализа: в ней по строкам идут источники изменчивости, а по столбцам $SS$ , $df$ , $MS$ и итоговое $F$ .

Таблица дисперсионного анализа: строки источников (условия, испытуемые, ошибка, полная), а в столбцах сумма квадратов, степени свободы, средний квадрат и F. Итоговое F стоит в строке условий и равно отношению среднего квадрата условий к среднему квадрату ошибки

Такую таблицу выдаёт любой статистический пакет, и читать её нужно справа налево: смотрим F в строке условий, сверяем с критическим значением по степеням свободы из той же строки и строки ошибки, и только потом делаем содержательный вывод об эффекте.

Слева профили испытуемых по условиям и золотая линия среднего, справа разложение полной дисперсии на три блока. Когда эффект условий слабый, золотая линия плоская и F около нуля; когда эффект растёт, золотой блок SS условий увеличивается, а F едет вверх

Анимация показывает обе стороны процесса сразу: пока эффект условий мал, среднее по условиям почти не меняется от точки к точке, золотой блок $SS_{усл}$ тонкий, и $F$ близко к нулю. Стоит усилить различия между условиями, как наклон золотой линии растёт, золотой блок раздувается, а знаменатель остаётся прежним, и значение $F$ резко увеличивается.

Чем он мощнее обычного ANOVA

Сравним два анализа на одних и тех же данных. В обычном однофакторном ANOVA ошибка складывается из остатка и разброса между испытуемыми, $SS_{ошибки}^{обычн} = SS_{исп} + SS_{ошибки}$ , и её степени свободы равны $k(n-1)$ . В дисперсионном анализе с повторными измерениями знаменатель состоит только из $SS_{ошибки}$ , потому что $SS_{исп}$ вынесен отдельно. Числитель $MS_{усл}$ в обоих случаях один и тот же, а знаменатель у RM-ANOVA меньше, поэтому его $F$ всегда не меньше, чем у обычного анализа. В калькуляторе выше две полосы разложения наглядно показывают этот выигрыш: верхняя полоса (RM-ANOVA) оставляет в красном знаменателе только остаток, нижняя (обычный ANOVA) добавляет к нему серый разброс испытуемых.

Выигрыш тем больше, чем сильнее различаются испытуемые между собой: если базовые уровни людей расходятся (большой $SS_{исп}$ ), обычный анализ тонет в этом разбросе, а повторные измерения его аккуратно убирают. Платой за мощность служат меньшие степени свободы ошибки и дополнительное допущение о структуре данных, о котором ниже.

Допущение сферичности и поправки

Главное специфическое условие метода - сферичность: дисперсии разностей между всеми парами условий должны быть примерно одинаковы. Это аналог равенства дисперсий для зависимых данных. Сферичность проверяют тестом Мокли; если его $p$ -значение меньше $0.05$ , допущение нарушено, и F-критерий становится слишком либеральным, то есть завышает шанс ложно значимого результата.

Лечится это поправкой степеней свободы на коэффициент эпсилон $\varepsilon \le 1$ : и $df_{усл}$ , и $df_{ошибки}$ умножают на $\varepsilon$ , отчего критическое значение растёт, а результат становится строже. На практике используют поправку Гринхауса-Гайссера (консервативную) или Хьюна-Фельдта (мягче, когда $\varepsilon$ близко к единице). При $k = 2$ сферичность выполняется автоматически: пара условий даёт ровно одну разность, и проверять нечего.

Частые ошибки

Применяют обычный ANOVA к зависимым данным. Если строки таблицы относятся к одним и тем же испытуемым, независимый анализ занижает мощность и искажает ошибку, его использовать нельзя.
Забывают про сферичность. Без проверки теста Мокли и поправки Гринхауса-Гайссера значимый результат может оказаться артефактом нарушенного допущения.
Путают степени свободы. Знаменатель F считают по $(k-1)(n-1)$ , а не по $k(n-1)$ как в обычном анализе; ошибка в $df$ ведёт к неверному критическому значению.
Берут $SS_{исп}$ в знаменатель. Разброс между испытуемыми выносится отдельно и в F-отношение не входит; иначе теряется весь смысл метода.
Игнорируют пропуски. Классический RM-ANOVA требует полных данных по каждому испытуемому: один пропуск выбивает всю строку, для неполных данных нужны смешанные модели.

FAQ

Чем дисперсионный анализ с повторными измерениями отличается от парного t-критерия? Парный t-критерий сравнивает ровно два связанных условия, а RM-ANOVA обобщает его на три и более условий сразу, контролируя общую вероятность ошибки. При $k = 2$ оба метода дают эквивалентный результат, причём $F = t^2$ .

Что делать, если нарушена сферичность? Применить поправку степеней свободы: Гринхауса-Гайссера при сильном нарушении или Хьюна-Фельдта при умеренном. Если нарушение грубое, переходят к многомерному подходу (MANOVA) или к смешанным линейным моделям, которые не требуют сферичности.

Сколько нужно испытуемых? Жёсткого минимума нет, но при малом $n$ степени свободы ошибки $(k-1)(n-1)$ быстро падают, и критическое $F$ растёт. Обычно ориентируются на мощность не ниже $0.8$ через предварительный расчёт размера выборки по ожидаемому размеру эффекта.

Коротко

Дисперсионный анализ с повторными измерениями применяют, когда одни и те же испытуемые проходят все условия. Полная сумма квадратов раскладывается на три части: условия, испытуемые и ошибка, а критерий считается как $F = MS_{усл}/MS_{ошибки}$ со степенями свободы $k-1$ и $(k-1)(n-1)$ . За счёт выноса разброса между испытуемыми из знаменателя метод мощнее обычного ANOVA на тех же данных. Цена этого - допущение сферичности, которое проверяют тестом Мокли и при нарушении правят поправкой Гринхауса-Гайссера.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Дисперсионный анализ с повторными измерениями: формула F

Когда применяют дисперсионный анализ с повторными измерениями

Как раскладывается сумма квадратов

Формула F и степени свободы

Чем он мощнее обычного ANOVA

Допущение сферичности и поправки

Частые ошибки

FAQ

Коротко

Читайте также

Как работает ANOVA однофакторный дисперсионный анализ

Критерий сферичности Бартлетта в факторном анализе

Распределение Фишера: критические значения и F-квантили