EssayAI
Блог
Блог
Математика и алгоритмы

Дисперсионный анализ с повторными измерениями: формула F

11 июня 2026Время чтения: 9 минут
#дисперсионный анализ#повторные измерения#rm-anova#f-критерий#сферичность

Дисперсионный анализ с повторными измерениями (RM-ANOVA, repeated measures ANOVA) нужен, когда один и тот же испытуемый проходит все условия эксперимента: измеряем реакцию до тренировки, после первой недели и после второй; сравниваем оценку текста при трёх способах подачи; смотрим на показатель прибора в нескольких режимах. Данные оказываются связанными внутри испытуемого, поэтому обычный однофакторный анализ с независимыми выборками здесь не подходит: он не учитывает, что строки таблицы относятся к одному человеку. Главная идея метода в том, что устойчивые различия между испытуемыми выносятся в отдельный источник дисперсии и убираются из ошибки, а значит, критерий становится чувствительнее. Ниже разберём, как раскладывается сумма квадратов, как из неё получается F-отношение, чем этот анализ отличается от обычного ANOVA и где студенты чаще всего ошибаются. Чтобы сразу почувствовать связь силы эффекта, разброса между испытуемыми и значения F, покрути калькулятор ниже: он показывает профили испытуемых и разложение дисперсии и пересчитывает F при каждом движении ползунка.

Когда применяют дисперсионный анализ с повторными измерениями

Метод применяют там, где измерения внутри одной группы зависимы, потому что относятся к одному и тому же объекту. Типичные планы:

  • одна группа испытуемых измеряется в нескольких точках времени (лонгитюд, до и после воздействия, динамика обучения);
  • каждому испытуемому предъявляют все уровни одного фактора (within-subject дизайн, например все три типа стимула);
  • сравнивают несколько связанных методик или приборов на одних и тех же образцах.

Во всех случаях наблюдения внутри испытуемого коррелируют: человек с изначально высоким результатом, скорее всего, останется выше среднего во всех условиях. Если проигнорировать эту связь и применить обычный однофакторный ANOVA, межиндивидуальный разброс попадёт в случайную ошибку, раздует знаменатель F и спрячет реальный эффект. Дисперсионный анализ с повторными измерениями как раз и решает эту проблему, отделяя постоянный вклад каждого испытуемого.

Как раскладывается сумма квадратов

Пусть nn испытуемых проходят kk условий, xijx_{ij} - результат ii-го испытуемого в jj-м условии. Полная изменчивость данных измеряется полной суммой квадратов отклонений от общего среднего xˉ\bar{x}:

SSобщ=i=1nj=1k(xijxˉ)2.SS_{общ} = \sum_{i=1}^{n}\sum_{j=1}^{k}\left(x_{ij} - \bar{x}\right)^2.

Ключевое отличие от обычного анализа в том, что эта сумма раскладывается не на две, а на три части:

SSобщ=SSусл+SSисп+SSошибки.SS_{общ} = SS_{усл} + SS_{исп} + SS_{ошибки}.

Здесь SSуслSS_{усл} - изменчивость, объяснённая различием условий, SSиспSS_{исп} - изменчивость, объяснённая различием между испытуемыми, SSошибкиSS_{ошибки} - то, что осталось (взаимодействие испытуемых и условий, то есть случайные колебания внутри строки). Считаются они через средние по столбцам xˉj\bar{x}_{\cdot j} и по строкам xˉi\bar{x}_{i\cdot}:

SSусл=nj=1k(xˉjxˉ)2,SSисп=ki=1n(xˉixˉ)2,SS_{усл} = n\sum_{j=1}^{k}\left(\bar{x}_{\cdot j} - \bar{x}\right)^2, \qquad SS_{исп} = k\sum_{i=1}^{n}\left(\bar{x}_{i\cdot} - \bar{x}\right)^2,

а остаток находят вычитанием: SSошибки=SSобщSSуслSSиспSS_{ошибки} = SS_{общ} - SS_{усл} - SS_{исп}. Именно вынос SSиспSS_{исп} в отдельную строку и делает метод мощным.

Полная дисперсия делится на три источника: SS условий, SS испытуемых и SS ошибки. В обычном ANOVA два последних слагаемых слились бы в одну ошибку, поэтому знаменатель F был бы больше
Полная дисперсия делится на три источника: SS условий, SS испытуемых и SS ошибки. В обычном ANOVA два последних слагаемых слились бы в одну ошибку, поэтому знаменатель F был бы больше

На диаграмме видно, что золотой блок SSуслSS_{усл} и есть проверяемый эффект, а скобка справа охватывает то, что обычный анализ свалил бы в одну ошибку. Чем больше серый блок SSиспSS_{исп}, тем сильнее выигрыш от повторных измерений.

Подставим конкретные числа из калькулятора при настройках по умолчанию: пять испытуемых, четыре условия, умеренный эффект. Полная сумма квадратов получается SSобщ65.7SS_{общ} \approx 65.7, и она делится на три части: SSусл44.1SS_{усл} \approx 44.1, SSисп12.4SS_{исп} \approx 12.4 и SSошибки9.3SS_{ошибки} \approx 9.3. Сумма трёх слагаемых в точности равна полной сумме квадратов, и это удобная проверка расчёта: если три части не складываются в SSобщSS_{общ}, где-то ошибка в средних по строкам или столбцам. Обрати внимание на масштаб: разброс между испытуемыми SSисп12.4SS_{исп} \approx 12.4 оказался даже больше остатка SSошибки9.3SS_{ошибки} \approx 9.3. Именно поэтому вынос испытуемых из ошибки даёт здесь такой ощутимый эффект, ведь знаменатель F почти удваивается, если этот вклад в него вернуть.

Формула F и степени свободы

Чтобы превратить суммы квадратов в средние квадраты, каждую делят на её число степеней свободы:

dfусл=k1,dfисп=n1,dfошибки=(k1)(n1).df_{усл} = k - 1, \qquad df_{исп} = n - 1, \qquad df_{ошибки} = (k-1)(n-1).

Средние квадраты - это MSусл=SSусл/dfуслMS_{усл} = SS_{усл}/df_{усл} и MSошибки=SSошибки/dfошибкиMS_{ошибки} = SS_{ошибки}/df_{ошибки}. Наблюдаемое значение критерия равно их отношению:

F=MSуслMSошибки.F = \frac{MS_{усл}}{MS_{ошибки}}.

Обрати внимание: в знаменателе стоит не общая ошибка, а именно остаток после выноса испытуемых. Чем больше FF, тем сильнее различия между условиями на фоне случайного шума. Полученное значение сравнивают с критическим FкрF_{кр} при уровне значимости α\alpha и тех же степенях свободы dfуслdf_{усл} и dfошибкиdf_{ошибки}: если F>FкрF > F_{кр}, нулевую гипотезу о равенстве средних по условиям отвергают.

Доведём расчёт до конца на тех же числах. Для пяти испытуемых и четырёх условий степени свободы равны dfусл=k1=3df_{усл} = k - 1 = 3 и dfошибки=(k1)(n1)=34=12df_{ошибки} = (k-1)(n-1) = 3 \cdot 4 = 12. Средние квадраты получаются MSусл=44.1/314.7MS_{усл} = 44.1/3 \approx 14.7 и MSошибки=9.3/120.77MS_{ошибки} = 9.3/12 \approx 0.77, а их отношение даёт наблюдаемое F=14.7/0.7719F = 14.7/0.77 \approx 19. Такое значение заметно превышает критический порог (для df=3df = 3 и 1212 при α=0.05\alpha = 0.05 это около 3.53.5), поэтому различия между условиями признают статистически значимыми. Удобно держать перед глазами всю таблицу дисперсионного анализа: в ней по строкам идут источники изменчивости, а по столбцам SSSS, dfdf, MSMS и итоговое FF.

Таблица дисперсионного анализа: строки источников (условия, испытуемые, ошибка, полная), а в столбцах сумма квадратов, степени свободы, средний квадрат и F. Итоговое F стоит в строке условий и равно отношению среднего квадрата условий к среднему квадрату ошибки
Таблица дисперсионного анализа: строки источников (условия, испытуемые, ошибка, полная), а в столбцах сумма квадратов, степени свободы, средний квадрат и F. Итоговое F стоит в строке условий и равно отношению среднего квадрата условий к среднему квадрату ошибки

Такую таблицу выдаёт любой статистический пакет, и читать её нужно справа налево: смотрим F в строке условий, сверяем с критическим значением по степеням свободы из той же строки и строки ошибки, и только потом делаем содержательный вывод об эффекте.

Слева профили испытуемых по условиям и золотая линия среднего, справа разложение полной дисперсии на три блока. Когда эффект условий слабый, золотая линия плоская и F около нуля; когда эффект растёт, золотой блок SS условий увеличивается, а F едет вверх

Анимация показывает обе стороны процесса сразу: пока эффект условий мал, среднее по условиям почти не меняется от точки к точке, золотой блок SSуслSS_{усл} тонкий, и FF близко к нулю. Стоит усилить различия между условиями, как наклон золотой линии растёт, золотой блок раздувается, а знаменатель остаётся прежним, и значение FF резко увеличивается.

Чем он мощнее обычного ANOVA

Сравним два анализа на одних и тех же данных. В обычном однофакторном ANOVA ошибка складывается из остатка и разброса между испытуемыми, SSошибкиобычн=SSисп+SSошибкиSS_{ошибки}^{обычн} = SS_{исп} + SS_{ошибки}, и её степени свободы равны k(n1)k(n-1). В дисперсионном анализе с повторными измерениями знаменатель состоит только из SSошибкиSS_{ошибки}, потому что SSиспSS_{исп} вынесен отдельно. Числитель MSуслMS_{усл} в обоих случаях один и тот же, а знаменатель у RM-ANOVA меньше, поэтому его FF всегда не меньше, чем у обычного анализа. В калькуляторе выше две полосы разложения наглядно показывают этот выигрыш: верхняя полоса (RM-ANOVA) оставляет в красном знаменателе только остаток, нижняя (обычный ANOVA) добавляет к нему серый разброс испытуемых.

Выигрыш тем больше, чем сильнее различаются испытуемые между собой: если базовые уровни людей расходятся (большой SSиспSS_{исп}), обычный анализ тонет в этом разбросе, а повторные измерения его аккуратно убирают. Платой за мощность служат меньшие степени свободы ошибки и дополнительное допущение о структуре данных, о котором ниже.

Допущение сферичности и поправки

Главное специфическое условие метода - сферичность: дисперсии разностей между всеми парами условий должны быть примерно одинаковы. Это аналог равенства дисперсий для зависимых данных. Сферичность проверяют тестом Мокли; если его pp-значение меньше 0.050.05, допущение нарушено, и F-критерий становится слишком либеральным, то есть завышает шанс ложно значимого результата.

Лечится это поправкой степеней свободы на коэффициент эпсилон ε1\varepsilon \le 1: и dfуслdf_{усл}, и dfошибкиdf_{ошибки} умножают на ε\varepsilon, отчего критическое значение растёт, а результат становится строже. На практике используют поправку Гринхауса-Гайссера (консервативную) или Хьюна-Фельдта (мягче, когда ε\varepsilon близко к единице). При k=2k = 2 сферичность выполняется автоматически: пара условий даёт ровно одну разность, и проверять нечего.

Частые ошибки

  • Применяют обычный ANOVA к зависимым данным. Если строки таблицы относятся к одним и тем же испытуемым, независимый анализ занижает мощность и искажает ошибку, его использовать нельзя.
  • Забывают про сферичность. Без проверки теста Мокли и поправки Гринхауса-Гайссера значимый результат может оказаться артефактом нарушенного допущения.
  • Путают степени свободы. Знаменатель F считают по (k1)(n1)(k-1)(n-1), а не по k(n1)k(n-1) как в обычном анализе; ошибка в dfdf ведёт к неверному критическому значению.
  • Берут SSиспSS_{исп} в знаменатель. Разброс между испытуемыми выносится отдельно и в F-отношение не входит; иначе теряется весь смысл метода.
  • Игнорируют пропуски. Классический RM-ANOVA требует полных данных по каждому испытуемому: один пропуск выбивает всю строку, для неполных данных нужны смешанные модели.

FAQ

Чем дисперсионный анализ с повторными измерениями отличается от парного t-критерия? Парный t-критерий сравнивает ровно два связанных условия, а RM-ANOVA обобщает его на три и более условий сразу, контролируя общую вероятность ошибки. При k=2k = 2 оба метода дают эквивалентный результат, причём F=t2F = t^2.

Что делать, если нарушена сферичность? Применить поправку степеней свободы: Гринхауса-Гайссера при сильном нарушении или Хьюна-Фельдта при умеренном. Если нарушение грубое, переходят к многомерному подходу (MANOVA) или к смешанным линейным моделям, которые не требуют сферичности.

Сколько нужно испытуемых? Жёсткого минимума нет, но при малом nn степени свободы ошибки (k1)(n1)(k-1)(n-1) быстро падают, и критическое FF растёт. Обычно ориентируются на мощность не ниже 0.80.8 через предварительный расчёт размера выборки по ожидаемому размеру эффекта.

Коротко

Дисперсионный анализ с повторными измерениями применяют, когда одни и те же испытуемые проходят все условия. Полная сумма квадратов раскладывается на три части: условия, испытуемые и ошибка, а критерий считается как F=MSусл/MSошибкиF = MS_{усл}/MS_{ошибки} со степенями свободы k1k-1 и (k1)(n1)(k-1)(n-1). За счёт выноса разброса между испытуемыми из знаменателя метод мощнее обычного ANOVA на тех же данных. Цена этого - допущение сферичности, которое проверяют тестом Мокли и при нарушении правят поправкой Гринхауса-Гайссера.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также