Распределение Стьюдента: роль степеней свободы

20 апреля 2026Время чтения: 6 минут

#распределение стьюдента#степени свободы#t-критерий#доверительный интервал#статистика

Когда выборка мала, а дисперсия генеральной совокупности неизвестна, нормальное распределение перестаёт корректно описывать поведение выборочного среднего. На помощь приходит распределение Стьюдента, а его ключевой параметр - степени свободы - определяет, насколько «тяжёлыми» будут хвосты и насколько осторожными должны быть выводы. Ниже разберём, что такое степени свободы в распределении Стьюдента, откуда они берутся, как влияют на форму кривой и как использовать всё это в реальных расчётах: t-критериях и доверительных интервалах.

Что такое распределение Стьюдента

Распределение Стьюдента (t-распределение) возникает, когда мы стандартизуем выборочное среднее, но вместо известного стандартного отклонения $\sigma$ подставляем его выборочную оценку $s$ . Формально, если $Z \sim N(0,1)$ и $V \sim \chi^2_\nu$ независимы, то величина

$T = \frac{Z}{\sqrt{V/\nu}}$

имеет распределение Стьюдента с $\nu$ степенями свободы. Плотность распределения симметрична относительно нуля и выглядит как «расплывшаяся» колоколообразная кривая:

$f(t) = \frac{\Gamma\!\left(\frac{\nu+1}{2}\right)}{\sqrt{\nu\pi}\,\Gamma\!\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu}\right)^{-\frac{\nu+1}{2}}$

Единственный параметр здесь - число степеней свободы $\nu$ . Именно он управляет всей геометрией кривой, поэтому понимание степеней свободы критично для корректного применения распределения Стьюдента.

Если вам нужно быстро прикинуть критическое значение $t$ или t-статистику для своей выборки, соберите запрос в калькуляторе ниже - он подставит ваши числа и распишет решение по шагам.

Что такое степени свободы

Степени свободы - это число независимых значений, которые могут варьироваться при оценке параметра. Когда мы вычисляем выборочную дисперсию $s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2$ , мы используем выборочное среднее $\bar{x}$ , которое само оценено по тем же данным. Это «связывает» одно значение: зная среднее и $n-1$ наблюдений, последнее восстанавливается однозначно. Поэтому при оценке дисперсии остаётся $n-1$ независимых отклонений.

Для классической одновыборочной задачи число степеней свободы распределения Стьюдента равно

$\nu = n - 1,$

где $n$ - объём выборки. Чем больше наблюдений, тем больше степеней свободы и тем точнее оценка дисперсии. Идея «потери» одной степени свободы на каждый оценённый по данным параметр универсальна и встречается в регрессии, дисперсионном анализе и критерии $\chi^2$ .

Как степени свободы меняют форму кривой

Степени свободы напрямую задают «тяжесть» хвостов t-распределения. При малых $\nu$ оценка дисперсии $s^2$ сильно колеблется от выборки к выборке, и эта дополнительная неопределённость растягивает хвосты: экстремальные значения становятся более вероятными, чем у нормального закона. Числовые ориентиры:

$\nu = 1$ - распределение Коши: настолько тяжёлые хвосты, что математическое ожидание не существует.
$\nu = 5$ - заметно более широкие хвосты, чем у нормали; критические значения ощутимо больше.
$\nu = 30$ - кривая почти неотличима от стандартного нормального распределения.
$\nu \to \infty$ - распределение Стьюдента сходится к $N(0,1)$ .

Дисперсия t-распределения равна $\frac{\nu}{\nu-2}$ при $\nu > 2$ и всегда превышает единицу, приближаясь к ней с ростом степеней свободы. Именно поэтому при больших выборках статистики спокойно заменяют t-квантили на z-квантили: разница становится пренебрежимо малой.

Критические значения и квантили

На практике нас интересует квантиль $t_{\alpha,\nu}$ - значение, выше которого лежит доля $\alpha$ вероятности. Например, для двустороннего теста на уровне значимости $\alpha = 0{,}05$ при $\nu = 9$ критическое значение составляет примерно $t_{0{,}025;\,9} \approx 2{,}262$ , тогда как нормальное даёт $z_{0{,}025} \approx 1{,}96$ . Разница в $\approx 0{,}3$ - это та самая «плата» за незнание дисперсии и малый объём данных.

Ключевая закономерность: при фиксированном $\alpha$ критическое значение монотонно убывает с ростом $\nu$ . Поэтому одно и то же наблюдённое значение t-статистики может быть значимым на 12 наблюдениях и незначимым на 5 - степени свободы решают исход теста. Логика проверки гипотез подробно разобрана в материале про неравенство Маркова и оценку вероятностей.

Применение в t-критерии

Распределение Стьюдента лежит в основе всех t-тестов. В одновыборочном тесте проверяется гипотеза $H_0: \mu = \mu_0$ с помощью статистики

$t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}},$

которая при верной $H_0$ имеет распределение Стьюдента с $\nu = n-1$ степенями свободы. В двухвыборочном тесте Стьюдента с равными дисперсиями степени свободы считаются как $\nu = n_1 + n_2 - 2$ , потому что по данным оценивается общая дисперсия и два средних.

Если дисперсии групп не равны, применяют поправку Уэлча, где степени свободы вычисляются по формуле Уэлча - Саттертуэйта и обычно получаются дробными:

$\nu \approx \frac{\left(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}\right)^2}{\frac{(s_1^2/n_1)^2}{n_1-1} + \frac{(s_2^2/n_2)^2}{n_2-1}}.$

Дробное число степеней свободы - это нормально: оно отражает эффективный объём информации в неоднородных данных.

Доверительные интервалы

При построении доверительного интервала для среднего малой выборки используется именно t-квантиль, а не z-квантиль:

$\bar{x} \pm t_{\alpha/2,\,\nu} \cdot \frac{s}{\sqrt{n}}.$

Поскольку $t_{\alpha/2,\nu} > z_{\alpha/2}$ , интервал, построенный по распределению Стьюдента, всегда шире нормального - он честно учитывает дополнительную неопределённость от оценивания $s$ . С ростом $n$ степени свободы увеличиваются, t-квантиль уменьшается, и интервал стягивается, постепенно совпадая с нормальным приближением.

Связь с другими распределениями

Распределение Стьюдента - часть «семьи» выборочных распределений. Квадрат t-величины с $\nu$ степенями свободы есть F-распределение с $(1, \nu)$ степенями свободы, что связывает t-тест с дисперсионным анализом. Знаменатель t-статистики содержит корень из $\chi^2_\nu/\nu$ , что отражает связь с распределением хи-квадрат. Понимание характеристических функций и моментов этих распределений помогает увидеть, почему именно нормировка на степени свободы даёт устойчивую к объёму выборки статистику; полезный смежный материал - про характеристическую функцию в теории вероятностей.

Частые ошибки

Путают $n$ и $\nu$ . В одновыборочном тесте $\nu = n - 1$ , а не $n$ . На малых выборках эта единица заметно меняет критическое значение.
Используют z вместо t на малых данных. При $n < 30$ замена t-квантиля нормальным занижает доверительный интервал и завышает значимость.
Берут $\nu = n_1 + n_2$ в двухвыборочном тесте. Правильно $\nu = n_1 + n_2 - 2$ : теряются две степени свободы на два выборочных средних.
Игнорируют поправку Уэлча. При неравных дисперсиях обычный t-тест даёт неверные степени свободы и искажённый p-уровень.
Считают дробные степени свободы ошибкой. В поправке Уэлча $\nu$ почти всегда нецелое - это корректный результат, его не нужно округлять до расчёта квантиля.

FAQ

Чему равны степени свободы в распределении Стьюдента? Для одновыборочной задачи $\nu = n - 1$ , где $n$ - объём выборки. В двухвыборочном тесте с равными дисперсиями $\nu = n_1 + n_2 - 2$ , а при поправке Уэлча степени свободы вычисляются по отдельной формуле и могут быть дробными.

Почему t-распределение шире нормального? Потому что дисперсия оценивается по выборке и сама случайна. Эта дополнительная неопределённость утяжеляет хвосты. Чем меньше степеней свободы, тем шире кривая; при $\nu \to \infty$ распределение Стьюдента совпадает с $N(0,1)$ .

Когда можно заменить t-квантиль на z-квантиль? Практически - при $\nu \geq 30$ , когда разница между квантилями становится меньше нескольких сотых. Однако для строгих расчётов на любых конечных выборках корректнее использовать именно t-квантиль.

Коротко

Распределение Стьюдента описывает стандартизованное выборочное среднее при неизвестной дисперсии, а его единственный параметр - степени свободы - задаёт форму кривой: чем их меньше, тем тяжелее хвосты и больше критические значения. В одновыборочной задаче $\nu = n-1$ , в двухвыборочной $\nu = n_1+n_2-2$ , а поправка Уэлча даёт дробные степени свободы. Правильный подсчёт $\nu$ напрямую определяет исход t-критерия и ширину доверительного интервала, а с ростом выборки распределение Стьюдента плавно переходит в нормальное.