EssayAI
Блог
Блог
Математика и алгоритмы

Распределение Стьюдента степени свободы: как они задают форму

20 апреля 2026Время чтения: 6 минут
#распределение стьюдента#степени свободы#t-критерий#доверительный интервал#статистика
Распределение Стьюдента степени свободы: как они задают форму

Когда выборка мала, а дисперсия генеральной совокупности неизвестна, нормальное распределение перестаёт корректно описывать поведение выборочного среднего. На помощь приходит распределение Стьюдента, а его ключевой параметр - степени свободы - определяет, насколько «тяжёлыми» будут хвосты и насколько осторожными должны быть выводы. Ниже разберём, что такое степени свободы в распределении Стьюдента, откуда они берутся, как влияют на форму кривой и как использовать всё это в реальных расчётах: t-критериях и доверительных интервалах.

Что такое распределение Стьюдента

Распределение Стьюдента (t-распределение) возникает, когда мы стандартизуем выборочное среднее, но вместо известного стандартного отклонения σ\sigma подставляем его выборочную оценку ss. Формально, если ZN(0,1)Z \sim N(0,1) и Vχν2V \sim \chi^2_\nu независимы, то величина

T=ZV/νT = \frac{Z}{\sqrt{V/\nu}}

имеет распределение Стьюдента с ν\nu степенями свободы. Плотность распределения симметрична относительно нуля и выглядит как «расплывшаяся» колоколообразная кривая:

f(t)=Γ ⁣(ν+12)νπΓ ⁣(ν2)(1+t2ν)ν+12f(t) = \frac{\Gamma\!\left(\frac{\nu+1}{2}\right)}{\sqrt{\nu\pi}\,\Gamma\!\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu}\right)^{-\frac{\nu+1}{2}}

Единственный параметр здесь - число степеней свободы ν\nu. Именно он управляет всей геометрией кривой, поэтому понимание степеней свободы критично для корректного применения распределения Стьюдента.

Если вам нужно быстро прикинуть критическое значение tt или t-статистику для своей выборки, соберите запрос в калькуляторе ниже - он подставит ваши числа и распишет решение по шагам.

Что такое степени свободы

Степени свободы - это число независимых значений, которые могут варьироваться при оценке параметра. Когда мы вычисляем выборочную дисперсию s2=1n1(xixˉ)2s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2, мы используем выборочное среднее xˉ\bar{x}, которое само оценено по тем же данным. Это «связывает» одно значение: зная среднее и n1n-1 наблюдений, последнее восстанавливается однозначно. Поэтому при оценке дисперсии остаётся n1n-1 независимых отклонений.

Для классической одновыборочной задачи число степеней свободы распределения Стьюдента равно

ν=n1,\nu = n - 1,

где nn - объём выборки. Чем больше наблюдений, тем больше степеней свободы и тем точнее оценка дисперсии. Идея «потери» одной степени свободы на каждый оценённый по данным параметр универсальна и встречается в регрессии, дисперсионном анализе и критерии χ2\chi^2.

Как степени свободы меняют форму кривой

Степени свободы напрямую задают «тяжесть» хвостов t-распределения. При малых ν\nu оценка дисперсии s2s^2 сильно колеблется от выборки к выборке, и эта дополнительная неопределённость растягивает хвосты: экстремальные значения становятся более вероятными, чем у нормального закона. Числовые ориентиры:

  • ν=1\nu = 1 - распределение Коши: настолько тяжёлые хвосты, что математическое ожидание не существует.
  • ν=5\nu = 5 - заметно более широкие хвосты, чем у нормали; критические значения ощутимо больше.
  • ν=30\nu = 30 - кривая почти неотличима от стандартного нормального распределения.
  • ν\nu \to \infty - распределение Стьюдента сходится к N(0,1)N(0,1).

Дисперсия t-распределения равна νν2\frac{\nu}{\nu-2} при ν>2\nu > 2 и всегда превышает единицу, приближаясь к ней с ростом степеней свободы. Именно поэтому при больших выборках статистики спокойно заменяют t-квантили на z-квантили: разница становится пренебрежимо малой.

Критические значения и квантили

На практике нас интересует квантиль tα,νt_{\alpha,\nu} - значение, выше которого лежит доля α\alpha вероятности. Например, для двустороннего теста на уровне значимости α=0,05\alpha = 0{,}05 при ν=9\nu = 9 критическое значение составляет примерно t0,025;92,262t_{0{,}025;\,9} \approx 2{,}262, тогда как нормальное даёт z0,0251,96z_{0{,}025} \approx 1{,}96. Разница в 0,3\approx 0{,}3 - это та самая «плата» за незнание дисперсии и малый объём данных.

Ключевая закономерность: при фиксированном α\alpha критическое значение монотонно убывает с ростом ν\nu. Поэтому одно и то же наблюдённое значение t-статистики может быть значимым на 12 наблюдениях и незначимым на 5 - степени свободы решают исход теста. Логика проверки гипотез подробно разобрана в материале про неравенство Маркова и оценку вероятностей.

Применение в t-критерии

Распределение Стьюдента лежит в основе всех t-тестов. В одновыборочном тесте проверяется гипотеза H0:μ=μ0H_0: \mu = \mu_0 с помощью статистики

t=xˉμ0s/n,t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}},

которая при верной H0H_0 имеет распределение Стьюдента с ν=n1\nu = n-1 степенями свободы. В двухвыборочном тесте Стьюдента с равными дисперсиями степени свободы считаются как ν=n1+n22\nu = n_1 + n_2 - 2, потому что по данным оценивается общая дисперсия и два средних.

Если дисперсии групп не равны, применяют поправку Уэлча, где степени свободы вычисляются по формуле Уэлча - Саттертуэйта и обычно получаются дробными:

ν(s12n1+s22n2)2(s12/n1)2n11+(s22/n2)2n21.\nu \approx \frac{\left(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}\right)^2}{\frac{(s_1^2/n_1)^2}{n_1-1} + \frac{(s_2^2/n_2)^2}{n_2-1}}.

Дробное число степеней свободы - это нормально: оно отражает эффективный объём информации в неоднородных данных.

Доверительные интервалы

При построении доверительного интервала для среднего малой выборки используется именно t-квантиль, а не z-квантиль:

xˉ±tα/2,νsn.\bar{x} \pm t_{\alpha/2,\,\nu} \cdot \frac{s}{\sqrt{n}}.

Поскольку tα/2,ν>zα/2t_{\alpha/2,\nu} > z_{\alpha/2}, интервал, построенный по распределению Стьюдента, всегда шире нормального - он честно учитывает дополнительную неопределённость от оценивания ss. С ростом nn степени свободы увеличиваются, t-квантиль уменьшается, и интервал стягивается, постепенно совпадая с нормальным приближением.

Связь с другими распределениями

Распределение Стьюдента - часть «семьи» выборочных распределений. Квадрат t-величины с ν\nu степенями свободы есть F-распределение с (1,ν)(1, \nu) степенями свободы, что связывает t-тест с дисперсионным анализом. Знаменатель t-статистики содержит корень из χν2/ν\chi^2_\nu/\nu, что отражает связь с распределением хи-квадрат. Понимание характеристических функций и моментов этих распределений помогает увидеть, почему именно нормировка на степени свободы даёт устойчивую к объёму выборки статистику; полезный смежный материал - про характеристическую функцию в теории вероятностей.

Частые ошибки

  • Путают nn и ν\nu. В одновыборочном тесте ν=n1\nu = n - 1, а не nn. На малых выборках эта единица заметно меняет критическое значение.
  • Используют z вместо t на малых данных. При n<30n < 30 замена t-квантиля нормальным занижает доверительный интервал и завышает значимость.
  • Берут ν=n1+n2\nu = n_1 + n_2 в двухвыборочном тесте. Правильно ν=n1+n22\nu = n_1 + n_2 - 2: теряются две степени свободы на два выборочных средних.
  • Игнорируют поправку Уэлча. При неравных дисперсиях обычный t-тест даёт неверные степени свободы и искажённый p-уровень.
  • Считают дробные степени свободы ошибкой. В поправке Уэлча ν\nu почти всегда нецелое - это корректный результат, его не нужно округлять до расчёта квантиля.

FAQ

Чему равны степени свободы в распределении Стьюдента? Для одновыборочной задачи ν=n1\nu = n - 1, где nn - объём выборки. В двухвыборочном тесте с равными дисперсиями ν=n1+n22\nu = n_1 + n_2 - 2, а при поправке Уэлча степени свободы вычисляются по отдельной формуле и могут быть дробными.

Почему t-распределение шире нормального? Потому что дисперсия оценивается по выборке и сама случайна. Эта дополнительная неопределённость утяжеляет хвосты. Чем меньше степеней свободы, тем шире кривая; при ν\nu \to \infty распределение Стьюдента совпадает с N(0,1)N(0,1).

Когда можно заменить t-квантиль на z-квантиль? Практически - при ν30\nu \geq 30, когда разница между квантилями становится меньше нескольких сотых. Однако для строгих расчётов на любых конечных выборках корректнее использовать именно t-квантиль.

Коротко

Распределение Стьюдента описывает стандартизованное выборочное среднее при неизвестной дисперсии, а его единственный параметр - степени свободы - задаёт форму кривой: чем их меньше, тем тяжелее хвосты и больше критические значения. В одновыборочной задаче ν=n1\nu = n-1, в двухвыборочной ν=n1+n22\nu = n_1+n_2-2, а поправка Уэлча даёт дробные степени свободы. Правильный подсчёт ν\nu напрямую определяет исход t-критерия и ширину доверительного интервала, а с ростом выборки распределение Стьюдента плавно переходит в нормальное.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также