Распределение хи-квадрат таблица значений: как читать

Когда нужно проверить, согласуются ли наблюдаемые частоты с теоретическими, или сравнить две категориальные переменные на независимость, исследователь обращается к распределению хи-квадрат и его таблице значений. Сама по себе вычисленная статистика ничего не говорит, пока её не с чем сравнить - порог берётся из таблицы критических значений по числу степеней свободы и выбранному уровню значимости. Ниже разберём, как устроена таблица распределения хи-квадрат, как правильно находить в ней нужную ячейку и где типично ошибаются при чтении.
Что такое распределение хи-квадрат
Распределение хи-квадрат с степенями свободы - это распределение суммы квадратов независимых стандартных нормальных величин:
Оно определено только на положительной полуоси, асимметрично (скошено вправо) и зависит от единственного параметра - числа степеней свободы . Математическое ожидание равно , а дисперсия - . С ростом кривая становится всё более симметричной и при больших приближается к нормальной. Именно асимметрия и зависимость формы от делают невозможным «угадать» критическое значение в уме - поэтому и существует таблица распределения хи-квадрат.
Если вам нужно быстро найти критическое значение для конкретных степеней свободы и уровня значимости, соберите запрос в калькуляторе ниже - он подставит ваши параметры и пояснит, как пользоваться таблицей.
Как устроена таблица значений
Таблица распределения хи-квадрат - это двумерная сетка. По строкам отложены степени свободы (обычно от 1 до 30, дальше с шагом), по столбцам - уровень значимости (или, в других вариантах таблицы, доверительная вероятность ). На пересечении строки и столбца стоит критическое значение - квантиль, такой что
То есть в правом хвосте распределения остаётся ровно доля вероятности . Например, для и табличное значение составляет . Это значит: если верна нулевая гипотеза, вероятность получить больше равна всего .
Внимательно смотрите на «шапку» таблицы: в одних источниках столбцы подписаны уровнем значимости α (правый хвост), в других - доверительной вероятностью p = 1−α. Для α = 0,05 это столбцы «0,05» и «0,95» соответственно - значение одно и то же.
Как найти нужное значение: пошагово
Чтобы корректно прочитать таблицу, действуйте по порядку:
- Определите число степеней свободы . Для критерия согласия Пирсона это , где - число категорий (интервалов), а - число оценённых по выборке параметров распределения. Для таблицы сопряжённости степени свободы равны .
- Выберите уровень значимости - чаще всего , реже или .
- Найдите строку с нужным и столбец с нужным .
- Считайте значение на их пересечении - это и есть критическое .
- Сравните с наблюдённой статистикой: если , нулевая гипотеза отвергается.
Логика выбора степеней свободы здесь та же, что и в распределении Стьюдента, где они задают форму кривой: каждый оценённый по данным параметр «съедает» одну степень свободы.
Критерий согласия Пирсона
Самое частое применение таблицы - критерий согласия Пирсона. Он проверяет, насколько наблюдаемые частоты отклоняются от теоретических :
Полученное значение сравнивают с табличным при . Если статистика превышает порог, расхождение между эмпирическими и теоретическими частотами признаётся значимым, и гипотеза о согласии с предполагаемым законом отвергается. Важное техническое условие: критерий работает корректно, когда ожидаемые частоты в каждой ячейке не слишком малы (обычно требуют ), иначе аппроксимация хи-квадрат становится неточной.
Критические значения и уровень значимости
Ключевая закономерность таблицы: при фиксированном критическое значение растёт с увеличением степеней свободы, потому что вместе с растёт и среднее распределения (). А при фиксированном значение растёт с уменьшением : чем строже мы хотим контролировать ошибку первого рода, тем дальше в правый хвост уходит порог.
Не путайте односторонний и двусторонний контекст. Для критерия согласия и проверки независимости берут только правый хвост - отвергают H0 при больших χ². Двусторонняя таблица (с порогами и слева, и справа) нужна лишь для доверительных интервалов на дисперсию, и читается она иначе.
Для больших , выходящих за пределы таблицы, пользуются приближением Уилсона - Хилферти или нормальной аппроксимацией: величина приближённо стандартно-нормальна, что позволяет оценить квантиль без таблицы.
Доверительный интервал для дисперсии
Помимо проверки гипотез, таблица хи-квадрат нужна для интервальной оценки дисперсии нормальной совокупности. Если по выборке объёма получена выборочная дисперсия , то
Здесь из таблицы берутся уже два значения - для и , то есть оба хвоста. Это тот случай, когда нужна именно двусторонняя работа с таблицей. Распределение хи-квадрат входит в «семью» выборочных распределений вместе с распределением Фишера и его критическими значениями: отношение двух независимых , делённых на их степени свободы, как раз и даёт F-распределение.
Частые ошибки
- Берут неверное число степеней свободы. В критерии согласия часто забывают вычесть оценённые параметры: при подгонке нормального закона теряются ещё две степени свободы (на среднее и дисперсию), и , а не .
- Путают столбцы α и p = 1−α. Если шапка подписана доверительной вероятностью, для нужен столбец «0,95», а не «0,05».
- Сравнивают статистику с порогом не в ту сторону. Для критерия Пирсона H0 отвергают при , то есть при больших значениях, а не при малых.
- Применяют критерий при малых ожидаемых частотах. При аппроксимация хи-квадрат ломается; ячейки нужно объединять или использовать точный критерий.
- Используют двустороннюю таблицу там, где нужен один хвост. Для согласия и независимости работает только правый хвост; двусторонние пороги - лишь для доверительных интервалов на дисперсию.
FAQ
Что означают строки и столбцы в таблице хи-квадрат? Строки - это число степеней свободы , столбцы - уровень значимости (или доверительная вероятность ). На пересечении стоит критическое значение , выше которого в правом хвосте лежит доля вероятности .
Как определить степени свободы для критерия Пирсона? По формуле , где - число категорий или интервалов, - число параметров распределения, оценённых по той же выборке. Для таблицы сопряжённости степени свободы равны .
Что делать, если нужного нет в таблице? Для больших степеней свободы применяют нормальную аппроксимацию: , где - квантиль стандартного нормального распределения. Это даёт хорошее приближение критического значения при .
Коротко
Таблица распределения хи-квадрат связывает число степеней свободы и уровень значимости с критическим значением , отсекающим долю в правом хвосте. Чтобы прочитать её правильно, нужно верно посчитать степени свободы (для критерия Пирсона ), выбрать , найти ячейку на пересечении и сравнить наблюдённую статистику с порогом: H0 отвергается при превышении. Для доверительных интервалов на дисперсию таблица используется с обоих хвостов, а за пределами табличных выручает нормальная аппроксимация.
Читайте также

Распределение Фишера критические значения: как искать F-квантили
Распределение Фишера и его критические значения: что такое F-распределение, как читать таблицу критических значений по двум степеням свободы, как применять F-квантили в F-тесте на равенство дисперсий и в дисперсионном анализе.

Распределение Стьюдента степени свободы: как они задают форму
Распределение Стьюдента и его степени свободы: что такое параметр df, как он меняет форму t-распределения, как считать критические значения и применять в t-тестах и доверительных интервалах.

Правило фаз Гиббса: степени свободы системы
Правило фаз Гиббса связывает число степеней свободы, компонентов и фаз равновесной системы. Разбираем вывод формулы F = K − Ф + 2, физический смысл вариантности, частные случаи и применение к диаграммам состояния.