Стандартизованные коэффициенты регрессии бета: разбор

17 июня 2026Время чтения: 7 минут

#эконометрика#регрессия#бета-коэффициент#стандартизация#множественная регрессия

В множественной регрессии часто нужно понять не просто как фактор влияет на результат, а какой из факторов влияет сильнее. Обычные коэффициенты регрессии для этого не годятся: они измеряются в разных единицах, и сравнивать их напрямую бессмысленно. Здесь и появляются стандартизованные коэффициенты регрессии бета. Они переводят все факторы в единый безразмерный масштаб, после чего ранжирование становится корректным. Ниже разберём формулу, расчёт и интерпретацию, а калькулятор поможет проверить свои числа.

Зачем нужны стандартизованные коэффициенты

Представьте регрессию зарплаты на возраст (в годах) и стаж (в месяцах). Коэффициент при возрасте может равняться $1500$ , а при стаже $80$ . Кажется, что возраст важнее в восемнадцать раз, но это иллюзия масштаба: год и месяц измеряют время по-разному, да и разброс самих факторов отличается. Чтобы сравнение было честным, нужно убрать влияние единиц измерения и разброса. Именно это делают стандартизованные коэффициенты регрессии бета: они показывают силу связи в единицах стандартного отклонения, а не в исходных единицах фактора.

После стандартизации все коэффициенты оказываются на одной шкале. Можно посмотреть, у какого фактора абсолютное значение бета больше, и сказать: вот он вносит наибольший вклад в результат. Поэтому бета-коэффициенты ещё называют коэффициентами относительной важности факторов.

Формула бета-коэффициента

Стандартизованный коэффициент получается из обычного коэффициента множественной регрессии умножением на отношение стандартных отклонений фактора и результата:

$\beta_j = b_j \cdot \frac{s_{X_j}}{s_Y},$

где $b_j$ - обычный (нестандартизованный) коэффициент при $j$ -м факторе, $s_{X_j}$ - стандартное отклонение этого фактора, $s_Y$ - стандартное отклонение зависимой переменной. Размерности сокращаются, и бета становится безразмерной величиной.

Перевод обычного коэффициента регрессии в стандартизованный бета-коэффициент через отношение стандартных отклонений

Тот же результат даёт другой путь: предварительно стандартизовать все переменные (вычесть среднее и поделить на стандартное отклонение), а затем оценить регрессию обычным методом наименьших квадратов. Коэффициенты такой регрессии и будут бета-коэффициентами - свободный член при этом обращается в ноль, так как все стандартизованные переменные центрированы. Этот приём удобно держать в голове: он объясняет, почему бета не зависят от единиц измерения.

Как рассчитать на практике

Расчёт сводится к трём шагам. Сначала оцениваем обычную регрессию и получаем коэффициенты $b_j$ - например, через нормальную систему метода наименьших квадратов. Затем считаем выборочные стандартные отклонения каждого фактора и результата. Наконец, подставляем в формулу и получаем $\beta_j$ .

Пусть в регрессии $b_1 = 2{,}5$ при факторе с $s_{X_1} = 4$ , и $s_Y = 5$ . Тогда

$\beta_1 = 2{,}5 \cdot \frac{4}{5} = 2{,}0.$

Если для второго фактора $b_2 = 0{,}8$ , $s_{X_2} = 10$ , то $\beta_2 = 0{,}8 \cdot \tfrac{10}{5} = 1{,}6$ . По обычным коэффициентам первый фактор выглядел втрое сильнее ( $2{,}5$ против $0{,}8$ ), а после стандартизации разрыв сократился: $2{,}0$ против $1{,}6$ . Именно второй вывод корректен. Подставьте свои числа в калькулятор выше и сравните.

Интерпретация значения

Бета-коэффициент читается так: при изменении фактора на одно стандартное отклонение результат меняется на $\beta$ стандартных отклонений, при прочих равных. Если $\beta = 0{,}62$ , то рост фактора на одно его стандартное отклонение тянет результат вверх примерно на $0{,}62$ стандартного отклонения результата.

Сравнение вклада факторов по абсолютной величине стандартизованных бета-коэффициентов

Знак бета совпадает со знаком обычного коэффициента: положительный означает прямую связь, отрицательный - обратную. Для ранжирования важности факторов смотрят на модуль $|\beta_j|$ : чем он больше, тем сильнее фактор влияет на результат внутри данной модели. Это удобно показывать столбчатой диаграммой, где каждый столбик - отдельный фактор.

Свободный член и центрирование

Полезно понять, куда при стандартизации исчезает свободный член. Если все переменные предварительно центрировать (вычесть среднее) и нормировать на стандартное отклонение, то их средние становятся нулями. Линия регрессии проходит через точку средних, а значит при нулевых средних факторов прогноз результата тоже равен нулю - свободный член обращается в ноль. Поэтому в стандартизованной регрессии остаются только наклоны, и именно они и есть бета-коэффициенты. Это не потеря информации: исходный свободный член всегда можно восстановить из средних значений переменных, если он понадобится для прогноза в натуральных единицах.

Из того же свойства следует ещё один практический вывод. Бета не зависят от выбора начала отсчёта факторов: сдвинете шкалу возраста с нуля на любой базовый год - обычный коэффициент не изменится, и бета тоже. А вот смена единицы (годы на месяцы) меняет и $b_j$ , и $s_{X_j}$ так, что их произведение в формуле остаётся прежним. В этом и состоит главное достоинство стандартизации: устойчивость к перешкалированию факторов.

Связь с другими показателями

В парной регрессии стандартизованный коэффициент бета численно равен коэффициенту корреляции между фактором и результатом - отсюда видна тесная связь стандартизации и корреляции. В множественной регрессии такого простого равенства уже нет: бета учитывает совместное влияние всех факторов и очищается от их взаимного пересечения, тогда как парная корреляция этого не делает.

Полезна и связка с коэффициентом эластичности. Бета говорит о вкладе в единицах стандартного отклонения, а средний коэффициент эластичности - о процентном изменении. Это разные ракурсы одной модели: для сравнения важности удобнее бета, для экономического смысла «на сколько процентов» - эластичность. При построении модели часто смотрят и на множественную регрессию и расчёт её коэффициентов целиком, чтобы бета не оторвалась от исходной спецификации.

Когда бета вводят в заблуждение

Стандартизованные коэффициенты - не абсолютная истина. При сильной мультиколлинеарности оценки $b_j$ неустойчивы, а значит и бета пляшут от выборки к выборке: ранжирование становится ненадёжным. Бета также зависят от состава модели: добавили или убрали фактор - изменились стандартные отклонения остатков и сами коэффициенты, а с ними и относительная важность. Поэтому бета корректно сравнивать только внутри одной фиксированной спецификации, а не между разными моделями.

Бета в курсовых и отчётах

В учебных работах по эконометрике бета-коэффициенты обычно появляются в разделе анализа значимости и важности факторов, сразу после оценки модели и проверки её качества. Типичная логика изложения такая: построили множественную регрессию, проверили статистическую значимость коэффициентов, оценили коэффициент детерминации, а затем рассчитали бета, чтобы упорядочить факторы по силе влияния. Бета удобно свести в небольшую таблицу рядом с обычными коэффициентами и стандартными отклонениями, а итог проиллюстрировать столбчатой диаграммой модулей $|\beta_j|$ .

При оформлении важно не подменять понятия. Бета отвечает на вопрос «какой фактор влияет сильнее», но не на вопрос «значим ли фактор» - для значимости есть t-статистика и её p-значение. Бывает, что фактор с большой бета статистически незначим из-за малой выборки, и наоборот. Поэтому в выводах эти два аспекта держат раздельно: сначала значимость, потом относительная важность среди значимых факторов. Такой порядок делает анализ корректным и защищает от типичной ошибки рецензента.

Частые ошибки

Сравнивают силу факторов по обычным коэффициентам $b_j$ без стандартизации - это сравнение величин в разных единицах, оно бессмысленно.
Путают, что делить на что: в формуле стандартное отклонение фактора в числителе, результата - в знаменателе ( $\beta_j = b_j \cdot s_{X_j}/s_Y$ ).
Интерпретируют бета в исходных единицах фактора. Бета безразмерна и говорит про стандартные отклонения, а не про рубли или годы.
Сравнивают бета из двух разных регрессий с разным набором факторов, считая ранжирование переносимым. Состав модели меняет бета.
Игнорируют мультиколлинеарность: при ней бета неустойчивы и выводы о важности факторов ломаются.

FAQ

Может ли бета-коэффициент быть больше единицы? Да. В отличие от парной корреляции, ограниченной диапазоном от $-1$ до $1$ , стандартизованный бета в множественной регрессии может выходить за эти пределы, особенно при коррелированных факторах. Это не ошибка расчёта.

Чем бета отличается от обычного коэффициента? Обычный коэффициент $b_j$ показывает изменение результата в его единицах при изменении фактора на одну его единицу. Бета показывает то же изменение, но в стандартных отклонениях, и потому безразмерна и сравнима между факторами.

Нужно ли стандартизовать зависимую переменную? В формуле через отношение стандартных отклонений отдельно стандартизовать ничего не нужно - деление на $s_Y$ уже учитывает разброс результата. Если же считать бета через регрессию стандартизованных переменных, то стандартизуют и факторы, и результат.

Коротко

Стандартизованные коэффициенты регрессии бета переводят влияние факторов в единый безразмерный масштаб по формуле $\beta_j = b_j \cdot s_{X_j}/s_Y$ , что позволяет честно сравнивать их относительную важность по модулю. Бета читается в стандартных отклонениях, сохраняет знак обычного коэффициента и корректна только внутри одной спецификации модели, а при мультиколлинеарности требует осторожности.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN