Стандартизованные коэффициенты регрессии бета: разбор

В множественной регрессии часто нужно понять не просто как фактор влияет на результат, а какой из факторов влияет сильнее. Обычные коэффициенты регрессии для этого не годятся: они измеряются в разных единицах, и сравнивать их напрямую бессмысленно. Здесь и появляются стандартизованные коэффициенты регрессии бета. Они переводят все факторы в единый безразмерный масштаб, после чего ранжирование становится корректным. Ниже разберём формулу, расчёт и интерпретацию, а калькулятор поможет проверить свои числа.
Зачем нужны стандартизованные коэффициенты
Представьте регрессию зарплаты на возраст (в годах) и стаж (в месяцах). Коэффициент при возрасте может равняться , а при стаже . Кажется, что возраст важнее в восемнадцать раз, но это иллюзия масштаба: год и месяц измеряют время по-разному, да и разброс самих факторов отличается. Чтобы сравнение было честным, нужно убрать влияние единиц измерения и разброса. Именно это делают стандартизованные коэффициенты регрессии бета: они показывают силу связи в единицах стандартного отклонения, а не в исходных единицах фактора.
После стандартизации все коэффициенты оказываются на одной шкале. Можно посмотреть, у какого фактора абсолютное значение бета больше, и сказать: вот он вносит наибольший вклад в результат. Поэтому бета-коэффициенты ещё называют коэффициентами относительной важности факторов.
Формула бета-коэффициента
Стандартизованный коэффициент получается из обычного коэффициента множественной регрессии умножением на отношение стандартных отклонений фактора и результата:
где - обычный (нестандартизованный) коэффициент при -м факторе, - стандартное отклонение этого фактора, - стандартное отклонение зависимой переменной. Размерности сокращаются, и бета становится безразмерной величиной.

Тот же результат даёт другой путь: предварительно стандартизовать все переменные (вычесть среднее и поделить на стандартное отклонение), а затем оценить регрессию обычным методом наименьших квадратов. Коэффициенты такой регрессии и будут бета-коэффициентами - свободный член при этом обращается в ноль, так как все стандартизованные переменные центрированы. Этот приём удобно держать в голове: он объясняет, почему бета не зависят от единиц измерения.
Как рассчитать на практике
Расчёт сводится к трём шагам. Сначала оцениваем обычную регрессию и получаем коэффициенты - например, через нормальную систему метода наименьших квадратов. Затем считаем выборочные стандартные отклонения каждого фактора и результата. Наконец, подставляем в формулу и получаем .
Пусть в регрессии при факторе с , и . Тогда
Если для второго фактора , , то . По обычным коэффициентам первый фактор выглядел втрое сильнее ( против ), а после стандартизации разрыв сократился: против . Именно второй вывод корректен. Подставьте свои числа в калькулятор выше и сравните.
Интерпретация значения
Бета-коэффициент читается так: при изменении фактора на одно стандартное отклонение результат меняется на стандартных отклонений, при прочих равных. Если , то рост фактора на одно его стандартное отклонение тянет результат вверх примерно на стандартного отклонения результата.

Знак бета совпадает со знаком обычного коэффициента: положительный означает прямую связь, отрицательный - обратную. Для ранжирования важности факторов смотрят на модуль : чем он больше, тем сильнее фактор влияет на результат внутри данной модели. Это удобно показывать столбчатой диаграммой, где каждый столбик - отдельный фактор.
Свободный член и центрирование
Полезно понять, куда при стандартизации исчезает свободный член. Если все переменные предварительно центрировать (вычесть среднее) и нормировать на стандартное отклонение, то их средние становятся нулями. Линия регрессии проходит через точку средних, а значит при нулевых средних факторов прогноз результата тоже равен нулю - свободный член обращается в ноль. Поэтому в стандартизованной регрессии остаются только наклоны, и именно они и есть бета-коэффициенты. Это не потеря информации: исходный свободный член всегда можно восстановить из средних значений переменных, если он понадобится для прогноза в натуральных единицах.
Из того же свойства следует ещё один практический вывод. Бета не зависят от выбора начала отсчёта факторов: сдвинете шкалу возраста с нуля на любой базовый год - обычный коэффициент не изменится, и бета тоже. А вот смена единицы (годы на месяцы) меняет и , и так, что их произведение в формуле остаётся прежним. В этом и состоит главное достоинство стандартизации: устойчивость к перешкалированию факторов.
Связь с другими показателями
В парной регрессии стандартизованный коэффициент бета численно равен коэффициенту корреляции между фактором и результатом - отсюда видна тесная связь стандартизации и корреляции. В множественной регрессии такого простого равенства уже нет: бета учитывает совместное влияние всех факторов и очищается от их взаимного пересечения, тогда как парная корреляция этого не делает.
Полезна и связка с коэффициентом эластичности. Бета говорит о вкладе в единицах стандартного отклонения, а средний коэффициент эластичности - о процентном изменении. Это разные ракурсы одной модели: для сравнения важности удобнее бета, для экономического смысла «на сколько процентов» - эластичность. При построении модели часто смотрят и на множественную регрессию и расчёт её коэффициентов целиком, чтобы бета не оторвалась от исходной спецификации.
Когда бета вводят в заблуждение
Стандартизованные коэффициенты - не абсолютная истина. При сильной мультиколлинеарности оценки неустойчивы, а значит и бета пляшут от выборки к выборке: ранжирование становится ненадёжным. Бета также зависят от состава модели: добавили или убрали фактор - изменились стандартные отклонения остатков и сами коэффициенты, а с ними и относительная важность. Поэтому бета корректно сравнивать только внутри одной фиксированной спецификации, а не между разными моделями.
Бета в курсовых и отчётах
В учебных работах по эконометрике бета-коэффициенты обычно появляются в разделе анализа значимости и важности факторов, сразу после оценки модели и проверки её качества. Типичная логика изложения такая: построили множественную регрессию, проверили статистическую значимость коэффициентов, оценили коэффициент детерминации, а затем рассчитали бета, чтобы упорядочить факторы по силе влияния. Бета удобно свести в небольшую таблицу рядом с обычными коэффициентами и стандартными отклонениями, а итог проиллюстрировать столбчатой диаграммой модулей .
При оформлении важно не подменять понятия. Бета отвечает на вопрос «какой фактор влияет сильнее», но не на вопрос «значим ли фактор» - для значимости есть t-статистика и её p-значение. Бывает, что фактор с большой бета статистически незначим из-за малой выборки, и наоборот. Поэтому в выводах эти два аспекта держат раздельно: сначала значимость, потом относительная важность среди значимых факторов. Такой порядок делает анализ корректным и защищает от типичной ошибки рецензента.
Частые ошибки
- Сравнивают силу факторов по обычным коэффициентам без стандартизации - это сравнение величин в разных единицах, оно бессмысленно.
- Путают, что делить на что: в формуле стандартное отклонение фактора в числителе, результата - в знаменателе ().
- Интерпретируют бета в исходных единицах фактора. Бета безразмерна и говорит про стандартные отклонения, а не про рубли или годы.
- Сравнивают бета из двух разных регрессий с разным набором факторов, считая ранжирование переносимым. Состав модели меняет бета.
- Игнорируют мультиколлинеарность: при ней бета неустойчивы и выводы о важности факторов ломаются.
FAQ
Может ли бета-коэффициент быть больше единицы? Да. В отличие от парной корреляции, ограниченной диапазоном от до , стандартизованный бета в множественной регрессии может выходить за эти пределы, особенно при коррелированных факторах. Это не ошибка расчёта.
Чем бета отличается от обычного коэффициента? Обычный коэффициент показывает изменение результата в его единицах при изменении фактора на одну его единицу. Бета показывает то же изменение, но в стандартных отклонениях, и потому безразмерна и сравнима между факторами.
Нужно ли стандартизовать зависимую переменную? В формуле через отношение стандартных отклонений отдельно стандартизовать ничего не нужно - деление на уже учитывает разброс результата. Если же считать бета через регрессию стандартизованных переменных, то стандартизуют и факторы, и результат.
Коротко
Стандартизованные коэффициенты регрессии бета переводят влияние факторов в единый безразмерный масштаб по формуле , что позволяет честно сравнивать их относительную важность по модулю. Бета читается в стандартных отклонениях, сохраняет знак обычного коэффициента и корректна только внутри одной спецификации модели, а при мультиколлинеарности требует осторожности.
Читайте также

Тест Бройша-Годфри: проверка остатков на автокорреляцию
Тест Бройша-Годфри на автокорреляцию остатков регрессии: LM-статистика n·R², выбор числа лагов, сравнение с хи-квадрат, отличие от Дарбина-Уотсона и интерпретация p-значения.

Частный F-критерий: значимость фактора в регрессии
Частный F-критерий проверяет значимость отдельного фактора или группы факторов в множественной регрессии. Формула, сравнение с t-критерием, пошаговый пример расчёта и типичные ошибки.

Доверительный интервал коэффициента регрессии: расчёт
Как рассчитать доверительный интервал коэффициента регрессии: формула через стандартную ошибку и критическое значение Стьюдента, пример вычисления и проверка значимости.