Нелинейная регрессия: линеаризация и МНК

11 июня 2026Время чтения: 10 минут

#нелинейная регрессия#линеаризация#МНК#эконометрика#степенная функция

Нелинейная регрессия встречается в эконометрике там, где связь между переменными явно не прямая: доходы растут медленнее объёма производства, затраты насыщаются по гиперболе, спрос падает по показательной кривой. Прямолинейный МНК здесь не работает напрямую, зато многие нелинейные модели можно свести к линейным заменой переменных. Именно такая замена и называется линеаризацией. Попробуйте калькулятор ниже: он строит исходную нелинейную кривую и сразу показывает её линеаризованный вид.

Что такое линеаризация и зачем она нужна

Линеаризация - это замена переменных, которая превращает нелинейное уравнение в линейное. Применив такую замену, к данным можно приложить обычный МНК, получить коэффициенты прямой в новых координатах, а потом пересчитать их обратно в параметры исходной кривой.

Главное достоинство подхода - простота: не нужны методы нелинейной оптимизации (градиентный спуск, метод Ньютона-Гаусса), достаточно стандартных формул для линейной регрессии, которые выводятся из первых принципов. Главный недостаток - перенос ошибок: после преобразования распределение остатков меняется, и МНК уже не является строго оптимальным оценщиком в смысле теоремы Гаусса-Маркова. На практике для стандартных учебных задач это допустимо, и именно линеаризация чаще всего встречается в эконометрических курсах.

Как степенная кривая y = a·x^b (левая панель) после логарифмирования обеих осей становится прямой ln y = ln a + b·ln x (правая панель). Параметр b отвечает за наклон, а точки данных выстраиваются вдоль прямой

Формально: если у нас есть нелинейная модель $y = f(x; a, b)$ , и существует замена $Y = g(y)$ , $X = h(x)$ такая, что уравнение принимает вид $Y = A + b \cdot X$ , - это и есть линеаризация. При этом $A$ и $b$ находятся как коэффициенты обычной парной регрессии, а параметры исходной модели $a$ и $b$ восстанавливаются обратным преобразованием.

Степенная модель: замена ln y и ln x

Самая распространённая нелинейная модель в эконометрике - степенная (или степенно-функциональная):

y = a \cdot x^b

Прологарифмируем обе части:

\ln y = \ln a + b \cdot \ln x

Обозначим $Y = \ln y$ , $X = \ln x$ , $A = \ln a$ . Получаем обычную линейную модель:

Y = A + b \cdot X

По МНК находим наклон $b$ и свободный член $A$ , после чего параметр масштаба $a = e^A$ . Важно: в степенной модели показатель $b$ напрямую интерпретируется как коэффициент эластичности - насколько процентов меняется $y$ при изменении $x$ на 1 %. Если $b < 1$ , зависимость «тупеющая» (убывающая отдача), если $b > 1$ - «разгоняющаяся» (возрастающая отдача).

Пример: если по данным о производстве и затратах получили $A = 1{,}2$ и $b = 0{,}6$ , то исходная модель имеет вид $y = e^{1{,}2} \cdot x^{0{,}6} \approx 3{,}32 \cdot x^{0{,}6}$ . При увеличении $x$ в два раза затраты возрастают лишь в $2^{0{,}6} \approx 1{,}52$ раза - эффект масштаба налицо.

Показательная модель: замена ln y

Показательная (экспоненциальная) модель:

y = a \cdot e^{b x}

Логарифмируем только $y$ :

\ln y = \ln a + b \cdot x

Здесь $Y = \ln y$ , $X = x$ (без преобразования), $A = \ln a$ . Линейная зависимость $Y = A + b \cdot X$ снова подчиняется МНК. Эта модель используется везде, где переменная растёт или убывает с постоянным относительным темпом: демографические данные, банковские вклады, ВВП при постоянном темпе роста, радиоактивный распад.

Коэффициент $b$ здесь интерпретируется по-другому: при $b = 0{,}05$ это означает, что при увеличении $x$ на 1 единицу $y$ растёт примерно на 5 % (при малых $b$ величина $e^b - 1 \approx b$ ). При $b < 0$ кривая убывает, при $b > 0$ - возрастает.

Гиперболическая модель: замена 1/x

Гиперболическая модель насыщения:

y = a + \frac{b}{x}

Здесь достаточно ввести $X = 1/x$ - и уравнение немедленно становится линейным:

y = a + b \cdot X

Область применения - зависимости, стремящиеся к конечному пределу при росте $x$ : средние издержки на единицу продукции при большом объёме выпуска, предельная производительность труда, насыщение рынка. При больших $x$ величина $1/x \to 0$ , и $y \to a$ : именно $a$ задаёт уровень насыщения. Если $b > 0$ , кривая убывает к $a$ сверху (например, средние постоянные издержки); если $b < 0$ - возрастает снизу.

Три нелинейные кривые и их линеаризованный вид: степенная (двойной логарифм), показательная (полулогарифм), гиперболическая (1/x). Каждый раз нелинейное облако данных становится прямой полосой

На рисунке видно, как для каждого типа модели нелинейное облако точек после правильной замены переменных ложится вдоль прямой. Именно эту прямую оценивает МНК, а затем параметры прямой пересчитываются обратно в кривую.

Формулы МНК после линеаризации

После замены переменных вычисляем параметры линейной модели $Y = A + b \cdot X$ стандартными формулами. Пусть есть $n$ наблюдений $(X_i, Y_i)$ :

b = \frac{n \sum X_i Y_i - \sum X_i \sum Y_i}{n \sum X_i^2 - \left(\sum X_i\right)^2}

A = \bar{Y} - b \cdot \bar{X}

где $\bar{X}$ и $\bar{Y}$ - средние значения. Затем выполняется обратное преобразование к параметрам исходной модели. Для степенной и показательной $a = e^A$ , для гиперболической $a$ и $b$ берутся напрямую.

Альтернативная запись формулы наклона через дисперсию и ковариацию:

b = \frac{\operatorname{Cov}(X, Y)}{\operatorname{Var}(X)} = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sum (X_i - \bar{X})^2}

Эта форма удобна для проверки знака $b$ без полного расчёта: если в линеаризованных координатах данные явно возрастают - наклон положителен, убывают - отрицателен.

Коэффициент детерминации после линеаризации

Чтобы оценить качество подгонки, вычисляют $R^2$ - но уже в линеаризованных координатах:

R^2 = 1 - \frac{\sum (Y_i - \hat{Y}_i)^2}{\sum (Y_i - \bar{Y})^2}

где $\hat{Y}_i = A + b X_i$ - значения, предсказанные линейной моделью. Значение $R^2 \approx 1$ говорит о хорошем соответствии. Важно понимать: $R^2$ в преобразованных координатах не совпадает с $R^2$ , посчитанным по исходным $y_i$ и $\hat{y}_i$ , - это разные величины. Обычно сообщают именно первую, поскольку МНК оптимален именно в линейном пространстве.

Пример: при степенной модели с $a = 2$ , $b = 0{,}6$ и $n = 10$ синтетическими точками с 12 % шумом $R^2$ в лог-лог координатах обычно составляет 0{,}97–0{,}99 - шум малый, и линеаризованная прямая хорошо описывает данные. Это можно проверить прямо в калькуляторе выше.

Какую модель выбрать

Выбор модели опирается на содержательные соображения и визуальный анализ:

График $y$ от $x$ имеет выраженный параболический или степенной характер, и данные строго положительны - вероятно, степенная модель.
Кривая монотонно убывает к нулю при росте $x$ , или наоборот, взрывной рост с постоянным относительным приростом - показательная модель.
Данные убывают «по закону 1/x» и явно стремятся к горизонтальной асимптоте - гиперболическая.

Практический приём - построить точечные диаграммы в разных системах координат (лог-лог, полулог, $1/x$ против $y$ ) и посмотреть, в какой из них данные лежат «прямее» всего. Там же сравнивают $R^2$ : у какой системы он выше - та модель лучше соответствует данным. Впрочем, это лишь описательный критерий; формальная проверка требует анализа остатков.

Когда ни одна из трёх стандартных линеаризаций не даёт прямого рассеяния, прибегают к методам нелинейной регрессии (алгоритм Гаусса-Ньютона или методы нулевого порядка типа Нелдера-Мида) или выбирают другой класс функций - например, логистическую кривую для S-образной зависимости.

Числовой пример: степенная регрессия шаг за шагом

Рассмотрим набор из пяти наблюдений: $x = [1, 2, 3, 4, 5]$ , $y = [1{,}8; 2{,}9; 3{,}7; 4{,}3; 4{,}9]$ . Предположим степенную форму $y = a \cdot x^b$ .

Шаг 1. Логарифмируем: $X_i = \ln x_i$ , $Y_i = \ln y_i$ .

$x_i$	$y_i$	$X_i = \ln x_i$	$Y_i = \ln y_i$
1	1,80	0,000	0,588
2	2,90	0,693	1,065
3	3,70	1,099	1,308
4	4,30	1,386	1,459
5	4,90	1,609	1,589

Шаг 2. Считаем суммы: $\sum X_i \approx 4{,}787$ , $\sum Y_i \approx 6{,}009$ , $\sum X_i^2 \approx 6{,}461$ , $\sum X_i Y_i \approx 6{,}547$ .

Шаг 3. МНК-оценки:

b = \frac{5 \cdot 6{,}547 - 4{,}787 \cdot 6{,}009}{5 \cdot 6{,}461 - 4{,}787^2} \approx \frac{32{,}735 - 28{,}765}{32{,}305 - 22{,}916} \approx \frac{3{,}970}{9{,}389} \approx 0{,}423

A = \frac{6{,}009}{5} - 0{,}423 \cdot \frac{4{,}787}{5} \approx 1{,}202 - 0{,}405 = 0{,}797

Шаг 4. Обратное преобразование: $a = e^{0{,}797} \approx 2{,}219$ .

Итог: $y \approx 2{,}22 \cdot x^{0{,}42}$ - степенная кривая с показателем меньше 1 (убывающая отдача).

Частые ошибки

Не проверить знак исходных данных. Логарифм не определён при $y \le 0$ или $x \le 0$ - если данные включают нули или отрицательные значения, степенная и показательная линеаризации неприменимы напрямую.
Перепутать обратное преобразование $a$ . После МНК находят $A = \ln a$ ; параметр исходной модели $a = e^A$ , а не $A$ . Ошибка приводит к тому, что в ответе фигурирует коэффициент прямой, а не кривой.
Интерпретировать $R^2$ в линеаризованных координатах как $R^2$ по исходным данным. Это разные числа; сравнивать их некорректно и нельзя делать вывод о качестве подгонки к исходным $y$ .
Использовать линеаризацию, когда зависимость не принадлежит выбранному классу. Хорошее $R^2$ в лог-лог координатах не доказывает степенную природу - нужна содержательная обоснованность.
Не обсуждать корректность линеаризации при нарушении предпосылок. Преобразование меняет структуру ошибок, и обычные формулы стандартных ошибок коэффициентов строго применимы лишь при гомоскедастичности в новых координатах.

FAQ

Чем отличается линеаризация от нелинейной регрессии методом МНК? Линеаризация - это предварительная замена переменных, после которой задача сводится к стандартному линейному МНК. Нелинейный МНК напрямую минимизирует сумму квадратов остатков в исходных координатах, обычно итеративно (алгоритм Гаусса-Ньютона, Левенберга-Марквардта). Нелинейный МНК точнее с точки зрения статистических свойств, но требует начального приближения и сложнее; линеаризация быстрее и прозрачнее, поэтому её используют в учебных задачах и как первое приближение.

Можно ли линеаризовать полиномиальную регрессию? Полином $y = b_0 + b_1 x + b_2 x^2 + \dots$ - это уже линейная модель по параметрам $b_i$ , просто с нелинейными предикторами $x^k$ . Замена переменных $X_k = x^k$ переводит её в стандартную множественную линейную регрессию - без логарифмов. Это случай, когда «нелинейность по аргументу» не означает «нелинейность по параметрам».

Как проверить, подходит ли выбранная нелинейная форма? Постройте график остатков линеаризованной модели против $X$ : если остатки случайны и не имеют систематического паттерна - форма выбрана верно. Если остатки образуют дугу или «S» - нужна другая функциональная форма. Дополнительно можно использовать тест Рамсея (RESET) или сравнить информационные критерии AIC/BIC для нескольких конкурирующих форм.

Коротко

Линеаризация нелинейной регрессии - замена переменных (логарифмирование, обращение), после которой нелинейная модель принимает вид прямой. МНК применяется к данным в новых координатах, а коэффициенты исходной модели восстанавливаются обратным преобразованием. Наиболее часто линеаризуют степенную ( $\ln y$ и $\ln x$ , коэффициент $b$ - эластичность), показательную ( $\ln y$ при $x$ , коэффициент $b$ - темп роста) и гиперболическую ( $y$ при $1/x$ , параметр $a$ - асимптота) модели. Качество оценивается по $R^2$ в линеаризованных координатах, а выбор типа кривой - по визуальному анализу и содержательным соображениям.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN