EssayAI
Блог
Блог
Математика и алгоритмы

Условный экстремум: множители Лагранжа без зубрёжки

25 марта 2026Время чтения: 7 минут
#условный экстремум#множители лагранжа#функция лагранжа#окаймлённый гессиан#оптимизация
Условный экстремум: множители Лагранжа без зубрёжки

Условный экстремум - это наибольшее или наименьшее значение функции не на всей области определения, а на множестве, заданном уравнениями связи. Метод множителей Лагранжа сводит такую задачу к поиску безусловного экстремума вспомогательной функции и потому остаётся главным инструментом в курсе математического анализа и в прикладной оптимизации. Ниже разбираем, откуда берутся множители, как составить и решить систему, как отличить минимум от максимума и где студенты чаще всего ошибаются.

Что такое условный экстремум

Пусть нужно исследовать функцию f(x1,,xn)f(x_1,\dots,x_n) на экстремум при ограничениях gi(x1,,xn)=0g_i(x_1,\dots,x_n)=0, где i=1,,mi=1,\dots,m и m<nm<n. Точка xx^* даёт условный экстремум, если она доставляет локальный максимум или минимум ff среди всех точек, удовлетворяющих уравнениям связи. Геометрически связи вырезают в пространстве кривую или поверхность, и мы ищем экстремум именно вдоль неё.

Ключевое отличие от безусловной задачи: точка xx^* может вовсе не быть экстремумом ff как функции на всём Rn\mathbb{R}^n. Например, у функции f(x,y)=x+yf(x,y)=x+y нет безусловного экстремума, но на окружности x2+y2=1x^2+y^2=1 она достигает и максимума, и минимума. Поэтому условный экстремум множители Лагранжа находят там, где обычное приравнивание частных производных к нулю бессильно.

После того как вы поняли постановку, удобно сразу прогнать конкретную задачу через формализм Лагранжа и проверить себя. Ниже - небольшой конструктор: задайте целевую функцию, связь и тип экстремума, и получите разбор с функцией Лагранжа, системой и проверкой.

Идея метода множителей Лагранжа

В точке условного экстремума градиент целевой функции коллинеарен градиентам связей. Это означает, что вдоль допустимых направлений (касательных к множеству связей) производная ff обращается в ноль. Формально условие записывается так:

f(x)=i=1mλigi(x).\nabla f(x^*) = \sum_{i=1}^{m} \lambda_i\, \nabla g_i(x^*).

Числа λi\lambda_i и есть множители Лагранжа. Каждому уравнению связи отвечает свой множитель. Содержательно λi\lambda_i показывает чувствительность экстремального значения ff к сдвигу соответствующего ограничения - это интерпретация Лагранжа как «теневой цены» в экономике.

Почему градиенты обязаны быть коллинеарны? Множество связей - это гладкая поверхность, а допустимые перемещения из точки xx^* лежат в касательной плоскости к ней. Само существование такой касательной плоскости и возможность локально разрешить связь относительно части переменных гарантирует теорема о неявной функции - именно она лежит в основе условия регулярности. Если бы у f\nabla f была ненулевая проекция на эту плоскость, то, двигаясь вдоль связи в нужную сторону, мы бы увеличивали (или уменьшали) ff - и точка не была бы экстремумом. Значит, в экстремуме f\nabla f ортогонален касательной плоскости, то есть лежит в линейной оболочке нормалей gi\nabla g_i. Именно это и записано в формуле выше.

Чтобы не работать с векторным равенством напрямую, вводят функцию Лагранжа.

Функция Лагранжа и система уравнений

Функция Лагранжа объединяет цель и связи в одно выражение:

L(x,λ)=f(x)i=1mλigi(x).L(x,\lambda)=f(x)-\sum_{i=1}^{m}\lambda_i\, g_i(x).

Необходимое условие условного экстремума - равенство нулю всех частных производных LL по переменным xjx_j и по множителям λi\lambda_i:

Lxj=0,Lλi=0.\frac{\partial L}{\partial x_j}=0,\qquad \frac{\partial L}{\partial \lambda_i}=0.

Производные по λi\lambda_i автоматически возвращают уравнения связи gi(x)=0g_i(x)=0, поэтому система содержит и условие стационарности, и сами ограничения. Решения этой системы называют стационарными (критическими) точками; среди них и нужно искать условный экстремум. Для двух переменных и одной связи система выглядит так:

{fxλgx=0,fyλgy=0,g(x,y)=0.\begin{cases} f_x - \lambda g_x = 0,\\ f_y - \lambda g_y = 0,\\ g(x,y)=0. \end{cases}

Знак перед суммой в LL можно брать как минус, так и плюс - это лишь меняет знак найденных λi\lambda_i, на координаты точек не влияет.

Алгоритм решения

  1. Запишите целевую функцию ff и приведите все связи к виду gi=0g_i=0.
  2. Проверьте регулярность: градиенты gi\nabla g_i в подозрительных точках должны быть линейно независимы (условие регулярности связей). Иначе метод может пропустить экстремум.
  3. Составьте L=fλigiL=f-\sum\lambda_i g_i.
  4. Выпишите систему из частных производных и решите её - найдите все стационарные точки и соответствующие λi\lambda_i.
  5. Исследуйте каждую точку на тип: минимум, максимум или ни то ни другое.
  6. Если множество связей замкнуто и ограничено (компакт), сравните значения ff в стационарных точках - наибольшее даёт глобальный максимум, наименьшее минимум (теорема Вейерштрасса гарантирует их существование).

Как отличить минимум от максимума

Необходимое условие не различает максимум и минимум. Для проверки есть два пути.

Первый - содержательный: если множество связей компактно, достаточно подставить координаты всех стационарных точек в ff и сравнить значения. Самое большое - максимум, самое малое - минимум. Этот приём избавляет от второго дифференциала и часто самый быстрый на экзамене.

Второй - формальный, через окаймлённый гессиан (bordered Hessian). Составляют матрицу из вторых производных LL по xjx_j, «окаймлённую» производными связей:

Hˉ=(0gxgygxLxxLxygyLyxLyy).\bar{H}=\begin{pmatrix} 0 & g_x & g_y\\ g_x & L_{xx} & L_{xy}\\ g_y & L_{yx} & L_{yy} \end{pmatrix}.

Знак определителя detHˉ\det\bar{H} в стационарной точке даёт тип экстремума: для задачи с двумя переменными и одной связью detHˉ>0\det\bar{H}>0 отвечает максимуму, detHˉ<0\det\bar{H}<0 - минимуму. В общем случае анализируют знаки последовательности угловых миноров окаймлённого гессиана с учётом числа связей.

Если связь задаёт компакт (например, окружность или отрезок), сравнение значений $f$ в стационарных точках надёжнее и быстрее, чем окаймлённый гессиан.

Разобранный пример

Найдём экстремум f(x,y)=xyf(x,y)=xy при связи x+y=2x+y=2, то есть g(x,y)=x+y2g(x,y)=x+y-2. Функция Лагранжа: L=xyλ(x+y2)L=xy-\lambda(x+y-2). Система:

{yλ=0,xλ=0,x+y2=0.\begin{cases} y-\lambda=0,\\ x-\lambda=0,\\ x+y-2=0. \end{cases}

Из первых двух уравнений x=y=λx=y=\lambda, подстановка в связь даёт x=y=1x=y=1, λ=1\lambda=1. Единственная стационарная точка - (1,1)(1,1), значение f(1,1)=1f(1,1)=1. Связь - прямая, множество не компактно, поэтому проверяем тип через знак: вдоль прямой y=2xy=2-x функция f=x(2x)=2xx2f=x(2-x)=2x-x^2 - парабола ветвями вниз, в вершине x=1x=1 максимум. Значит (1,1)(1,1) - точка условного максимума, fmax=1f_{\max}=1.

Тот же результат даёт окаймлённый гессиан. Здесь Lxx=0L_{xx}=0, Lyy=0L_{yy}=0, Lxy=1L_{xy}=1, а gx=gy=1g_x=g_y=1, поэтому

detHˉ=det(011101110)=2>0,\det\bar{H}=\det\begin{pmatrix} 0 & 1 & 1\\ 1 & 0 & 1\\ 1 & 1 & 0 \end{pmatrix}=2>0,

что по правилу для двух переменных и одной связи подтверждает максимум. Полезно решать задачу обоими способами: сравнение значений ловит глобальный характер на компакте, а гессиан - локальный, и совпадение ответов служит проверкой.

Связь с неравенствами и условиями ККТ

Метод Лагранжа в исходном виде работает с равенствами. Если ограничения заданы неравенствами gi(x)0g_i(x)\le 0, его обобщают до условий Каруша - Куна - Таккера: к стационарности добавляют условия дополняющей нежёсткости λigi=0\lambda_i g_i=0 и знаковые ограничения на множители. Дополняющая нежёсткость означает, что в каждой точке либо ограничение активно (gi=0g_i=0), либо его множитель равен нулю, - неактивное неравенство не влияет на экстремум. Для базового курса достаточно понимать, что классические множители Лагранжа - частный случай ККТ для активных (выполняющихся как равенство) ограничений, поэтому, освоив метод связей-равенств, вы получаете каркас и для задач с неравенствами, и для большинства задач математического программирования. Когда же связи неудобно учитывать напрямую, ограничения «зашивают» в саму цель штрафным слагаемым - этот приём разбирает метод штрафных функций, сводящий условную задачу к серии безусловных.

Частые ошибки

  • Забывают уравнение связи в системе: дифференцируют LL только по xx и yy, но не по λ\lambda, и теряют ограничение.
  • Не проверяют регулярность: в точках, где g=0\nabla g=0, метод неприменим, и настоящий экстремум проскакивает мимо.
  • Останавливаются на необходимом условии и объявляют любую стационарную точку экстремумом, не определив минимум это или максимум.
  • Путают условный экстремум с безусловным: приравнивают к нулю f\nabla f вместо L\nabla L и игнорируют связь.
  • На компакте находят одну точку и забывают, что вторая граница множества может давать другой экстремум.

FAQ

Сколько множителей нужно вводить? Ровно столько, сколько уравнений связи: по одному λi\lambda_i на каждое ограничение gi=0g_i=0.

Можно ли подставить связь в функцию и не вводить множители? Да, если связь легко разрешается относительно одной переменной - тогда задача сводится к безусловному экстремому. Множители Лагранжа удобнее, когда связь неявная или их несколько.

Что означает значение множителя λ\lambda? Это скорость изменения экстремального значения ff при малом сдвиге правой части ограничения - «теневая цена» связи.

Коротко

Условный экстремум ищется на множестве, заданном связями, а метод множителей Лагранжа сводит задачу к стационарным точкам функции L=fλigiL=f-\sum\lambda_i g_i. Выписав систему из производных по переменным и по множителям, находят кандидатов, а затем определяют тип через сравнение значений на компакте или через окаймлённый гессиан. Главное - не забыть уравнения связи, проверить регулярность и довести разбор до вывода о минимуме или максимуме.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также