EssayAI
Блог
Блог
Математика и алгоритмы

Неравенство Йенсена для выпуклых функций: формулы и применение

13 мая 2026Время чтения: 6 минут
#неравенство Йенсена#выпуклая функция#математическое ожидание#теория вероятностей#выпуклость
Неравенство Йенсена для выпуклых функций: формулы и применение

Неравенство Йенсена - базовый инструмент анализа, который формализует простую геометрическую идею: график выпуклой функции лежит ниже любой своей хорды, поэтому значение функции в «среднем» не превосходит «среднего» из значений функции. Из этого одного факта выводятся неравенство между средними (AM-GM), неравенство Гёльдера, оценки энтропии и многочисленные результаты теории вероятностей. Ниже разберём дискретную и интегральную формы неравенства Йенсена для выпуклых функций, его доказательство, условие равенства и типичные сценарии применения.

Выпуклые функции: определение и геометрия

Функция ff называется выпуклой на интервале II, если для любых x1,x2Ix_1, x_2 \in I и любого λ[0,1]\lambda \in [0, 1] выполнено

f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2).f\big(\lambda x_1 + (1 - \lambda) x_2\big) \le \lambda f(x_1) + (1 - \lambda) f(x_2).

Геометрически это означает, что отрезок (хорда), соединяющий точки (x1,f(x1))(x_1, f(x_1)) и (x2,f(x2))(x_2, f(x_2)), лежит не ниже графика. Если неравенство строгое при x1x2x_1 \ne x_2 и λ(0,1)\lambda \in (0, 1), функцию называют строго выпуклой. Для дважды дифференцируемой ff выпуклость равносильна условию f(x)0f''(x) \ge 0 на II. Классические примеры выпуклых функций: f(x)=x2f(x) = x^2, f(x)=exf(x) = e^x, f(x)=lnxf(x) = -\ln x (на x>0x > 0), f(x)=xf(x) = |x|.

Подбор функции и проверка выпуклости

Если нужно проверить выпуклость конкретной функции, применить неравенство Йенсена к своему набору точек или к случайной величине - задай функцию, точки или распределение, и в чате соберём проверку f0f'' \ge 0, подстановку в формулу и оценку с условием равенства.

Дискретное неравенство Йенсена

Пусть ff выпукла на II, точки x1,,xnIx_1, \dots, x_n \in I, а веса λ1,,λn0\lambda_1, \dots, \lambda_n \ge 0 удовлетворяют i=1nλi=1\sum_{i=1}^n \lambda_i = 1. Тогда

f(i=1nλixi)i=1nλif(xi).f\left(\sum_{i=1}^n \lambda_i x_i\right) \le \sum_{i=1}^n \lambda_i f(x_i).

Это и есть дискретная форма неравенства Йенсена: функция от взвешенного среднего не превосходит взвешенного среднего значений функции. Частный случай - равные веса λi=1/n\lambda_i = 1/n:

f(1ni=1nxi)1ni=1nf(xi).f\left(\frac{1}{n}\sum_{i=1}^n x_i\right) \le \frac{1}{n}\sum_{i=1}^n f(x_i).

Для вогнутой функции (когда f-f выпукла) знак неравенства меняется на противоположный. Это удобно держать в голове: lnx\ln x вогнута, поэтому для неё ln(1nxi)1nlnxi\ln\big(\tfrac1n\sum x_i\big) \ge \tfrac1n\sum \ln x_i, что моментально даёт неравенство между средним арифметическим и средним геометрическим.

Доказательство через опорную прямую

Самое короткое доказательство неравенства Йенсена опирается на существование опорной прямой. Пусть m=iλixim = \sum_i \lambda_i x_i - взвешенное среднее, лежащее внутри II. У выпуклой функции в точке mm есть опорная прямая (x)=f(m)+k(xm)\ell(x) = f(m) + k(x - m) такая, что f(x)(x)f(x) \ge \ell(x) для всех xIx \in I (если ff дифференцируема, k=f(m)k = f'(m)). Подставим xix_i и просуммируем с весами:

iλif(xi)iλi(f(m)+k(xim))=f(m)+k(iλixim)=f(m),\sum_i \lambda_i f(x_i) \ge \sum_i \lambda_i \big(f(m) + k(x_i - m)\big) = f(m) + k\Big(\sum_i \lambda_i x_i - m\Big) = f(m),

так как iλixi=m\sum_i \lambda_i x_i = m и iλi=1\sum_i \lambda_i = 1. Это в точности f(m)iλif(xi)f(m) \le \sum_i \lambda_i f(x_i). Дискретный случай можно доказать и по индукции, но метод опорной прямой одинаково работает и для интегральной версии.

Интегральная форма и математическое ожидание

В терминах теории вероятностей неравенство Йенсена формулируется через математическое ожидание. Если XX - случайная величина со значениями в II, а ff выпукла, то

f(E[X])E[f(X)],f\big(\mathbb{E}[X]\big) \le \mathbb{E}\big[f(X)\big],

при условии, что оба математических ожидания существуют. Дискретная форма - частный случай для дискретного распределения с вероятностями λi\lambda_i, а интегральная - для непрерывного, где E[X]=xdP\mathbb{E}[X] = \int x \, dP. Отсюда сразу следуют полезные оценки: для f(x)=x2f(x) = x^2 получаем (EX)2E[X2](\mathbb{E}X)^2 \le \mathbb{E}[X^2], то есть дисперсия Var(X)=E[X2](EX)20\operatorname{Var}(X) = \mathbb{E}[X^2] - (\mathbb{E}X)^2 \ge 0. Неравенство Йенсена тесно связано с другими интегральными оценками - см. неравенство Гёльдера для интегралов, которое также выводится из выпуклости.

Применение неравенства Йенсена

Неравенство Йенсена для выпуклых функций - рабочий инструмент сразу в нескольких областях:

  • Средние величины. AM-GM и неравенство о средних степенных MpMqM_p \le M_q при pqp \le q получаются выбором подходящей выпуклой/вогнутой ff.
  • Теория информации. Неотрицательность расхождения Кульбака-Лейблера DKL(PQ)0D_{\mathrm{KL}}(P \| Q) \ge 0 доказывается применением Йенсена к выпуклой ln-\ln.
  • Финансовая математика. «Выпуклость по Йенсену» объясняет, почему E[f(X)]\mathbb{E}[f(X)] для выпуклого выигрыша ff превышает f(EX)f(\mathbb{E}X) - основа оценки опционов.
  • Статистика. Смещённость оценок вида g(θ^)g(\hat\theta) при нелинейном gg объясняется именно неравенством Йенсена.

Условие равенства

Равенство в неравенстве Йенсена достигается в двух случаях. Во-первых, если функция ff линейна (аффинна) на отрезке, содержащем все точки xix_i - тогда хорда совпадает с графиком. Во-вторых, если все точки совпадают: x1==xnx_1 = \dots = x_n (для случайной величины - XX почти наверное постоянна). Для строго выпуклой ff остаётся только второй вариант: равенство f(EX)=E[f(X)]f(\mathbb{E}X) = \mathbb{E}[f(X)] возможно тогда и только тогда, когда X=constX = \operatorname{const} почти наверное. Это важно при доказательстве строгих оценок - например, строгого неравенства AM-GM при различных слагаемых.

Частые ошибки

  • Путают направление неравенства для вогнутых функций. Для вогнутой ff (например, ln\ln, x\sqrt{x}) знак меняется: f(EX)E[f(X)]f(\mathbb{E}X) \ge \mathbb{E}[f(X)].
  • Забывают условие λi=1\sum \lambda_i = 1. Без нормировки весов формула неверна - это не произвольная выпуклая комбинация, а именно взвешенное среднее.
  • Применяют к функции, не проверив выпуклость на всём диапазоне точек. Если ff выпукла лишь на части II, а точки выходят за неё, оценка не гарантирована.
  • Считают равенство автоматическим. Для строго выпуклой ff равенство означает вырожденность: все точки равны.
  • Смешивают E[f(X)]\mathbb{E}[f(X)] и f(EX)f(\mathbb{E}X) при оценке смещения. Именно их разница и есть «зазор Йенсена», который нельзя игнорировать.

FAQ

Чем отличается выпуклая функция от вогнутой в контексте Йенсена? Для выпуклой f0f''\ge 0 и f(EX)E[f(X)]f(\mathbb{E}X)\le\mathbb{E}[f(X)]; для вогнутой f0f''\le 0 и неравенство разворачивается. Если функция меняет выпуклость на интервале, прямое применение Йенсена невозможно.

Обязательно ли ff дифференцируема? Нет. Определение выпуклости через хорду не требует дифференцируемости, а у любой выпуклой функции в каждой внутренней точке есть опорная прямая (через односторонние производные). Условие f0f''\ge 0 - лишь удобный достаточный признак для гладких функций.

Как связаны неравенство Йенсена и дисперсия? Применяя Йенсена к f(x)=x2f(x)=x^2, получаем (EX)2E[X2](\mathbb{E}X)^2\le\mathbb{E}[X^2], что эквивалентно Var(X)0\operatorname{Var}(X)\ge 0. Это простейшая иллюстрация «зазора Йенсена».

Коротко

Неравенство Йенсена для выпуклых функций утверждает, что f(EX)E[f(X)]f(\mathbb{E}X)\le\mathbb{E}[f(X)] (в дискретной форме - f(λixi)λif(xi)f(\sum\lambda_i x_i)\le\sum\lambda_i f(x_i) при λi=1\sum\lambda_i=1), а для вогнутых функций знак меняется. Доказывается через опорную прямую, равенство достигается только при линейности ff или вырожденности набора точек. Это неравенство - общий источник AM-GM, оценок энтропии, неотрицательности дисперсии и расхождения Кульбака-Лейблера.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также