Неравенство Йенсена для выпуклых функций: формулы и применение

Неравенство Йенсена - базовый инструмент анализа, который формализует простую геометрическую идею: график выпуклой функции лежит ниже любой своей хорды, поэтому значение функции в «среднем» не превосходит «среднего» из значений функции. Из этого одного факта выводятся неравенство между средними (AM-GM), неравенство Гёльдера, оценки энтропии и многочисленные результаты теории вероятностей. Ниже разберём дискретную и интегральную формы неравенства Йенсена для выпуклых функций, его доказательство, условие равенства и типичные сценарии применения.
Выпуклые функции: определение и геометрия
Функция называется выпуклой на интервале , если для любых и любого выполнено
Геометрически это означает, что отрезок (хорда), соединяющий точки и , лежит не ниже графика. Если неравенство строгое при и , функцию называют строго выпуклой. Для дважды дифференцируемой выпуклость равносильна условию на . Классические примеры выпуклых функций: , , (на ), .
Подбор функции и проверка выпуклости
Если нужно проверить выпуклость конкретной функции, применить неравенство Йенсена к своему набору точек или к случайной величине - задай функцию, точки или распределение, и в чате соберём проверку , подстановку в формулу и оценку с условием равенства.
Дискретное неравенство Йенсена
Пусть выпукла на , точки , а веса удовлетворяют . Тогда
Это и есть дискретная форма неравенства Йенсена: функция от взвешенного среднего не превосходит взвешенного среднего значений функции. Частный случай - равные веса :
Для вогнутой функции (когда выпукла) знак неравенства меняется на противоположный. Это удобно держать в голове: вогнута, поэтому для неё , что моментально даёт неравенство между средним арифметическим и средним геометрическим.
Доказательство через опорную прямую
Самое короткое доказательство неравенства Йенсена опирается на существование опорной прямой. Пусть - взвешенное среднее, лежащее внутри . У выпуклой функции в точке есть опорная прямая такая, что для всех (если дифференцируема, ). Подставим и просуммируем с весами:
так как и . Это в точности . Дискретный случай можно доказать и по индукции, но метод опорной прямой одинаково работает и для интегральной версии.
Интегральная форма и математическое ожидание
В терминах теории вероятностей неравенство Йенсена формулируется через математическое ожидание. Если - случайная величина со значениями в , а выпукла, то
при условии, что оба математических ожидания существуют. Дискретная форма - частный случай для дискретного распределения с вероятностями , а интегральная - для непрерывного, где . Отсюда сразу следуют полезные оценки: для получаем , то есть дисперсия . Неравенство Йенсена тесно связано с другими интегральными оценками - см. неравенство Гёльдера для интегралов, которое также выводится из выпуклости.
Применение неравенства Йенсена
Неравенство Йенсена для выпуклых функций - рабочий инструмент сразу в нескольких областях:
- Средние величины. AM-GM и неравенство о средних степенных при получаются выбором подходящей выпуклой/вогнутой .
- Теория информации. Неотрицательность расхождения Кульбака-Лейблера доказывается применением Йенсена к выпуклой .
- Финансовая математика. «Выпуклость по Йенсену» объясняет, почему для выпуклого выигрыша превышает - основа оценки опционов.
- Статистика. Смещённость оценок вида при нелинейном объясняется именно неравенством Йенсена.
Условие равенства
Равенство в неравенстве Йенсена достигается в двух случаях. Во-первых, если функция линейна (аффинна) на отрезке, содержащем все точки - тогда хорда совпадает с графиком. Во-вторых, если все точки совпадают: (для случайной величины - почти наверное постоянна). Для строго выпуклой остаётся только второй вариант: равенство возможно тогда и только тогда, когда почти наверное. Это важно при доказательстве строгих оценок - например, строгого неравенства AM-GM при различных слагаемых.
Частые ошибки
- Путают направление неравенства для вогнутых функций. Для вогнутой (например, , ) знак меняется: .
- Забывают условие . Без нормировки весов формула неверна - это не произвольная выпуклая комбинация, а именно взвешенное среднее.
- Применяют к функции, не проверив выпуклость на всём диапазоне точек. Если выпукла лишь на части , а точки выходят за неё, оценка не гарантирована.
- Считают равенство автоматическим. Для строго выпуклой равенство означает вырожденность: все точки равны.
- Смешивают и при оценке смещения. Именно их разница и есть «зазор Йенсена», который нельзя игнорировать.
FAQ
Чем отличается выпуклая функция от вогнутой в контексте Йенсена? Для выпуклой и ; для вогнутой и неравенство разворачивается. Если функция меняет выпуклость на интервале, прямое применение Йенсена невозможно.
Обязательно ли дифференцируема? Нет. Определение выпуклости через хорду не требует дифференцируемости, а у любой выпуклой функции в каждой внутренней точке есть опорная прямая (через односторонние производные). Условие - лишь удобный достаточный признак для гладких функций.
Как связаны неравенство Йенсена и дисперсия? Применяя Йенсена к , получаем , что эквивалентно . Это простейшая иллюстрация «зазора Йенсена».
Коротко
Неравенство Йенсена для выпуклых функций утверждает, что (в дискретной форме - при ), а для вогнутых функций знак меняется. Доказывается через опорную прямую, равенство достигается только при линейности или вырожденности набора точек. Это неравенство - общий источник AM-GM, оценок энтропии, неотрицательности дисперсии и расхождения Кульбака-Лейблера.
Читайте также

Логарифмически нормальное распределение: смысл и формулы
Логарифмически нормальное распределение: плотность, математическое ожидание и дисперсия через параметры μ и σ, связь с нормальным законом, оценка параметров и типовые задачи с примерами расчётов.

Распределение Пуассона: свойства, формула и моменты
Распределение Пуассона: свойства закона редких событий, формула вероятности, математическое ожидание и дисперсия, аддитивность, связь с биномиальным и экспоненциальным законами, примеры расчётов.

Характеристическая функция в теории вероятностей
Характеристическая функция : преобразование Фурье плотности, моменты через производные, теорема Леви о непрерывности и вывод центральной предельной теоремы.