EssayAI
Блог
Блог
Математика и алгоритмы

Неравенство Маркова в теории вероятностей

31 января 2026Время чтения: 7 минут
#неравенство Маркова#теория вероятностей#оценка хвоста#неравенство Чебышёва#матожидание
Неравенство Маркова в теории вероятностей

Неравенство Маркова - простейший из инструментов, который позволяет оценить вероятность того, что случайная величина «выскочила далеко вправо», зная только её математическое ожидание. Никаких предположений о форме распределения, никакой дисперсии, никакой плотности - только неотрицательность и конечное E[X]E[X]. Именно поэтому неравенство Маркова - стартовая точка для большинства концентрационных неравенств: из него выводится неравенство Чебышёва, экспоненциальное неравенство Чернова, оценка Беннета, а в паре с неравенством Гёльдера для интегралов - и более тонкие моментные оценки.

Формулировка неравенства Маркова

Пусть XX - неотрицательная случайная величина с конечным математическим ожиданием E[X]E[X]. Тогда для любого a>0a > 0 выполнено

P(Xa)E[X]a.P(X \ge a) \le \frac{E[X]}{a}.

Эквивалентная форма с t=a/E[X]t = a/E[X] при E[X]>0E[X] > 0:

P(XtE[X])1t,t1.P(X \ge t \cdot E[X]) \le \frac{1}{t}, \quad t \ge 1.

Это значит: вероятность того, что XX окажется в tt раз больше своего среднего, не превышает 1/t1/t. При t=2t = 2 - не больше половины, при t=10t = 10 - не больше десятой доли. Условие неотрицательности существенно: для XX, принимающей и отрицательные значения, оценка неверна, и её сначала переводят на X|X| или на XminXX - \min X.

Подстановка в калькуляторе

Чтобы получить численную оценку под свою пару (E[X],a)(E[X], a), не считая в уме: введи матожидание и порог, нажми «Показать ответ» - соберём подстановку в P(Xa)E[X]/aP(X \ge a) \le E[X]/a, посчитаем дробь и обсудим, когда оценка реально что-то говорит, а когда вырождается в тривиальное P1P \le 1.

Доказательство (набросок)

Идея - представить ожидание как интеграл по индикатору и обрезать снизу. Для неотрицательной XX и фиксированного a>0a > 0:

E[X]=E[X1Xa]+E[X1X<a]E[X1Xa]aE[1Xa]=aP(Xa).E[X] = E[X \cdot \mathbf{1}_{X \ge a}] + E[X \cdot \mathbf{1}_{X < a}] \ge E[X \cdot \mathbf{1}_{X \ge a}] \ge a \cdot E[\mathbf{1}_{X \ge a}] = a \cdot P(X \ge a).

Первое неравенство - потому что обе слагаемые неотрицательны (тут и нужно X0X \ge 0). Второе - потому что на событии {Xa}\{X \ge a\} значение XX не меньше aa. Делим на aa - и получаем нужную форму. Дискретный и непрерывный случаи разбираются одинаково: меняется только обозначение, \sum или \int, суть та же.

Типовые задачи

В большинстве учебных задач неравенство Маркова применяется в трёх сценариях.

Оценка вероятности «большого» отклонения. Пусть среднее число опечаток на странице рукописи равно E[X]=2E[X] = 2. Тогда P(X10)2/10=0,2P(X \ge 10) \le 2/10 = 0{,}2 - вероятность встретить страницу с десятью и более опечатками не превышает 20%. Никаких допущений о распределении не делалось.

Сведение к неотрицательности. Если YY - произвольная случайная величина, а нас интересует P(YE[Y]a)P(|Y - E[Y]| \ge a), формулу применяют к X=(YE[Y])2X = (Y - E[Y])^2. Это и есть стандартный шаг к неравенству Чебышёва: XX неотрицательна, её матожидание - дисперсия D[Y]D[Y], и

P(YE[Y]a)=P((YE[Y])2a2)D[Y]a2.P(|Y - E[Y]| \ge a) = P\big((Y - E[Y])^2 \ge a^2\big) \le \frac{D[Y]}{a^2}.

Концентрационные оценки. Применяя неравенство Маркова к экспоненциальной функции eλXe^{\lambda X} и минимизируя по λ>0\lambda > 0, получают границу Чернова:

P(Xa)infλ>0E[eλX]eλa.P(X \ge a) \le \inf_{\lambda > 0} \frac{E[e^{\lambda X}]}{e^{\lambda a}}.

Это уже даёт экспоненциально малую оценку для суммы независимых ограниченных величин - основа теории больших уклонений и качественных результатов вроде леммы Бореля-Кантелли о почти наверной сходимости.

Связь с неравенством Чебышёва

Неравенство Чебышёва - частный случай неравенства Маркова, применённый к квадрату центрированной величины. Формально:

P(YE[Y]kσ)1k2,P(|Y - E[Y]| \ge k \sigma) \le \frac{1}{k^2},

где σ=D[Y]\sigma = \sqrt{D[Y]}. То есть мы перешли от информации «знаем E[X]E[X]» к «знаем E[X]E[X] и D[X]D[X]» и получили в обмен квадратичное затухание 1/k21/k^2 вместо линейного 1/k1/k.

Что известноОценка хвостаЗатухание
Только E[X]E[X], X0X \ge 0P(Xa)E[X]/aP(X \ge a) \le E[X]/a1/a1/a
E[X]E[X] и D[X]D[X]$P(X - E[X]
E[eλX]E[e^{\lambda X}] конечнооценка Черноваэкспоненциальное

Чем больше моментов мы знаем, тем точнее оценка. Неравенство Маркова - нижняя ступенька этой лестницы.

Граница применимости

Неравенство Маркова работает всегда, когда X0X \ge 0 и E[X]<E[X] < \infty, но это не значит, что его оценка всегда содержательна.

  • При aE[X]a \le E[X] неравенство даёт E[X]/a1E[X]/a \ge 1 - это тривиальная верхняя граница, потому что любая вероятность и так не больше единицы. Полезная оценка возникает только когда aa заметно превышает E[X]E[X].
  • Оценка точна для двухточечного распределения: X=aX = a с вероятностью E[X]/aE[X]/a и X=0X = 0 с вероятностью 1E[X]/a1 - E[X]/a. Это и есть «худший случай», при котором неравенство превращается в равенство - поэтому без дополнительной информации улучшить его нельзя.
  • Если у XX есть лёгкие хвосты (например, нормальное распределение, ограниченное снизу), реальный P(Xa)P(X \ge a) убывает экспоненциально, а Марков даёт лишь 1/a1/a. Это много, но это лучшее, что можно сказать «по чистому матожиданию».
  • Для величин со знаком сначала надо перейти к X|X| или (XE[X])2(X - E[X])^2. Прямая подстановка в формулу при X<0X < 0 даёт бессмыслицу.

Что показывают вычисления

Подставим конкретику. Пусть E[X]=1E[X] = 1. Тогда:

  • P(X2)0,5P(X \ge 2) \le 0{,}5 - слабая, но честная оценка.
  • P(X10)0,1P(X \ge 10) \le 0{,}1 - заметно полезнее.
  • P(X100)0,01P(X \ge 100) \le 0{,}01 - для длинного хвоста уже немало.

При E[X]=2E[X] = 2 и a=10a = 10 получаем P0,2P \le 0{,}2; при a=1a = 1 - тривиальные P2P \le 2, то есть никакой информации. Это и есть рабочее правило: чем больше отношение a/E[X]a/E[X], тем содержательнее граница.

Частые ошибки

  • Применять неравенство Маркова к величине, принимающей отрицательные значения. Условие X0X \ge 0 - не формальность: без него средняя часть доказательства ломается, и оценка становится неверной.
  • Думать, что оценка точна для гладких распределений. Для нормального или экспоненциального хвоста реальная вероятность меньше марковской на порядки - но улучшить её можно только привлекая дисперсию (Чебышёв) или производящую моментов (Чернов).
  • Путать P(Xa)P(X \ge a) и P(X>a)P(X > a). В дискретном случае при aa, совпадающем со значением XX, разница может быть существенна. Неравенство одинаково работает для обоих, но численный ответ задачи зависит от формулировки.
  • Забывать, что E[X]/a>1E[X]/a > 1 - это «нет информации», а не «вероятность больше единицы». Корректный ответ в таком случае - P1P \le 1.
  • Применять формулу к центрированной величине YE[Y]Y - E[Y] без перехода к квадрату. Сам YE[Y]Y - E[Y] имеет нулевое матожидание, и формула не даст ничего полезного.

FAQ

Чем неравенство Маркова отличается от неравенства Чебышёва?

Маркова - про неотрицательную величину и её матожидание, даёт оценку E[X]/aE[X]/a. Чебышёв - про модуль отклонения от среднего и дисперсию, даёт оценку D[X]/a2D[X]/a^2. Чебышёв сильнее, потому что использует больше информации (второй момент), и формально выводится из Маркова применением к (YE[Y])2(Y - E[Y])^2.

Когда неравенство Маркова становится бесполезным?

Когда aE[X]a \le E[X]: правая часть выходит 1\ge 1, и оценка вырождается в тривиальное P1P \le 1. На практике это сигнал, что нужно либо взять больший порог, либо привлечь дисперсию (Чебышёв), либо производящую функцию моментов (Чернов) - родственник характеристической функции в теории вероятностей.

Можно ли применять неравенство Маркова к матожиданию случайной выборки?

Да, если речь о неотрицательной статистике. Например, для Xˉn=1nXi\bar{X}_n = \frac{1}{n}\sum X_i при Xi0X_i \ge 0 оценка P(Xˉna)E[Xˉn]/aP(\bar{X}_n \ge a) \le E[\bar{X}_n]/a остаётся в силе. Но для оценки отклонения XˉnE[X]|\bar{X}_n - E[X]| нужен Чебышёв или Хёфдинг - Марков напрямую не подходит.

Коротко

Неравенство Маркова - базовая оценка хвоста для неотрицательной случайной величины с конечным матожиданием: P(Xa)E[X]/aP(X \ge a) \le E[X]/a. Доказывается обрезкой ожидания снизу на множестве {Xa}\{X \ge a\}. Полезно, когда aa заметно больше E[X]E[X]; иначе вырождается в тривиальную единицу. Из него выводятся неравенство Чебышёва (применением к квадрату центрированной величины) и оценка Чернова (применением к экспоненте). Цена простоты - линейное затухание 1/a1/a вместо экспоненциального; зато не требуется ни форма распределения, ни моменты выше первого.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также