Математическое ожидание биномиального распределения

Биномиальное распределение описывает число успехов в серии из одинаковых независимых испытаний, в каждом из которых успех наступает с вероятностью . Классические примеры - сколько орлов выпадет за 20 бросков монеты, сколько бракованных деталей окажется в партии, сколько верных ответов даст студент, угадывающий тест. Самый частый вопрос в задачах: чему равно математическое ожидание такой величины, то есть её среднее значение в долгой серии повторений. Ответ на удивление простой: . Ниже разберём, откуда берётся эта формула, как с ней связаны дисперсия и стандартное отклонение, и где студенты чаще всего ошибаются. Чтобы сразу почувствовать связь параметров, покрутите калькулятор: он пересчитывает , дисперсию и весь профиль вероятностей на лету.
Что такое биномиальное распределение
Пусть проводится независимых испытаний, и в каждом возможны только два исхода: успех (с вероятностью ) или неудача (с вероятностью ). Такое отдельное испытание называют испытанием Бернулли. Случайная величина - это общее число успехов за все испытаний. Говорят, что распределена по биномиальному закону, и пишут .
Вероятность получить ровно успехов задаётся формулой Бернулли:
где - число сочетаний, то есть количество способов выбрать, какие именно из испытаний окажутся успешными. Множитель отвечает за успехов, - за оставшиеся неудачи.
Формула математического ожидания
Математическое ожидание биномиального распределения - это среднее число успехов, которого стоит ожидать в долгой серии повторений всего эксперимента. Главная формула:
Она интуитивно понятна: если одно испытание даёт успех с вероятностью , то в среднем за одно испытание набирается успехов, а за испытаний - в раз больше. Например, при 20 бросках честной монеты (, ) ожидается орлов.
Важно, что не обязано быть целым числом. При и получаем , а при уже - и это нормально: математическое ожидание не результат одного опыта, а среднее по бесконечной серии.
Вывод E[X] = np через сумму индикаторов
Самый короткий и честный вывод не требует возни с суммами факториалов. Представим как сумму отдельных испытаний:
где каждое равно 1, если в -м испытании успех, и 0, если неудача. Такие величины называют индикаторами. Математическое ожидание одного индикатора считается напрямую:
Поскольку математическое ожидание суммы всегда равно сумме математических ожиданий (свойство линейности, оно верно даже для зависимых слагаемых), получаем:

Этот приём с разбиением на индикаторы - один из самых полезных в теории вероятностей: он сводит сложную величину к сумме простых и работает там, где прямое суммирование ряда было бы громоздким.
Дисперсия и стандартное отклонение
Математическое ожидание показывает, где находится центр распределения, но ничего не говорит о разбросе. За разброс отвечает дисперсия:
Её тоже легко получить через индикаторы: дисперсия одного равна , а так как испытания независимы, дисперсии складываются, давая . Стандартное отклонение - это корень из дисперсии:
Для 20 бросков монеты , а . Это значит, что фактическое число орлов обычно отклоняется от ожидаемых 10 примерно на пару штук в ту или другую сторону. Заметьте: дисперсия максимальна при и стремится к нулю, когда близко к 0 или 1, - исход становится почти предопределённым.
Связь ожидания с пиком распределения
На графике вероятностей математическое ожидание лежит почти точно под самым высоким столбиком. Мода (самый вероятный исход) - это целое число рядом с . Это не совпадение: - центр тяжести всей картины, и распределение примерно симметрично вокруг него, особенно когда близко к .
При маленьких или больших распределение становится скошенным: хвост тянется в сторону менее вероятного исхода. Но даже тогда математическое ожидание остаётся ровно равным - смещается лишь форма, не центр. Подвигайте ползунок в калькуляторе выше: линия скользит вместе с пиком, наглядно показывая эту связь.
Эта картина объясняет, почему среднее так удобно использовать в оценках. Если из биномиальной модели нужно быстро прикинуть типичный исход, берут и добавляют запас в одно-два стандартных отклонения . Например, ожидая орлов при , разумно предполагать, что в большинстве серий число орлов попадёт в диапазон примерно от 8 до 12. Само по себе математическое ожидание - это не прогноз конкретного опыта, а ориентир, вокруг которого группируются реальные результаты.
Частые ошибки
- Путают и . В задаче про брак вероятность успеха - это вероятность нужного события (например, что деталь бракованная), а не дополнение к нему. Сначала чётко определите, что считается успехом.
- Берут только для целого ответа. Ожидание может быть дробным ( орла) - округлять его нельзя, это среднее по серии, а не результат одного опыта.
- Считают . Это дисперсия, а не стандартное отклонение. Стандартное отклонение - корень: .
- Применяют формулу к зависимым испытаниям. Если шары вынимают без возврата, испытания не независимы и распределение не биномиальное, а гипергеометрическое - формула для ожидания всё ещё работает, но дисперсия уже другая.
- Забывают условие постоянства . Биномиальная модель требует, чтобы вероятность успеха была одинаковой во всех испытаниях.
FAQ
Почему математическое ожидание равно именно np, а не чему-то сложному? Потому что число успехов раскладывается в сумму независимых индикаторов, каждый с ожиданием . По свойству линейности ожидание суммы равно сумме ожиданий, то есть . Никаких факториалов в выводе не нужно.
Может ли E[X] быть больше n? Нет. Поскольку , произведение не превосходит . Максимум достигается только при , когда успех гарантирован в каждом испытании.
Чем биномиальное распределение отличается от распределения Пуассона? Биномиальное считает успехи в фиксированном числе испытаний . Когда велико, а мало (так что умеренно), биномиальное приближается распределением Пуассона с параметром , и тогда .
Коротко
Математическое ожидание биномиального распределения равно - среднему числу успехов за испытаний. Самый ясный вывод идёт через сумму индикаторов: каждое испытание добавляет в среднем успехов, а линейность ожидания превращает это в . Разброс вокруг центра задают дисперсия и стандартное отклонение . На графике вероятностей всегда сидит у пика, а главное условие применимости формулы - независимые испытания с постоянной вероятностью успеха.
Читайте также

Распределение Пуассона: свойства, формула и моменты
Распределение Пуассона: свойства закона редких событий, формула вероятности, математическое ожидание и дисперсия, аддитивность, связь с биномиальным и экспоненциальным законами, примеры расчётов.

Наивероятнейшее число успехов в схеме Бернулли
Наивероятнейшее число успехов в схеме Бернулли: формула np-q ≤ k0 ≤ np+p, как найти моду биномиального распределения, когда мод две и где студенты ошибаются в задачах.

Неравенство Йенсена для выпуклых функций
Неравенство Йенсена для выпуклых функций: дискретная и интегральная формулировки, доказательство, условие равенства, связь с математическим ожиданием и применение в анализе и теории вероятностей.