Распределение Пуассона: свойства, формула и моменты

Распределение Пуассона описывает число редких независимых событий, происходящих за фиксированный интервал времени или в заданной области пространства: звонки в колл-центр за час, опечатки на страницу, распады ядер за секунду, дефекты на метр ткани. Это дискретный закон с единственным параметром , и именно компактность делает его рабочим инструментом и в учебных задачах, и в реальной статистике. Ниже разберём определение, ключевые свойства распределения Пуассона, его моменты, аддитивность и связи с биномиальным и экспоненциальным законами, а также типичные ошибки при работе с ним.
Определение и формула вероятности
Случайная величина имеет распределение Пуассона с параметром , если она принимает целые неотрицательные значения с вероятностями
Записывают это как . Параметр - это среднее число событий за рассматриваемый интервал. Сумма всех вероятностей равна единице, что проверяется разложением экспоненты в ряд:
Чтобы быстро посчитать вероятности, моменты или вероятность интервала значений для конкретного , задайте параметр в форме ниже - разбор с формулами придёт в чат.
Математическое ожидание и дисперсия
Главное и самое узнаваемое свойство распределения Пуассона - равенство математического ожидания и дисперсии. Оба они равны параметру :
Ожидание получается прямым суммированием ряда: сдвиг индекса снова даёт разложение экспоненты. Тот факт, что среднее совпадает с дисперсией, имеет практическое следствие: для пуассоновских данных коэффициент вариации равен , а стандартное отклонение - . На этом строится проверка «равнодисперсности»: если в выборке выборочная дисперсия заметно превышает среднее, говорят о сверхдисперсии, и пуассоновская модель не подходит.
Производящая функция моментов равна , а характеристическая функция - . Из них одним дифференцированием извлекаются все моменты; в частности, третий центральный момент тоже равен , поэтому коэффициент асимметрии равен и убывает с ростом .
Аддитивность и устойчивость
Распределение Пуассона устойчиво относительно суммирования. Если и независимы, то их сумма снова пуассоновская:
Это свойство аддитивности удобно доказывать через производящую функцию: произведение даёт . Содержательно это очевидно: если два независимых потока редких событий идут с интенсивностями и , то совокупный поток имеет интенсивность .
Обратное свойство - прореживание: если каждое событие пуассоновского потока с вероятностью относим к подклассу, то подкласс тоже пуассоновский с параметром , и притом независимый от дополнения. Эти два свойства лежат в основе теории пуассоновских потоков и систем массового обслуживания.
Связь с биномиальным распределением
Распределение Пуассона возникает как предел биномиального закона при , так, что произведение остаётся конечным. Это закон редких событий (теорема Пуассона):
Практический смысл: когда испытаний очень много, а вероятность «успеха» в каждом мала, биномиальные вероятности удобно приближать пуассоновскими, подставив . Правило большого пальца - приближение хорошо при и . Эта связь объясняет, почему пуассоновская модель работает для редких событий: число дефектов, аварий или мутаций - это и есть «много попыток, малая вероятность каждой». Похожий предельный переход в другую сторону связывает Пуассона с нормальным законом: при больших распределение приближается нормальным .
Связь с экспоненциальным распределением и потоком
Если события образуют простейший (пуассоновский) поток с интенсивностью , то число событий за время распределено по Пуассону с параметром , а промежутки времени между соседними событиями распределены экспоненциально с тем же параметром :
Это двойственное описание одного процесса: «сколько событий за интервал» (дискретный счёт, Пуассон) и «сколько ждать до события» (непрерывное время, экспонента). Отсутствие памяти у экспоненциального распределения соответствует независимости приращений пуассоновского потока: будущее не зависит от того, сколько уже прошло без события.
Мода, квантили и форма распределения
Мода распределения Пуассона равна ; если - целое, то максимум вероятности достигается сразу в двух точках, и . При малых распределение сильно скошено вправо и сосредоточено около нуля: при наиболее вероятное значение - ноль. С ростом форма становится всё симметричнее и приближается к колоколу нормальной кривой, что согласуется с предельной теоремой выше. Медиана приближённо равна , то есть близка к среднему, но из-за правой асимметрии слегка ниже него при умеренных .
Частые ошибки
- Путают с вероятностью. Параметр - это среднее число событий, а не вероятность; он может быть больше единицы. Вероятность отдельного исхода даёт формула .
- Считают, что дисперсия отличается от среднего. Для самого закона Пуассона всегда . Расхождение в данных - сигнал, что модель неверна (сверхдисперсия), а не свойство Пуассона.
- Складывают зависимые величины. Аддитивность верна только для независимых слагаемых.
- Берут не для того интервала. Если поток имеет интенсивность в час, а вопрос про 15 минут, нужно пересчитать параметр в .
- Используют пуассоновское приближение при больших . Замена биномиального на Пуассона корректна лишь при малом и большом ; иначе ошибка велика.
FAQ
Чему равны математическое ожидание и дисперсия распределения Пуассона? Оба равны параметру : . Это определяющее свойство закона; стандартное отклонение равно .
Когда применяют распределение Пуассона? Когда считают число редких независимых событий за фиксированный интервал при постоянной средней интенсивности: звонки, дефекты, отказы, распады. Условия - стационарность, ординарность и отсутствие последействия потока.
Как связаны распределения Пуассона и биномиальное? Пуассон - предел биномиального при , , . Поэтому биномиальные вероятности при большом и малом приближают пуассоновскими с .
Коротко
Распределение Пуассона - дискретный закон редких событий с вероятностями . Его определяющие свойства: математическое ожидание и дисперсия совпадают и равны ; сумма независимых пуассоновских величин снова пуассоновская (аддитивность); закон возникает как предел биномиального при многих испытаниях с малой вероятностью и тесно связан с экспоненциальным распределением промежутков в пуассоновском потоке. При больших форма приближается к нормальной кривой.
Читайте также

Неравенство Йенсена для выпуклых функций: формулы и применение
Неравенство Йенсена для выпуклых функций: дискретная и интегральная формулировки, доказательство, условие равенства, связь с математическим ожиданием и применение в анализе и теории вероятностей.

Логарифмически нормальное распределение: смысл и формулы
Логарифмически нормальное распределение: плотность, математическое ожидание и дисперсия через параметры μ и σ, связь с нормальным законом, оценка параметров и типовые задачи с примерами расчётов.

Модель Марковица: оптимальный портфель и минимум риска
Модель Марковица строит оптимальный портфель: минимум дисперсии при заданной доходности через ковариации активов. Постановка задачи, диверсификация, формулы весов и типичные ошибки.