Распределение суммы независимых случайных величин
Когда в задаче по теорверу нужно найти распределение суммы нескольких независимых случайных величин, студенты нередко путают «сложить ожидания» с «сложить плотности» и получают неверный ответ. Ожидания и дисперсии действительно складываются, но плотность суммы - это не сумма плотностей, а их свёртка. Ниже разбираем, как она устроена, как работает формула Ирвина-Холла для суммы равномерных величин, и почему при большом числе слагаемых можно переходить к нормальному закону. Сначала потрогай калькулятор: выбери число слагаемых и границы - и сразу увидишь, как меняется форма плотности по мере роста .
Математическое ожидание и дисперсия суммы
Начнём с простого. Если - попарно независимые случайные величины, то для любых :
Это свойство линейности ожидания - оно выполняется вне зависимости от независимости. Дисперсия суммируется только при независимости:
Для одинаково распределённых (равномерное распределение):
Поэтому для суммы :
Эти формулы работают для любого числа слагаемых и не требуют знания плотности суммы.
Плотность суммы: метод свёртки
Характеристики - это хорошо, но часто задача требует найти саму плотность . Если и - независимые случайные величины с плотностями и , то плотность их суммы вычисляется через свёртку:
Для суммы слагаемых операцию нужно применить раз: сначала свернуть и , затем результат свернуть с , и так далее.
Свёртка двух прямоугольных функций (плотностей ) даёт трапецию, трёх - параболу, четырёх - кубическую кривую. Уже при кривая практически неотличима от нормального колокола.
Формула Ирвина-Холла
Для суммы независимых существует точная формула Ирвина-Холла:
Это полиномиальная функция, соединённая из кусков: на каждом отрезке она задаётся полиномом степени . Для получается константа (равномерная плотность), для - треугольник, для - квадратная параболическая «шляпа».
Чтобы обобщить на , достаточно сделать замену: , где . Тогда , где . Плотность :

На рисунке видно, как форма плотности суммы меняется с ростом числа слагаемых: при это прямоугольник, при - треугольник (симметричная трапеция), при - параболический «горб», при - кривая практически неотличима от нормальной.
Характеристическая функция и подход через производящие функции
Мощный альтернативный метод - перейти к характеристической функции . При независимости слагаемых характеристическая функция суммы равна произведению:
Для :
Знаем произведение → обращаем преобразование Фурье и получаем плотность. Аналогично работает метод производящих функций для дискретных СВ: производящая функция суммы - произведение производящих функций.
Центральная предельная теорема
Формула Ирвина-Холла хороша для малых , но при больших считать факториалы и биномиальные коэффициенты нет смысла. Здесь вступает в игру центральная предельная теорема (ЦПТ):
Это означает, что уже при сумму можно считать приближённо нормально распределённой:
ЦПТ - не ограниченная равномерным законом: она работает для любых одинаково распределённых СВ с конечными и . Именно поэтому нормальное распределение встречается повсюду - рост людей, суммы ошибок измерения, выборочные средние.
На практике «работает хорошо» означает для нормальной аппроксимации произвольного закона; для равномерного достаточно уже из-за симметрии плотности.
Дискретный случай: свёртка таблиц
Если слагаемые дискретны (например, - число очков при броске кубика), плотность заменяется вероятностной функцией , а свёртка становится суммой:
Для суммы одинаковых дискретных СВ это вычисляется через производящую функцию : производящая функция суммы равна , и разложение в ряд даёт все .
Классический пример: бросок двух кубиков, равномерно. Сумма принимает значения от 2 до 12, и вероятности образуют треугольное распределение с пиком при 7.
Частые ошибки
- Сложение плотностей вместо свёртки. Плотность суммы - это НЕ . Сложение плотностей не имеет смысла (результат не будет нормирован до 1 и не описывает сумму). Правильно: свёртка .
- Применение ЦПТ при малом . При нормальная аппроксимация даёт значительную погрешность; используйте точную формулу Ирвина-Холла.
- Забывают про условие независимости. Формула дисперсии суммы требует независимости. При зависимых слагаемых появляются ковариационные члены.
- Несоответствие единиц при замене переменной. При переходе от к необходимо правильно масштабировать плотность: делить на при обратном переходе.
- Перепутать ожидание суммы и ожидание произведения. - всегда; - только при независимости.
FAQ
Можно ли складывать случайные величины с разными распределениями?
Да. Свёртка работает для любых независимых СВ с любыми законами. Для нормальных и сумма снова нормальна: . Для экспоненциальных результатом будет гамма-распределение, для пуассоновских - снова пуассоновское. Если законы несовпадающие и несовместимые с замкнутостью, плотность берётся численной свёрткой.
Как вычислить через нормальное приближение?
Стандартизируем: , тогда , где - стандартная нормальная функция распределения (табличная). Параметры и вычисляются напрямую.
Что такое «закон устойчивых распределений»?
Класс распределений, замкнутых относительно сложения: если и из одного класса, то и - тоже. Нормальное - устойчиво, пуассоновское - устойчиво, равномерное - нет (сумма двух имеет треугольный закон, а не равномерный). Устойчивые законы - это именно нормальное и его обобщения (распределения Леви, Коши), описывающие суммы СВ с тяжёлыми хвостами.
Коротко
Распределение суммы независимых случайных величин находится через свёртку плотностей (или произведение характеристических функций). Ожидание и дисперсия суммы всегда равны суммам соответствующих характеристик слагаемых. Для суммы равномерных точная плотность задаётся формулой Ирвина-Холла, а начиная приблизительно с её хорошо аппроксимирует нормальный закон - это прямое следствие ЦПТ, объясняющей повсеместность нормального распределения в реальных данных.
Читайте также

Совместное распределение двух случайных величин
Как задать совместное распределение X и Y, найти маргиналы, ковариацию и корреляцию, проверить независимость. Примеры расчётов и типичные ошибки студентов.

Характеристическая функция в теории вероятностей
Характеристическая функция : преобразование Фурье плотности, моменты через производные, теорема Леви о непрерывности и вывод центральной предельной теоремы.

Апостериорная вероятность гипотезы: формула Байеса
Что такое апостериорная вероятность гипотезы и как её считать по формуле Байеса: разбор множителей, связь с полной вероятностью, пошаговый пример и типичные ошибки.