EssayAI
Блог
Блог
Математика и алгоритмы

Распределение суммы независимых случайных величин

11 июня 2026Время чтения: 6 минут
#теория вероятностей#случайные величины#центральная предельная теорема#свёртка распределений#формула Ирвина-Холла

Когда в задаче по теорверу нужно найти распределение суммы Sn=X1+X2++XnS_n = X_1 + X_2 + \dots + X_n нескольких независимых случайных величин, студенты нередко путают «сложить ожидания» с «сложить плотности» и получают неверный ответ. Ожидания и дисперсии действительно складываются, но плотность суммы - это не сумма плотностей, а их свёртка. Ниже разбираем, как она устроена, как работает формула Ирвина-Холла для суммы равномерных величин, и почему при большом числе слагаемых можно переходить к нормальному закону. Сначала потрогай калькулятор: выбери число слагаемых nn и границы [a,b][a, b] - и сразу увидишь, как меняется форма плотности по мере роста nn.

Математическое ожидание и дисперсия суммы

Начнём с простого. Если X1,,XnX_1, \dots, X_n - попарно независимые случайные величины, то для любых aia_i:

E ⁣[i=1naiXi]=i=1naiE[Xi].\mathrm{E}\!\left[\sum_{i=1}^n a_i X_i\right] = \sum_{i=1}^n a_i\,\mathrm{E}[X_i].

Это свойство линейности ожидания - оно выполняется вне зависимости от независимости. Дисперсия суммируется только при независимости:

D ⁣[i=1nXi]=i=1nD[Xi].\mathrm{D}\!\left[\sum_{i=1}^n X_i\right] = \sum_{i=1}^n \mathrm{D}[X_i].

Для одинаково распределённых XiUniform(a,b)X_i \sim \text{Uniform}(a,b) (равномерное распределение):

E[Xi]=a+b2,D[Xi]=(ba)212.\mathrm{E}[X_i] = \frac{a+b}{2}, \qquad \mathrm{D}[X_i] = \frac{(b-a)^2}{12}.

Поэтому для суммы SnS_n:

E[Sn]=na+b2,D[Sn]=n(ba)212.\mathrm{E}[S_n] = n\cdot\frac{a+b}{2}, \qquad \mathrm{D}[S_n] = n\cdot\frac{(b-a)^2}{12}.

Эти формулы работают для любого числа слагаемых и не требуют знания плотности суммы.

Плотность суммы: метод свёртки

Характеристики - это хорошо, но часто задача требует найти саму плотность fSn(x)f_{S_n}(x). Если XX и YY - независимые случайные величины с плотностями fXf_X и fYf_Y, то плотность их суммы Z=X+YZ = X + Y вычисляется через свёртку:

fZ(x)=(fXfY)(x)=+fX(t)fY(xt)dt.f_Z(x) = (f_X * f_Y)(x) = \int_{-\infty}^{+\infty} f_X(t)\,f_Y(x - t)\,dt.

Для суммы nn слагаемых операцию нужно применить n1n-1 раз: сначала свернуть fX1f_{X_1} и fX2f_{X_2}, затем результат свернуть с fX3f_{X_3}, и так далее.

Анимация свёртки: прямоугольник плотности U(0,1) последовательно «скользит» по себе, и плотность суммы из прямоугольника превращается в трапецию, затем в параболу, затем в колокол

Свёртка двух прямоугольных функций (плотностей U(0,1)U(0,1)) даёт трапецию, трёх - параболу, четырёх - кубическую кривую. Уже при n=4n = 4 кривая практически неотличима от нормального колокола.

Формула Ирвина-Холла

Для суммы nn независимых U(0,1)U(0,1) существует точная формула Ирвина-Холла:

fSn(x)=1(n1)!k=0x(1)k(nk)(xk)n1,x[0,n].f_{S_n}(x) = \frac{1}{(n-1)!}\sum_{k=0}^{\lfloor x \rfloor} (-1)^k \binom{n}{k}(x-k)^{n-1}, \quad x \in [0, n].

Это полиномиальная функция, соединённая из nn кусков: на каждом отрезке [k,k+1][k, k+1] она задаётся полиномом степени n1n-1. Для n=1n=1 получается константа 11 (равномерная плотность), для n=2n=2 - треугольник, для n=3n=3 - квадратная параболическая «шляпа».

Чтобы обобщить на XiU(a,b)X_i \sim U(a, b), достаточно сделать замену: Xi=a+(ba)UiX_i = a + (b-a)U_i, где UiU(0,1)U_i \sim U(0,1). Тогда Sn=na+(ba)TnS_n = n\,a + (b-a)\,T_n, где TnIrwin-Hall(n)T_n \sim \text{Irwin-Hall}(n). Плотность SnS_n:

fSn(x)=1bafTn ⁣(xnaba),x[na,nb].f_{S_n}(x) = \frac{1}{b-a}\,f_{T_n}\!\left(\frac{x - na}{b-a}\right), \quad x \in [na,\, nb].
Плотности суммы 1, 2, 3 и 5 равномерных U(0,1) величин: от прямоугольника до почти нормального колокола
Плотности суммы 1, 2, 3 и 5 равномерных U(0,1) величин: от прямоугольника до почти нормального колокола

На рисунке видно, как форма плотности суммы меняется с ростом числа слагаемых: при n=1n=1 это прямоугольник, при n=2n=2 - треугольник (симметричная трапеция), при n=3n=3 - параболический «горб», при n=5n=5 - кривая практически неотличима от нормальной.

Характеристическая функция и подход через производящие функции

Мощный альтернативный метод - перейти к характеристической функции φX(t)=E[eitX]\varphi_X(t) = \mathrm{E}[e^{itX}]. При независимости слагаемых характеристическая функция суммы равна произведению:

φSn(t)=i=1nφXi(t).\varphi_{S_n}(t) = \prod_{i=1}^n \varphi_{X_i}(t).

Для XiU(a,b)X_i \sim U(a, b):

φXi(t)=eitbeitait(ba).\varphi_{X_i}(t) = \frac{e^{itb} - e^{ita}}{it(b-a)}.

Знаем произведение → обращаем преобразование Фурье и получаем плотность. Аналогично работает метод производящих функций для дискретных СВ: производящая функция суммы - произведение производящих функций.

Центральная предельная теорема

Формула Ирвина-Холла хороша для малых nn, но при больших nn считать факториалы и биномиальные коэффициенты нет смысла. Здесь вступает в игру центральная предельная теорема (ЦПТ):

SnE[Sn]D[Sn]dN(0,1)при n.\frac{S_n - \mathrm{E}[S_n]}{\sqrt{\mathrm{D}[S_n]}} \xrightarrow{d} N(0, 1) \quad \text{при } n \to \infty.

Это означает, что уже при n12n \ge 12 сумму можно считать приближённо нормально распределённой:

SnN ⁣(na+b2,  n(ba)212).S_n \approx N\!\left(n\cdot\frac{a+b}{2},\; n\cdot\frac{(b-a)^2}{12}\right).

ЦПТ - не ограниченная равномерным законом: она работает для любых одинаково распределённых СВ с конечными E\mathrm{E} и D\mathrm{D}. Именно поэтому нормальное распределение встречается повсюду - рост людей, суммы ошибок измерения, выборочные средние.

На практике «работает хорошо» означает n30n \ge 30 для нормальной аппроксимации произвольного закона; для равномерного U(a,b)U(a,b) достаточно уже n12n \ge 12 из-за симметрии плотности.

Дискретный случай: свёртка таблиц

Если слагаемые дискретны (например, XiX_i - число очков при броске кубика), плотность заменяется вероятностной функцией pX(k)=P(X=k)p_X(k) = P(X = k), а свёртка становится суммой:

pZ(k)=jpX(j)pY(kj).p_Z(k) = \sum_{j} p_X(j)\,p_Y(k - j).

Для суммы nn одинаковых дискретных СВ это вычисляется через производящую функцию GX(z)=kpX(k)zkG_X(z) = \sum_k p_X(k)\,z^k: производящая функция суммы равна [GX(z)]n[G_X(z)]^n, и разложение в ряд даёт все pSn(k)p_{S_n}(k).

Классический пример: бросок двух кубиков, Xi{1,,6}X_i \sim \{1,\dots,6\} равномерно. Сумма принимает значения от 2 до 12, и вероятности образуют треугольное распределение с пиком при 7.

Частые ошибки

  • Сложение плотностей вместо свёртки. Плотность суммы X+YX+Y - это НЕ fX(x)+fY(x)f_X(x) + f_Y(x). Сложение плотностей не имеет смысла (результат не будет нормирован до 1 и не описывает сумму). Правильно: свёртка fXfYf_X * f_Y.
  • Применение ЦПТ при малом nn. При n=2n = 2 нормальная аппроксимация даёт значительную погрешность; используйте точную формулу Ирвина-Холла.
  • Забывают про условие независимости. Формула дисперсии суммы D[Sn]=D[Xi]\mathrm{D}[S_n] = \sum \mathrm{D}[X_i] требует независимости. При зависимых слагаемых появляются ковариационные члены.
  • Несоответствие единиц при замене переменной. При переходе от U(a,b)U(a,b) к U(0,1)U(0,1) необходимо правильно масштабировать плотность: делить на bab-a при обратном переходе.
  • Перепутать ожидание суммы и ожидание произведения. E[X+Y]=E[X]+E[Y]\mathrm{E}[X+Y] = \mathrm{E}[X] + \mathrm{E}[Y] - всегда; E[XY]=E[X]E[Y]\mathrm{E}[XY] = \mathrm{E}[X]\,\mathrm{E}[Y] - только при независимости.

FAQ

Можно ли складывать случайные величины с разными распределениями?

Да. Свёртка работает для любых независимых СВ с любыми законами. Для нормальных XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2) и YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2) сумма снова нормальна: X+YN(μ1+μ2,σ12+σ22)X + Y \sim N(\mu_1+\mu_2, \sigma_1^2+\sigma_2^2). Для экспоненциальных результатом будет гамма-распределение, для пуассоновских - снова пуассоновское. Если законы несовпадающие и несовместимые с замкнутостью, плотность берётся численной свёрткой.

Как вычислить P(Sn<c)P(S_n < c) через нормальное приближение?

Стандартизируем: Z=SnμσZ = \frac{S_n - \mu}{\sigma}, тогда P(Sn<c)Φ ⁣(cμσ)P(S_n < c) \approx \Phi\!\left(\frac{c - \mu}{\sigma}\right), где Φ\Phi - стандартная нормальная функция распределения (табличная). Параметры μ=n(a+b)/2\mu = n(a+b)/2 и σ=n(ba)2/12\sigma = \sqrt{n(b-a)^2/12} вычисляются напрямую.

Что такое «закон устойчивых распределений»?

Класс распределений, замкнутых относительно сложения: если XX и YY из одного класса, то и X+YX+Y - тоже. Нормальное - устойчиво, пуассоновское - устойчиво, равномерное - нет (сумма двух U(0,1)U(0,1) имеет треугольный закон, а не равномерный). Устойчивые законы - это именно нормальное и его обобщения (распределения Леви, Коши), описывающие суммы СВ с тяжёлыми хвостами.

Коротко

Распределение суммы независимых случайных величин находится через свёртку плотностей (или произведение характеристических функций). Ожидание и дисперсия суммы всегда равны суммам соответствующих характеристик слагаемых. Для суммы nn равномерных U(a,b)U(a,b) точная плотность задаётся формулой Ирвина-Холла, а начиная приблизительно с n=12n = 12 её хорошо аппроксимирует нормальный закон - это прямое следствие ЦПТ, объясняющей повсеместность нормального распределения в реальных данных.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также