Функция распределения случайной величины: свойства

Функция распределения - это универсальный способ задать случайную величину одной формулой, который одинаково работает и для дискретных, и для непрерывных величин. По определению - это вероятность того, что величина примет значение не больше . Из этого простого определения вытекают все свойства функции распределения: она не убывает, зажата между нулём и единицей, непрерывна справа и стремится к нулю и единице на концах числовой оси. Ниже разберём каждое свойство с пояснением, покажем, как строить для дискретной и непрерывной величины, и как через неё считать вероятность попадания на интервал. Чтобы сразу увидеть форму функции и её связь с плотностью, покрутите калькулятор ниже - он показывает и плотность рядом, а заштрихованная площадь равна значению в выбранной точке.
Определение функции распределения
Функцией распределения случайной величины называют функцию действительного аргумента , равную вероятности события :
Аргумент пробегает всю числовую ось, а значение - это накопленная вероятность: какую долю всех исходов величина «набрала» к моменту, когда мы дошли до точки . Поэтому функцию распределения ещё называют интегральной или кумулятивной (cumulative distribution function, CDF). Главное достоинство этого определения - оно не зависит от типа величины. Дискретная она или непрерывная, у любой случайной величины функция распределения существует и полностью её задаёт: зная , можно найти вероятность попадания в любой промежуток.
На видео точка движется слева направо. Площадь под плотностью левее точки - это и есть накопленная вероятность , поэтому верхний график (сама функция распределения) поднимается ровно на эту величину. Когда точка уходит далеко вправо, площадь охватывает всю плотность, и выходит на единицу.
Свойства функции распределения
У функции распределения четыре фундаментальных свойства, и все они следуют прямо из определения через свойства вероятности.
- Ограниченность. Поскольку - это вероятность, она всегда лежит в пределах . Никакая вероятность не может быть отрицательной или больше единицы.
- Неубывание (монотонность). Если , то событие влечёт , значит . Функция распределения нигде не убывает - это её самое узнаваемое свойство.
- Пределы на бесконечностях. При движении влево вероятность стремится к нулю, вправо - к единице:
- Непрерывность справа. Для любой точки выполняется . Это значит, что в точке разрыва (у дискретной величины) функция «достраивается» сверху - левый предел может быть меньше, а само значение совпадает с правым.
Любая функция, удовлетворяющая этим четырём свойствам, является функцией распределения некоторой случайной величины - это и обратное утверждение тоже верно.

На схеме видно сразу все свойства: кривая нигде не идёт вниз, начинается у нуля слева, упирается в единицу справа, а в выбранной точке её высота равна вероятности .
Функция распределения дискретной величины
Если величина принимает отдельные значения с вероятностями , то функция распределения собирается суммированием всех вероятностей значений, не превосходящих :
График получается ступенчатым: на каждом значении функция подскакивает на величину , а между значениями держится постоянной. Высота скачка в точке равна вероятности этого значения: . Именно из-за этих скачков функция дискретной величины непрерывна только справа: в точке значение берётся с верхней ступеньки.

Например, для величины со значениями и вероятностями , , функция равна нулю до единицы, на промежутке , на и единице начиная с тройки.
Функция распределения непрерывной величины и связь с плотностью
Для непрерывной величины функция распределения - гладкая (без скачков) кривая. Она связана с плотностью вероятности интегралом и производной:
То есть значение - это площадь под плотностью левее точки , а плотность - скорость роста функции распределения. Именно это показывает правый график калькулятора: заштрихованная область под слева от выбранной точки численно равна на левом графике. Для стандартного нормального распределения в точке получается - то есть около значений лежат левее единицы; в центре из-за симметрии.
Важное следствие: у непрерывной величины вероятность попасть точно в одну точку равна нулю, . Поэтому знаки строгого и нестрогого неравенства для неё совпадают: .
Вычисление вероятности на интервале
Главное практическое применение функции распределения - быстрый расчёт вероятности попадания в промежуток. Через приращение функции:
Это прямое следствие неубывания и определения: из накопленной к точке вероятности вычитаем накопленную к точке . Для непрерывной величины, где , концы промежутка можно включать или нет - результат один и тот же. Например, для вероятность - знаменитое правило «двух сигм наполовину», доля значений в пределах одного стандартного отклонения.
Частые ошибки
- Путают и . Функция распределения - это вероятность быть НЕ больше . Вероятность правого хвоста считается как .
- Забывают про непрерывность справа у дискретной величины. В точке скачка берёт верхнее значение; неравенство в определении именно нестрогое, .
- Считают, что может убывать. Любой участок убывания означает ошибку: вероятность не может «уменьшаться» при расширении промежутка.
- Берут плотность вместо функции распределения. Плотность может быть больше единицы, а - никогда; путать их при ответе на «найдите вероятность» нельзя.
- Включают концы интервала у непрерывной величины и боятся ошибиться. Для непрерывной величины , поэтому .
FAQ
Чем функция распределения отличается от плотности? Функция распределения - это накопленная вероятность, всегда от до и неубывающая. Плотность - скорость её роста, существует только у непрерывных величин и может превышать единицу. Площадь под плотностью слева от равна .
Может ли функция распределения быть разрывной? Да, у дискретной величины она ступенчатая - в точках возможных значений происходят скачки. Но разрывы возможны только в виде скачков вверх, и функция всегда остаётся непрерывной справа. У непрерывной величины разрывов нет.
Как найти вероятность, что величина попадёт в заданный интервал? Через разность значений функции распределения на концах: . Для непрерывной величины строгость неравенств роли не играет, для дискретной нужно аккуратно следить, входят ли граничные значения в промежуток.
Коротко
Функция распределения задаёт любую случайную величину - дискретную или непрерывную - одной формулой. Её четыре свойства (ограниченность , неубывание, пределы и на бесконечностях, непрерывность справа) полностью следуют из определения через вероятность. У дискретной величины график ступенчатый со скачками высотой , у непрерывной - гладкий, причём равна площади под плотностью слева от , а . Вероятность попадания на интервал считается как .
Читайте также

Апостериорная вероятность гипотезы: формула Байеса
Что такое апостериорная вероятность гипотезы и как её считать по формуле Байеса: разбор множителей, связь с полной вероятностью, пошаговый пример и типичные ошибки.

Парадокс Монти Холла: почему выгодно менять дверь
Парадокс Монти Холла с тремя дверями простыми словами: почему смена выбора даёт вероятность выигрыша 2/3, разбор через перебор исходов и формулу Байеса, частые ошибки и FAQ.

Условная вероятность: определение и пример с разбором
Что такое условная вероятность простыми словами: строгое определение через формулу, понятный пример с разбором по шагам, связь с независимостью событий и формулой Байеса.