Логарифмически нормальное распределение: смысл и формулы

Логарифмически нормальное распределение описывает положительную случайную величину, логарифм которой подчиняется нормальному закону. Этим простым условием объясняется его вездесущность: размеры частиц, доходы домохозяйств, время безотказной работы, концентрации веществ, цены активов - всё это величины, которые не бывают отрицательными и формируются как произведение многих независимых факторов. Там, где сумма случайностей даёт нормальный закон, их произведение даёт логнормальный. Разберём определение, плотность, моменты, способы оценки параметров и характерные ошибки.
Определение: если нормален
Случайная величина имеет логарифмически нормальное распределение с параметрами и , если её логарифм распределён нормально:
Записывают это как . Важно сразу зафиксировать главную тонкость: и - это среднее и стандартное отклонение логарифма , а не самой величины . Они измеряются в логарифмической шкале и не равны математическому ожиданию и дисперсии . Это источник большинства ошибок при работе с логнормальным распределением.
Поскольку логарифм определён только для положительных чисел, носитель распределения - интервал . Распределение всегда асимметрично вправо: длинный правый хвост соответствует редким, но очень большим значениям.
Чтобы быстро посчитать плотность, моменты или вероятность попадания в интервал для конкретных и , соберите параметры в форме ниже - разбор с формулами придёт в чат.
Плотность распределения
Плотность логнормального распределения получается заменой переменной из нормальной плотности. Для :
а при плотность равна нулю. Множитель - это якобиан перехода от к ; именно он отличает логнормальную плотность от просто «нормальной кривой по логарифму».
Функция распределения выражается через стандартную нормальную функцию :
Это удобно для практики: вероятность сводится к разности значений от логарифмов границ, то есть к обычной работе с таблицей стандартного нормального закона.
Математическое ожидание и дисперсия
Поскольку - экспонента от нормальной величины, моменты считаются через производящую функцию моментов нормального закона. Математическое ожидание:
Дисперсия:
Обратите внимание: строго больше из-за слагаемого . Это прямое следствие неравенства Йенсена для выпуклой экспоненты - среднее экспоненты больше экспоненты среднего. Поэтому наивная попытка «возвести среднее логарифма в экспоненту» систематически занижает истинное математическое ожидание.
Величина $e^\mu$ - это не среднее, а медиана распределения. Среднее всегда больше неё на множитель $e^{\sigma^2/2}$.
Медиана, мода и асимметрия
Три меры центра здесь заметно расходятся, и порядок между ними фиксирован:
Медиана удобна тем, что не зависит от и легко интерпретируется: половина значений лежит ниже неё. Коэффициент асимметрии всегда положителен и растёт с :
При малых распределение почти симметрично и близко к нормальному; при больших хвост становится очень тяжёлым, а разрыв между медианой и средним - огромным. Близкая по логике величина - нормальное распределение служит для логнормального «материнским» законом на логарифмической шкале.
Оценка параметров по выборке
Главное практическое следствие определения: чтобы оценить и , нужно работать с логарифмами данных, а не с самими данными. По выборке берут и применяют обычные оценки нормального закона:
Это и есть оценки максимального правдоподобия. После их получения среднее и дисперсию исходной величины восстанавливают по формулам моментов выше. Прямое усреднение даёт состоятельную оценку , но не параметра - путать эти два «средних» нельзя.
Связь с произведением случайных факторов
Почему логнормальный закон возникает так часто? Если величина - это произведение многих независимых положительных факторов , то её логарифм есть сумма независимых слагаемых. По центральной предельной теореме эта сумма стремится к нормальному закону, а значит, само - к логнормальному. Это «мультипликативный аналог» ЦПТ. Поэтому модели роста, дробления, накопления процентов и многие финансовые модели (например, цена в модели Блэка - Шоулза) опираются именно на логнормальное распределение.
Квантили и доверительные границы
Поскольку функция распределения выражается через , квантиль уровня находится явно. Если - квантиль стандартного нормального закона (), то квантиль логнормального распределения равен
Эта формула - рабочая лошадка прикладных расчётов. Например, верхняя 95-процентная граница (, ) даёт , а центральный 90-процентный интервал заключён между и . Заметьте, что интервал несимметричен относительно медианы : на логарифмической шкале он симметричен, но при возврате в исходную шкалу растягивается вправо. Именно так строят, например, оценки времени безотказной работы или предельных концентраций.
Логнормаль на графике и логарифмическая шкала
Удобный диагностический приём: если построить гистограмму данных в обычных координатах, логнормальное распределение даёт характерный скошенный вправо «горб». Но если перейти к логарифмической оси абсцисс, тот же набор данных превращается в симметричную колоколообразную форму нормального закона. На вероятностной бумаге (Q–Q график логарифмов против нормальных квантилей) логнормальные данные ложатся на прямую - это стандартный способ визуально проверить гипотезу о логнормальности перед формальными критериями согласия вроде Шапиро - Уилка, применённого к .
Частые ошибки
- Путать со средним . Параметр - среднее логарифма, а среднее самой величины равно . Подстановка вместо - самая частая ошибка.
- Забывать множитель в плотности. Без него получается нормальная кривая от , а не плотность ; интеграл по перестаёт давать единицу.
- Оценивать параметры по сырым данным. и считаются по , а не по .
- Применять логнормаль к данным с нулями и отрицательными значениями. Носитель - строго ; нули требуют сдвига или другой модели.
- Считать средним. Это медиана; среднее больше неё.
FAQ
Чем логнормальное распределение отличается от нормального? Нормальное описывает величину, которая может быть любого знака и симметрична относительно среднего. Логнормальное описывает строго положительную величину с правым хвостом; нормальным является лишь её логарифм.
Что означают параметры и ? Это математическое ожидание и стандартное отклонение . В исходной шкале - медиана, а управляет асимметрией и шириной хвоста.
Когда применяют логнормальную модель? Когда величина положительна и формируется как произведение многих случайных факторов: размеры частиц, доходы, время отказа, концентрации, цены активов.
Коротко
Логарифмически нормальное распределение - это закон положительной величины , у которой нормален с параметрами и . Плотность содержит характерный множитель , среднее равно , медиана - , а дисперсия - . Параметры оцениваются по логарифмам данных, а само распределение естественно возникает там, где величина есть произведение многих независимых факторов - мультипликативный аналог центральной предельной теоремы.
Читайте также

Неравенство Йенсена для выпуклых функций: формулы и применение
Неравенство Йенсена для выпуклых функций: дискретная и интегральная формулировки, доказательство, условие равенства, связь с математическим ожиданием и применение в анализе и теории вероятностей.

Распределение Пуассона: свойства, формула и моменты
Распределение Пуассона: свойства закона редких событий, формула вероятности, математическое ожидание и дисперсия, аддитивность, связь с биномиальным и экспоненциальным законами, примеры расчётов.

Характеристическая функция в теории вероятностей
Характеристическая функция : преобразование Фурье плотности, моменты через производные, теорема Леви о непрерывности и вывод центральной предельной теоремы.