Совместное распределение двух случайных величин

Когда задача включает сразу две случайные величины, одних маргинальных распределений недостаточно: важно знать, как и «сочетаются» друг с другом. Именно для этого вводят совместное распределение. Оно полностью описывает, с какой вероятностью принимает одно значение, а - другое одновременно, и позволяет вычислить ковариацию, корреляцию и проверить независимость. Изучите поведение распределения на интерактивном калькуляторе ниже, а затем разберём каждое понятие строго.
Что такое совместное распределение
Для двух дискретных случайных величин и совместное распределение задаётся таблицей вероятностей:
Условие нормировки: сумма всех элементов таблицы должна равняться единице:
Для непрерывных случайных величин роль таблицы играет совместная плотность такая, что:
Вероятность попасть в прямоугольник равна двойному интегралу плотности по этой области. Далее будем работать в первую очередь с дискретным случаем, поскольку именно он чаще встречается в вузовских задачах.
Маргинальные распределения
Из совместной таблицы легко восстановить распределение каждой величины в отдельности - маргинальное распределение. Чтобы получить , достаточно просуммировать строку (или столбец, в зависимости от ориентации таблицы) по всем значениям :
Это - операция «свёртки» таблицы по одному из измерений. Маргиналы дают правые и нижние поля стандартной совместной таблицы - отсюда и название.

Важно понимать: маргиналы не восстанавливают совместное распределение. По и нельзя однозначно определить - для этого нужна дополнительная информация о связи между и .
Независимость двух случайных величин
и называются независимыми, если их совместное распределение равно произведению маргинальных:
Это многомерное условие: одного совпадения недостаточно, нужно проверить каждую клетку таблицы. Если хотя бы одна клетка «не выкладывается» в произведение, величины зависимы.
Для непрерывных величин аналог: для всех .
На практике независимость часто предполагается по условию задачи (« и независимы»), и тогда совместную таблицу можно построить самостоятельно из маргиналов.
Математическое ожидание функции от двух величин
Если известна совместная таблица, математическое ожидание любой функции вычисляется как:
Частный случай - , тогда получаем , который нужен для ковариации. Другой важный частный случай: (линейность математического ожидания; выполняется всегда, независимо от зависимости).
Ковариация и её смысл
Ковариация характеризует, насколько и «меняются вместе»:
Равносильная формула через центрированные величины :
Знак ковариации указывает на направление связи:
- - рост в среднем сопровождается ростом ;
- - рост в среднем сопровождается убыванием ;
- - линейной связи нет (но нелинейная может быть).
Если и независимы, то . Обратное неверно: нулевая ковариация не означает независимости.
Дисперсия суммы выражается через ковариацию:
При независимости ковариация зануляется и дисперсия суммы просто складывается.
Коэффициент корреляции
Ковариация зависит от масштаба величин. Чтобы получить безразмерную меру силы линейной связи, делят ковариацию на произведение стандартных отклонений:
Коэффициент корреляции всегда лежит в . Значения означают точную линейную зависимость (). Значения вблизи нуля - слабую или отсутствующую линейную связь.
Корреляция измеряет только линейную зависимость. Величины могут иметь нулевую корреляцию и при этом жёстко детерминированы нелинейно (например, при симметричном ).
Пример расчёта по таблице
Разберём задачу полностью. Дано совместное распределение дискретных величин и :
| 0,10 | 0,20 | |
| 0,30 | 0,15 | |
| 0,15 | 0,10 |
Шаг 1: проверяем нормировку. - всё верно.
Шаг 2: находим маргинальные распределения суммированием по строкам и столбцам:
Шаг 3: математические ожидания:
Шаг 4: считаем по совместной таблице (ненулевой вклад даёт только и ):
Шаг 5: ковариация:
Отрицательная ковариация указывает, что с ростом значение в среднем убывает. Чтобы найти корреляцию, нужны дисперсии и :
Слабая отрицательная линейная связь. Проверка независимости: , а - величины зависимы.
Условные распределения
Условное распределение при условии - это «сечение» совместной таблицы по столбцу , нормированное на маргиналь :
Условное математическое ожидание вычисляется как обычное ожидание по этому условному распределению. Например, в задаче выше:
то есть зная, что , вероятность снижается с маргинальных до - маленький сдвиг, но он подтверждает слабую отрицательную зависимость.
Если и независимы, условное распределение совпадает с маргинальным - знание значения не меняет «прогноза» для . Именно это свойство является математически строгим определением независимости случайных величин через условные вероятности.
Частые ошибки
- Путать маргинальное с совместным. Знать и недостаточно для восстановления - нужно либо совместное распределение, либо условие независимости.
- Считать нулевую ковариацию признаком независимости. не означает независимости: контрпример - равновероятно, .
- Забыть про условие нормировки. Перед подстановкой в формулы убедитесь, что сумма всех равна ровно 1. Ошибка нормировки «переезжает» во все вычисленные характеристики.
- Применять формулу дисперсии суммы без ковариации. верно только при независимости; в общем случае нужно добавить .
- Брать . Это равенство выполняется только при независимости; при зависимости нужно считать напрямую по совместной таблице.
FAQ
Как проверить независимость X и Y по таблице? Для каждой клетки проверьте равенство . Если хотя бы одно равенство нарушено - величины зависимы. На практике проверяют все клеток.
Чем ковариация отличается от корреляции? Ковариация имеет размерность произведения единиц и и зависит от масштаба измерений. Корреляция - нормированная ковариация без единиц, всегда в , удобна для сравнения разных пар величин. При одинаковых шкалах обе меры дают одинаковую качественную картину.
Можно ли по маргинальным распределениям восстановить совместное? В общем случае - нет. По и существует бесконечно много совместных распределений с теми же маргиналами. Единственный случай однозначного восстановления - независимость: тогда .
Коротко
Совместное распределение двух случайных величин полностью описывает их совместное поведение. Из него получают маргиналы суммированием по строкам и столбцам, проверяют независимость сравнением с произведением маргиналов, вычисляют ковариацию и коэффициент корреляции . Нулевая ковариация не гарантирует независимость, а дисперсия суммы содержит ковариационный член, который обнуляется лишь при независимости.
Читайте также

Распределение суммы независимых случайных величин
Как найти плотность и параметры распределения суммы независимых случайных величин: свёртка, формула Ирвина-Холла, ЦПТ и типичные ошибки студентов теорвера.

Апостериорная вероятность гипотезы: формула Байеса
Что такое апостериорная вероятность гипотезы и как её считать по формуле Байеса: разбор множителей, связь с полной вероятностью, пошаговый пример и типичные ошибки.

Парадокс Монти Холла: почему выгодно менять дверь
Парадокс Монти Холла с тремя дверями простыми словами: почему смена выбора даёт вероятность выигрыша 2/3, разбор через перебор исходов и формулу Байеса, частые ошибки и FAQ.