Уравнения Чепмена-Колмогорова: как связаны переходы

Если процесс «забывает» свою историю и зависит только от текущего состояния, то вероятность попасть из одного состояния в другое за много шагов можно собрать из вероятностей более коротких переходов. Именно это утверждают уравнения Чепмена-Колмогорова - фундаментальное соотношение теории марковских процессов, которое связывает переход за шагов с переходами за и шагов через суммирование по всем промежуточным состояниям. Ниже разберём дискретную и непрерывную формы, их вывод из марковского свойства, связь с возведением матрицы переходов в степень и переход к стационарному распределению. В калькуляторе ниже можно покрутить вероятности перехода и увидеть, как -шаговые вероятности сходятся к предельному распределению.
Марковское свойство как отправная точка
Уравнения Чепмена-Колмогорова существуют не сами по себе - они вытекают из марковского свойства (свойства отсутствия последействия). Случайный процесс марковский, если будущее зависит от прошлого только через настоящее:
Иными словами, чтобы предсказать следующее состояние, достаточно знать текущее; вся предыстория несущественна. Это и есть та «потеря памяти», которая делает возможным разбиение длинного перехода на части - процесс в промежуточный момент не помнит, как он туда попал, поэтому дальнейшее движение зависит только от того, где он оказался. Если вы только знакомитесь с тем, как устроены вероятности совместных событий, полезно сначала посмотреть совместное распределение двух случайных величин, а уже потом возвращаться к цепям.
Дискретная форма уравнения Чепмена-Колмогорова
Обозначим - вероятность перейти из состояния в состояние ровно за шагов. Тогда для любого разбиения на два слагаемых выполняется дискретное уравнение Чепмена-Колмогорова:
Смысл прозрачен: чтобы попасть из в за шагов, процесс за первые шагов должен оказаться в каком-то промежуточном состоянии , а за оставшиеся шагов - добраться из в . Поскольку промежуточное состояние может быть любым, мы перебираем все варианты и складываем вероятности. Произведение корректно именно из-за марковского свойства: попав в , процесс «не помнит» путь , поэтому вероятности независимо умножаются.

Связь с матрицей переходов и её степенями
Удобнее всего записать уравнение в матричной форме. Соберём одношаговые вероятности в матрицу переходов , где строка - это распределение вероятностей следующего состояния при старте из . Каждая строка стохастическая: её элементы неотрицательны и в сумме дают единицу. Тогда -шаговая матрица - это просто -я степень:
Уравнение Чепмена-Колмогорова при такой записи превращается в тождество для умножения матриц:
То есть сумма - это в точности элемент произведения матриц . Поэтому на практике для конечной цепи -шаговые вероятности находят не суммированием по путям, а возведением одной матрицы в степень - численно это намного дешевле. Логика степеней матрицы здесь та же, что в задачах на случайные величины и их функции распределения, только объект - матрица, а не одно число.
Проверяйте стохастичность на каждом шаге: если строки $P^n$ перестали суммироваться к единице, в исходной матрице была ошибка. Корректная стохастическая матрица в любой степени остаётся стохастической.
Непрерывная форма: процессы с непрерывным временем
Если время течёт непрерывно, переход описывается не степенью матрицы, а переходной функцией (для однородного процесса она не зависит от ). Уравнение Чепмена-Колмогорова принимает вид:
Для непрерывного пространства состояний сумма заменяется интегралом по плотностям переходных вероятностей:
Из этого функционального уравнения дифференцированием по времени выводят прямое и обратное уравнения Колмогорова - дифференциальные уравнения, которым подчиняется . Они описывают, например, диффузию (уравнение Фоккера-Планка как частный случай), очереди, химическую кинетику и популяционную динамику. Уравнение Чепмена-Колмогорова здесь играет роль «закона согласованности»: семейство переходных вероятностей должно склеиваться по времени без противоречий.

Стационарное распределение как предел
Чаще всего уравнения Чепмена-Колмогорова применяют, чтобы понять долгосрочное поведение цепи. Для эргодической (неприводимой апериодической) цепи -шаговые вероятности перестают зависеть от стартового состояния:
где - стационарное распределение. Оно находится как решение системы
Стационарное распределение - это собственный вектор матрицы переходов с собственным значением , нормированный к сумме единиц. Содержательно - доля времени, которую цепь в среднем проводит в состоянии на длинном горизонте. Именно к этому пределу сходятся строки при росте , что хорошо видно в калькуляторе выше: чем больше шагов, тем ближе любая строка -шаговой матрицы к одному и тому же вектору .
Где это работает: примеры применения
Уравнения Чепмена-Колмогорова - не абстракция, а рабочий инструмент. В алгоритме PageRank веб-граф моделируется марковской цепью, а стационарное распределение задаёт «вес» страниц. В теории очередей переходная функция описывает число заявок в системе. В биоинформатике скрытые марковские модели опираются на -шаговые переходы при выравнивании последовательностей. В финансах кредитные рейтинги моделируют матрицей миграций, а уравнение Чепмена-Колмогорова даёт вероятность дефолта за несколько лет из годовой матрицы. Во всех случаях ключевой трюк один: длинный горизонт собирается из коротких переходов через суммирование по промежуточным состояниям.
Особенно показателен сценарий с кредитными миграциями. Пусть дана годовая матрица переходов между рейтингами (AAA, AA, …, дефолт). Чтобы оценить вероятность дефолта за три года, не нужно строить отдельную трёхлетнюю модель: достаточно посчитать и взять нужный элемент столбца «дефолт». Уравнение Чепмена-Колмогорова гарантирует, что корректно описывает трёхлетний переход - при условии, что миграции рейтингов обладают марковским свойством (вероятность будущего рейтинга зависит только от текущего, а не от всей кредитной истории). Это допущение и его нарушения - отдельная тема при валидации риск-моделей, но именно уравнение Чепмена-Колмогорова делает такой пересчёт законным.
Частые ошибки
- Путают и . -шаговая вероятность - это элемент матрицы , а не -я степень одного числа . Возводить в степень нужно всю матрицу.
- Забывают марковское свойство. Без отсутствия последействия произведение некорректно: в немарковском процессе путь до влияет на дальнейшее движение, и просто перемножать нельзя.
- Теряют стохастичность. После арифметических ошибок строки не суммируются к единице. Это сигнал, что в расчёте опечатка, а не свойство цепи.
- Считают стационарным любой предел. Стационарное распределение существует и единственно только для эргодической цепи; у периодической или приводимой цепи строки могут не сходиться.
- Смешивают строки и столбцы. В записи распределение - строка, и умножается слева. Перепутав на , получают неверную систему.
FAQ
Чем уравнение Чепмена-Колмогорова отличается от уравнений Колмогорова? Уравнение Чепмена-Колмогорова - это интегральное (или матричное) соотношение согласованности переходных вероятностей по времени. Прямое и обратное уравнения Колмогорова - это дифференциальные уравнения для , которые получаются из уравнения Чепмена-Колмогорова дифференцированием в непрерывном времени.
Зачем нужно суммирование по всем промежуточным состояниям? Промежуточное состояние - это «развилка»: процесс может оказаться в любом из них. События «прошёл через » и «прошёл через » несовместны, поэтому полная вероятность перехода - это сумма по всем возможным (формула полной вероятности применённая к марковскому шагу).
Всегда ли сходится к стационарному распределению? Нет. Сходимость строк к одному вектору гарантирована для конечной неприводимой апериодической (эргодической) цепи. У периодической цепи (например, переходы строго туда-обратно) степени осциллируют и предела в обычном смысле нет, хотя стационарное распределение как решение всё равно может существовать.
Коротко
Уравнения Чепмена-Колмогорова связывают переход за шагов с переходами за и шагов: , а в непрерывном времени сумма становится интегралом. Опираются они на марковское свойство, в матричной форме сводятся к , а в пределе дают стационарное распределение , к которому сходятся строки для эргодической цепи.
Читайте также

Процесс Орнштейна-Уленбека: средневозвратная диффузия
Процесс Орнштейна-Уленбека: средневозвратная диффузия, её стохастическое уравнение, среднее и дисперсия, стационарное распределение, автокорреляция и связь с уравнением Ланжевена.

Абстрактный класс и интерфейс: в чём отличие
Абстрактный класс и интерфейс: чем отличаются в ООП, когда наследовать поведение, а когда задавать контракт, как выбрать на примерах Java, C# и Python.

Алгоритм AdaBoost: как слабые классификаторы дают сильный
Алгоритм AdaBoost простыми словами: адаптивный бустинг, перевзвешивание объектов, формула веса классификатора, итоговый ансамбль и разбор шага на примере с формулами.