EssayAI
Блог
Блог
Математика и алгоритмы

Уравнения Чепмена-Колмогорова: как связаны переходы

20 июня 2026Время чтения: 8 минут
#уравнения чепмена-колмогорова#марковская цепь#матрица переходов#стационарное распределение#случайный процесс
Уравнения Чепмена-Колмогорова: как связаны переходы

Если процесс «забывает» свою историю и зависит только от текущего состояния, то вероятность попасть из одного состояния в другое за много шагов можно собрать из вероятностей более коротких переходов. Именно это утверждают уравнения Чепмена-Колмогорова - фундаментальное соотношение теории марковских процессов, которое связывает переход за n+mn + m шагов с переходами за nn и mm шагов через суммирование по всем промежуточным состояниям. Ниже разберём дискретную и непрерывную формы, их вывод из марковского свойства, связь с возведением матрицы переходов в степень и переход к стационарному распределению. В калькуляторе ниже можно покрутить вероятности перехода и увидеть, как nn-шаговые вероятности сходятся к предельному распределению.

Марковское свойство как отправная точка

Уравнения Чепмена-Колмогорова существуют не сами по себе - они вытекают из марковского свойства (свойства отсутствия последействия). Случайный процесс {Xt}\{X_t\} марковский, если будущее зависит от прошлого только через настоящее:

P(Xn+1=jXn=i, Xn1,,X0)=P(Xn+1=jXn=i).P(X_{n+1} = j \mid X_n = i,\ X_{n-1}, \dots, X_0) = P(X_{n+1} = j \mid X_n = i).

Иными словами, чтобы предсказать следующее состояние, достаточно знать текущее; вся предыстория несущественна. Это и есть та «потеря памяти», которая делает возможным разбиение длинного перехода на части - процесс в промежуточный момент не помнит, как он туда попал, поэтому дальнейшее движение зависит только от того, где он оказался. Если вы только знакомитесь с тем, как устроены вероятности совместных событий, полезно сначала посмотреть совместное распределение двух случайных величин, а уже потом возвращаться к цепям.

Дискретная форма уравнения Чепмена-Колмогорова

Обозначим pij(n)=P(Xn=jX0=i)p_{ij}^{(n)} = P(X_n = j \mid X_0 = i) - вероятность перейти из состояния ii в состояние jj ровно за nn шагов. Тогда для любого разбиения n+mn + m на два слагаемых выполняется дискретное уравнение Чепмена-Колмогорова:

pij(n+m)=kpik(n)pkj(m).p_{ij}^{(n+m)} = \sum_{k} p_{ik}^{(n)}\, p_{kj}^{(m)}.

Смысл прозрачен: чтобы попасть из ii в jj за n+mn + m шагов, процесс за первые nn шагов должен оказаться в каком-то промежуточном состоянии kk, а за оставшиеся mm шагов - добраться из kk в jj. Поскольку промежуточное состояние может быть любым, мы перебираем все варианты kk и складываем вероятности. Произведение pik(n)pkj(m)p_{ik}^{(n)}\,p_{kj}^{(m)} корректно именно из-за марковского свойства: попав в kk, процесс «не помнит» путь iki \to k, поэтому вероятности независимо умножаются.

Схема разбиения перехода из состояния i в состояние j за n плюс m шагов через промежуточное состояние k с суммированием по всем k
Схема разбиения перехода из состояния i в состояние j за n плюс m шагов через промежуточное состояние k с суммированием по всем k

Связь с матрицей переходов и её степенями

Удобнее всего записать уравнение в матричной форме. Соберём одношаговые вероятности pij=pij(1)p_{ij} = p_{ij}^{(1)} в матрицу переходов PP, где строка ii - это распределение вероятностей следующего состояния при старте из ii. Каждая строка стохастическая: её элементы неотрицательны и в сумме дают единицу. Тогда nn-шаговая матрица - это просто nn-я степень:

P(n)=Pn.P^{(n)} = P^n.

Уравнение Чепмена-Колмогорова при такой записи превращается в тождество для умножения матриц:

P(n+m)=P(n)P(m)=PnPm=Pn+m.P^{(n+m)} = P^{(n)} \cdot P^{(m)} = P^n \cdot P^m = P^{n+m}.

То есть сумма kpik(n)pkj(m)\sum_k p_{ik}^{(n)} p_{kj}^{(m)} - это в точности элемент (i,j)(i, j) произведения матриц PnPmP^n P^m. Поэтому на практике для конечной цепи nn-шаговые вероятности находят не суммированием по путям, а возведением одной матрицы в степень - численно это намного дешевле. Логика степеней матрицы здесь та же, что в задачах на случайные величины и их функции распределения, только объект - матрица, а не одно число.

Проверяйте стохастичность на каждом шаге: если строки $P^n$ перестали суммироваться к единице, в исходной матрице была ошибка. Корректная стохастическая матрица в любой степени остаётся стохастической.

Непрерывная форма: процессы с непрерывным временем

Если время течёт непрерывно, переход описывается не степенью матрицы, а переходной функцией pij(t)=P(Xs+t=jXs=i)p_{ij}(t) = P(X_{s+t} = j \mid X_s = i) (для однородного процесса она не зависит от ss). Уравнение Чепмена-Колмогорова принимает вид:

pij(t+s)=kpik(t)pkj(s).p_{ij}(t + s) = \sum_{k} p_{ik}(t)\, p_{kj}(s).

Для непрерывного пространства состояний сумма заменяется интегралом по плотностям переходных вероятностей:

p(x,t+sy)=p(x,tz)p(z,sy)dz.p(x, t + s \mid y) = \int p(x, t \mid z)\, p(z, s \mid y)\, dz.

Из этого функционального уравнения дифференцированием по времени выводят прямое и обратное уравнения Колмогорова - дифференциальные уравнения, которым подчиняется pij(t)p_{ij}(t). Они описывают, например, диффузию (уравнение Фоккера-Планка как частный случай), очереди, химическую кинетику и популяционную динамику. Уравнение Чепмена-Колмогорова здесь играет роль «закона согласованности»: семейство переходных вероятностей должно склеиваться по времени без противоречий.

Сопоставление дискретной формы с суммой по состояниям и непрерывной формы с интегралом по промежуточным точкам для уравнения Чепмена-Колмогорова
Сопоставление дискретной формы с суммой по состояниям и непрерывной формы с интегралом по промежуточным точкам для уравнения Чепмена-Колмогорова

Стационарное распределение как предел

Чаще всего уравнения Чепмена-Колмогорова применяют, чтобы понять долгосрочное поведение цепи. Для эргодической (неприводимой апериодической) цепи nn-шаговые вероятности перестают зависеть от стартового состояния:

limnpij(n)=πj,\lim_{n \to \infty} p_{ij}^{(n)} = \pi_j,

где π=(π1,π2,)\pi = (\pi_1, \pi_2, \dots) - стационарное распределение. Оно находится как решение системы

πP=π,jπj=1.\pi P = \pi, \qquad \sum_j \pi_j = 1.

Стационарное распределение - это собственный вектор матрицы переходов с собственным значением 11, нормированный к сумме единиц. Содержательно πj\pi_j - доля времени, которую цепь в среднем проводит в состоянии jj на длинном горизонте. Именно к этому пределу сходятся строки PnP^n при росте nn, что хорошо видно в калькуляторе выше: чем больше шагов, тем ближе любая строка nn-шаговой матрицы к одному и тому же вектору π\pi.

Где это работает: примеры применения

Уравнения Чепмена-Колмогорова - не абстракция, а рабочий инструмент. В алгоритме PageRank веб-граф моделируется марковской цепью, а стационарное распределение задаёт «вес» страниц. В теории очередей переходная функция описывает число заявок в системе. В биоинформатике скрытые марковские модели опираются на nn-шаговые переходы при выравнивании последовательностей. В финансах кредитные рейтинги моделируют матрицей миграций, а уравнение Чепмена-Колмогорова даёт вероятность дефолта за несколько лет из годовой матрицы. Во всех случаях ключевой трюк один: длинный горизонт собирается из коротких переходов через суммирование по промежуточным состояниям.

Особенно показателен сценарий с кредитными миграциями. Пусть дана годовая матрица PP переходов между рейтингами (AAA, AA, …, дефолт). Чтобы оценить вероятность дефолта за три года, не нужно строить отдельную трёхлетнюю модель: достаточно посчитать P3P^3 и взять нужный элемент столбца «дефолт». Уравнение Чепмена-Колмогорова гарантирует, что P3=PPPP^3 = P \cdot P \cdot P корректно описывает трёхлетний переход - при условии, что миграции рейтингов обладают марковским свойством (вероятность будущего рейтинга зависит только от текущего, а не от всей кредитной истории). Это допущение и его нарушения - отдельная тема при валидации риск-моделей, но именно уравнение Чепмена-Колмогорова делает такой пересчёт законным.

Частые ошибки

  • Путают pij(n)p_{ij}^{(n)} и (pij)n(p_{ij})^n. nn-шаговая вероятность - это элемент матрицы PnP^n, а не nn-я степень одного числа pijp_{ij}. Возводить в степень нужно всю матрицу.
  • Забывают марковское свойство. Без отсутствия последействия произведение pik(n)pkj(m)p_{ik}^{(n)} p_{kj}^{(m)} некорректно: в немарковском процессе путь до kk влияет на дальнейшее движение, и просто перемножать нельзя.
  • Теряют стохастичность. После арифметических ошибок строки PnP^n не суммируются к единице. Это сигнал, что в расчёте опечатка, а не свойство цепи.
  • Считают стационарным любой предел. Стационарное распределение существует и единственно только для эргодической цепи; у периодической или приводимой цепи строки PnP^n могут не сходиться.
  • Смешивают строки и столбцы. В записи πP=π\pi P = \pi распределение π\pi - строка, и умножается слева. Перепутав на PπP\pi, получают неверную систему.

FAQ

Чем уравнение Чепмена-Колмогорова отличается от уравнений Колмогорова? Уравнение Чепмена-Колмогорова - это интегральное (или матричное) соотношение согласованности переходных вероятностей по времени. Прямое и обратное уравнения Колмогорова - это дифференциальные уравнения для pij(t)p_{ij}(t), которые получаются из уравнения Чепмена-Колмогорова дифференцированием в непрерывном времени.

Зачем нужно суммирование по всем промежуточным состояниям? Промежуточное состояние kk - это «развилка»: процесс может оказаться в любом из них. События «прошёл через k1k_1» и «прошёл через k2k_2» несовместны, поэтому полная вероятность перехода - это сумма по всем возможным kk (формула полной вероятности применённая к марковскому шагу).

Всегда ли PnP^n сходится к стационарному распределению? Нет. Сходимость строк PnP^n к одному вектору π\pi гарантирована для конечной неприводимой апериодической (эргодической) цепи. У периодической цепи (например, переходы строго туда-обратно) степени осциллируют и предела в обычном смысле нет, хотя стационарное распределение как решение πP=π\pi P = \pi всё равно может существовать.

Коротко

Уравнения Чепмена-Колмогорова связывают переход за n+mn + m шагов с переходами за nn и mm шагов: pij(n+m)=kpik(n)pkj(m)p_{ij}^{(n+m)} = \sum_k p_{ik}^{(n)} p_{kj}^{(m)}, а в непрерывном времени сумма становится интегралом. Опираются они на марковское свойство, в матричной форме сводятся к P(n)=PnP^{(n)} = P^n, а в пределе дают стационарное распределение π\pi, к которому сходятся строки PnP^n для эргодической цепи.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также