Цепь Маркова

Це́пь Ма́ркова — последовательность случайных событий с конечным или счётным числом исходов, где вероятность наступления каждого события зависит только от состояния, достигнутого в предыдущем событии^[1]. Характеризуется тем свойством, что, говоря нестрого, при текущем настоящем состоянии системы, её будущее состояние не зависит от прошлого. Названа в честь А. А. Маркова (старшего), который впервые ввёл это понятие в работе 1906 года.^[2]

Цепь Маркова с дискретным временем

Определение

Последовательность дискретных случайных величин $\{X_{n}\}_{n\geqslant 0}$ называется простой цепью Маркова (с дискретным временем), если

\mathbb {P} (X_{n+1}=i_{n+1}\mid X_{n}=i_{n},X_{n-1}=i_{n-1},\ldots ,X_{0}=i_{0})=\mathbb {P} (X_{n+1}=i_{n+1}\mid X_{n}=i_{n})

.

Таким образом, в простейшем случае условное распределение последующего состояния цепи Маркова зависит только от текущего состояния и не зависит от всех предыдущих состояний (в отличие от цепей Маркова высших порядков).

Область значений случайных величин $\{X_{n}\}$ называется простра́нством состоя́ний цепи, а номер $n$ — номером шага.

Переходная матрица и однородные цепи

Матрица $P{(n)}$ , где

P_{ij}{(n)}\equiv \mathbb {P} (X_{n+1}=j\mid X_{n}=i)

называется ма́трицей перехо́дных вероя́тностей на $n$ -м шаге, а вектор $\mathbf {p} =(p_{1},p_{2},\ldots )^{\top }$ , где

p_{i}\equiv \mathbb {P} (X_{0}=i)

— нача́льным распределе́нием цепи Маркова.

Очевидно, матрица переходных вероятностей является стохастической справа, то есть

\sum \limits _{j}P_{ij}(n)=1,\quad \forall n\in \mathbb {N}

.

Цепь Маркова называется одноро́дной, если матрица переходных вероятностей не зависит от номера шага, то есть

P_{ij}{(n)}=P_{ij},\quad \forall n\in \mathbb {N}

.

В противном случае цепь Маркова называется неоднородной. В дальнейшем будем предполагать, что имеем дело с однородными цепями Маркова.

Конечномерные распределения и матрица перехода за n шагов

Из свойств условной вероятности и определения однородной цепи Маркова получаем:

\mathbb {P} (X_{n}=i_{n},\ldots ,X_{0}=i_{0})=P_{i_{n-1},i_{n}}\cdots P_{i_{0},i_{1}}P_{i_{0}}

,

откуда вытекает специальный случай уравнения Колмогорова — Чепмена:

\mathbb {P} (X_{n}=i_{n}\mid X_{0}=i_{0})=(P^{n})_{i_{0},i_{n}}

,

то есть матрица переходных вероятностей за $n$ шагов однородной цепи Маркова есть $n$ -я степень матрицы переходных вероятностей за 1 шаг. Наконец,

\mathbb {P} (X_{n}=i_{n})=\left((P^{T})^{n}\mathbf {p} \right)_{i_{n}}

.

Типы состояний

Возвратное состояние.
Возвратная цепь Маркова.
Достижимое состояние.
Неразложимая цепь Маркова.
Периодическое состояние.
Периодическая цепь Маркова.
Поглощающее состояние. Состояние $i$ называется поглощающим, если $P_{i,i}=1$ .
Эргодическое состояние.

Примеры

Цепь Маркова с непрерывным временем

Определение

Семейство дискретных случайных величин $\{X_{t}\}_{t\geqslant 0}$ называется цепью Маркова (с непрерывным временем), если

\mathbb {P} (X_{t+h}=x_{t+h}\mid X_{s}=x_{s},\;0<s\leqslant t)=\mathbb {P} (X_{t+h}=x_{t+h}\mid X_{t}=x_{t})

.

Цепь Маркова с непрерывным временем называется однородной, если

\mathbb {P} (X_{t+h}=x_{t+h}\mid X_{t}=x_{t})=\mathbb {P} (X_{h}=x_{h}\mid X_{0}=x_{0})

.

Матрица переходных функций и уравнение Колмогорова — Чепмена

Аналогично случаю дискретного времени, конечномерные распределения однородной цепи Маркова с непрерывным временем полностью определены начальным распределением

\mathbf {p} =(p_{1},p_{2},\ldots )^{\top },\;p_{i}=\mathbb {P} (X_{0}=i),\quad i=1,2,\ldots

и ма́трицей перехо́дных фу́нкций (переходных вероятностей)

\mathbf {P} (h)=(P_{ij}(h))=\mathbb {P} (X_{h}=j\mid X_{0}=i)

.

Матрица переходных вероятностей удовлетворяет уравнению Колмогорова — Чепмена: $\mathbf {P} (t+s)=\mathbf {P} (t)\mathbf {P} (s)$ или

P_{ij}(t+s)=\sum _{k}P_{ik}(t)P_{kj}(s).

Матрица интенсивностей и дифференциальные уравнения Колмогорова

По определению матрица интенсивностей $\mathbf {Q} =\lim _{h\to 0}{\frac {\mathbf {P} (h)-\mathbf {I} }{h}}$ , или, что эквивалентно,

\mathbf {Q} =(q_{ij})=\left({\frac {dP_{ij}(h)}{dh}}\right)_{h=0}

.

Из уравнения Колмогорова — Чепмена следуют два уравнения:

Прямое уравнение Колмогорова
${\frac {d\mathbf {P} (t)}{dt}}=\mathbf {P} (t)\mathbf {Q} ,$
Обратное уравнение Колмогорова
${\frac {d\mathbf {P} (t)}{dt}}=\mathbf {Q} \mathbf {P} (t).$

Для обоих уравнений начальным условием выбирается $\mathbf {P} (0)=\mathbf {I}$ . Соответствующее решение $\mathbf {P} (t)=\exp(\mathbf {Q} t).$

Свойства матриц P и Q

Для любого $t>0$ матрица $\mathbf {P} (t)$ обладает следующими свойствами:

Матричные элементы $\mathbf {P} (t)$ неотрицательны: $P_{ij}(t)\geqslant 0$ (неотрицательность вероятностей).
Сумма элементов в каждой строке $\mathbf {P} (t)$ равна 1: $\sum _{j}P_{ij}(t)=1$ (полная вероятность), то есть матрица $\mathbf {P} (t)$ является стохастической справа (или по строкам).
Все собственные числа $\lambda$ матрицы $\mathbf {P} (t)$ не превосходят 1 по абсолютной величине: $|\lambda |\leqslant 1$ . Если $|\lambda |=1$ , то $\lambda =1$ .
Собственному числу $\lambda =1$ матрицы $\mathbf {P} (t)$ соответствует как минимум один неотрицательный левый собственный вектор-строка (равновесие): $(p_{1}^{*},\,p_{2}^{*},...);$ $p_{i}^{*}\geqslant 0;$ $\sum _{i}p_{i}^{*}=1;$ $\sum _{i}p_{i}^{*}P_{ij}(t)=p_{j}^{*}$ .
Для собственного числа $\lambda =1$ матрицы $\mathbf {P} (t)$ все корневые векторы являются собственными, то есть соответствующие жордановы клетки тривиальны.

Матрица $\mathbf {Q}$ обладает следующими свойствами:

Внедиагональные матричные элементы $\mathbf {Q}$ неотрицательны: $q_{ij}\geqslant 0\;i\neq j$ .
Диагональные матричные элементы $\mathbf {Q}$ неположительны: $q_{ii}\leqslant 0$ .
Сумма элементов в каждой строке $\mathbf {Q}$ равна 0: $\sum _{j}q_{ij}=0.$
Действительная часть всех собственных чисел $\mu$ матрицы $\mathbf {Q}$ неположительна: $Re(\mu )\leqslant 0$ . Если $Re(\mu )=0$ , то $\mu =0.$
Собственному числу $\mu =0$ матрицы $\mathbf {Q}$ соответствует как минимум один неотрицательный левый собственный вектор-строка (равновесие): $(p_{1}^{*},\,p_{2}^{*},...);$ $p_{i}^{*}\geqslant 0;$ $\sum _{i}p_{i}^{*}=1;$ $\sum _{i}p_{i}^{*}q_{ij}=0.$
Для собственного числа $\mu =0$ матрицы $\mathbf {Q}$ все корневые векторы являются собственными, то есть соответствующие жордановы клетки тривиальны.

Граф переходов, связность и эргодические цепи Маркова

Для цепи Маркова с непрерывным временем строится ориентированный граф переходов (кратко — граф переходов) по следующим правилам:

Множество вершин графа совпадает со множеством состояний цепи.
Вершины $i,j\,(i\neq j)$ соединяются ориентированным ребром $i\to j$ , если $q_{ij}>0$ (то есть интенсивность потока из $i$ -го состояния в $j$ -е положительна).

Топологические свойства графа переходов связаны со спектральными свойствами матрицы $\mathbf {Q}$ . В частности, для конечных цепей Маркова верны следующие теоремы:

Следующие три свойства А, Б, В конечной цепи Маркова эквивалентны (обладающие ими цепи иногда называют слабо эргодическими):

А. Для любых двух различных вершин графа переходов

i,j\,(i\neq j)

найдется такая вершина

k

графа («общий сток»), что существуют ориентированные пути от вершины

i

к вершине

k

и от вершины

j

к вершине

k

. Замечание: возможен случай

k=i

или

k=j

; в этом случае тривиальный (пустой) путь от

i

к

i

или от

j

к

j

также считается ориентированным путём.

Б. Нулевое собственное число матрицы

\mathbf {Q}

невырождено.

В. При

t\to \infty

матрица

\mathbf {P} (t)

стремится к матрице, у которой все строки совпадают (и совпадают, очевидно, с равновесным распределением).

Следующие пять свойств А, Б, В, Г, Д конечной цепи Маркова эквивалентны (обладающие ими цепи называют эргодическими):

А. Граф переходов цепи ориентированно связен.

Б. Нулевое собственное число матрицы

\mathbf {Q}

невырождено и ему соответствует строго положительный левый собственный вектор (равновесное распределение).

В. Для некоторого

t>0

матрица

\mathbf {P} (t)

строго положительна (то есть

P_{ij}(t)>0

для всех

i,j

).

Г. Для всех

t>0

матрица

\mathbf {P} (t)

строго положительна.

Д. При

t\to \infty

матрица

\mathbf {P} (t)

стремится к строго положительной матрице, у которой все строки совпадают (и совпадают, очевидно, с равновесным распределением).

Примеры

Рассмотрим цепи Маркова с тремя состояниями и с непрерывным временем, соответствующие графам переходов, представленным на рис. В случае (a) отличны от нуля только следующие недиагональные элементы матрицы интенсивностей — $q_{12},\,q_{13}$ , в случае (b) отличны от нуля только $q_{12},\,q_{31}\,q_{32}$ , а в случае (c) — $q_{12},\,q_{31}\,q_{23}$ . Остальные элементы определяются свойствами матрицы $\mathbf {Q}$ (сумма элементов в каждой строке равна 0). В результате для графов (a), (b), (c) матрицы интенсивностей имеют вид: $\mathbf {Q} _{a}={\begin{pmatrix}-(q_{12}+q_{13})&q_{12}&q_{13}\\0&0&0\\0&0&0\end{pmatrix}},$ $\mathbf {Q} _{b}={\begin{pmatrix}-q_{12}&q_{12}&0\\0&0&0\\q_{31}&q_{32}&-(q_{31}+q_{32})\end{pmatrix}},$ $\mathbf {Q} _{c}={\begin{pmatrix}-q_{12}&q_{12}&0\\0&-q_{23}&q_{23}\\q_{31}&0&-q_{31}\end{pmatrix}},$

Основное кинетическое уравнение

Основное кинетическое уравнение описывает эволюцию распределения вероятностей в цепи Маркова с непрерывным временем. «Основное уравнение» здесь — не эпитет, а перевод термина англ. Master equation. Для вектора-строки распределения вероятностей $\pi$ основное кинетическое уравнение имеет вид:

{\frac {d\pi }{dt}}=\pi \mathbf {Q}

и совпадает, по существу, с прямым уравнением Колмогорова. В физической литературе чаще используют векторы-столбцы вероятностей и записывают основное кинетическое уравнение в виде, который явно использует закон сохранения полной вероятности:

{\frac {dp_{i}}{dt}}=\sum _{j,\,j\neq i}(T_{ij}p_{j}-T_{ji}p_{i}),

где $T_{ij}=q_{ji}.$

Если для основного кинетического уравнения существует положительное равновесие $p_{i}^{*}>0$ , то его можно записать в форме

{\frac {dp_{i}}{dt}}=\sum _{j,\,j\neq i}T_{ij}p_{j}^{*}\left({\frac {p_{j}}{p_{j}^{*}}}-{\frac {p_{i}}{p_{i}^{*}}}\right).

Функции Ляпунова для основного кинетического уравнения

Для основного кинетического уравнения существует богатое семейство выпуклых функций Ляпунова — монотонно меняющихся со временем функций распределения вероятностей. Пусть $h(x)\,(x>0)$ — выпуклая функция одного переменного. Для любого положительного распределения вероятностей ( $p_{i}>0$ ) определим функцию Моримото $H_{h}(p)$ :

H_{h}(p)=\sum _{i}p_{i}^{*}h\left({\frac {p_{i}}{p_{i}^{*}}}\right)

.

Производная $H_{h}(p)$ по времени, если $p(t)$ удовлетворяет основному кинетическому уравнению, есть

{\frac {dH_{h}(p(t))}{dt}}=\sum _{i,j\,i\neq j}T_{ij}p_{j}^{*}\left[h\left({\frac {p_{i}}{p_{i}^{*}}}\right)-h\left({\frac {p_{j}}{p_{j}^{*}}}\right)+h'\left({\frac {p_{i}}{p_{i}^{*}}}\right)\left({\frac {p_{j}}{p_{j}^{*}}}-{\frac {p_{i}}{p_{i}^{*}}}\right)\right]\leqslant 0

.

Последнее неравенство справедливо из-за выпуклости $h(x)$ .

Примеры функций Моримото $H_{h}(p)$

$h(x)=|x-1|$ , $H_{h}(p)=\sum _{i}|p_{i}-p_{i}^{*}|$ ;

эта функция — расстояние от текущего распределения вероятностей до равновесного в

l_{1}

-норме. Сдвиг по времени является сжатием пространства вероятностных распределений в этой норме. (О свойствах сжатий см. статью Теорема Банаха о неподвижной точке.)

$h(x)=x\ln x$ , $H_{h}(p)=\sum _{i}p_{i}\ln \left({\frac {p_{i}}{p_{i}^{*}}}\right)$ ;

эта функция — (минус) энтропия Кульбака (см. Расстояние Кульбака — Лейблера). В физике она соответствует свободной энергии, деленной на

kT

(где

k

— постоянная Больцмана,

T

— абсолютная температура):

если

p_{i}^{*}=\exp(\mu _{0}-U_{i}/kT)

(распределение Больцмана), то

H_{h}(p)=\sum _{i}p_{i}\ln p_{i}+\sum _{i}p_{i}U_{i}/kT-\mu _{0}=(\langle U\rangle -TS)/kT

.

$h(x)=-\ln x$ , $H_{h}(p)=-\sum _{i}p_{i}^{*}\ln \left({\frac {p_{i}}{p_{i}^{*}}}\right)$ ;

эта функция — аналог свободной энергии для энтропии Бурга, широко используемой в обработке сигналов:

S_{\rm {Burg}}=\sum _{i}\ln p_{i}

$h(x)={\frac {(x-1)^{2}}{2}}$ , $H_{h}(p)=\sum _{i}{\frac {(p_{i}-p_{i}^{*})^{2}}{2p_{i}^{*}}}$ ;

это квадратичное приближение для (минус) энтропии Кульбака вблизи точки равновесия. С точностью до постоянного во времени слагаемого эта функция совпадает с (минус) энтропией Фишера, которую даёт следующий выбор,

$h(x)={\frac {x^{2}}{2}}$ , $H_{h}(p)=\sum _{i}{\frac {p_{i}^{2}}{2p_{i}^{*}}}$ ;

это (минус) энтропия Фишера.

$h(x)={\frac {x^{q}-1}{q-1}},\,q>0,\,q\neq 1$ , $H_{h}(p)={\frac {1}{q-1}}\left[\sum _{i}p_{i}^{*}\left({\frac {p_{i}}{p_{i}^{*}}}\right)^{q}-1\right]$ ;

это один из аналогов свободной энергии для энтропии Тсаллиса^[англ.].

S_{q{\rm {Tsallis}}}(p)={1 \over q-1}\left(1-\sum _{i}p_{i}^{q}\right).

служит основой для статистической физики неэкстенсивных величин. При

q\to 1

она стремится к классической энтропии Больцмана — Гиббса — Шеннона, а соответствующая функция Моримото — к (минус) энтропии Кульбака.

Практическое применение

Одной из первых научных дисциплин, в которой цепи Маркова нашли практическое применение, стала лингвистика (в частности текстология). Сам Марков для иллюстрации своих результатов исследовал зависимость в чередовании гласных и согласных в первых главах «Евгения Онегина» и «Детских годов Багрова-внука»^[3].

Примечания

↑ "Markov chain | Definition of Markov chain in US English by Oxford Dictionaries" (англ.). Oxford Dictionaries | English.. Lexico Dictionaries | English (14 декабря 2017). Дата обращения: 1 апреля 2020. Архивировано из оригинала 25 февраля 2021 года.
↑ Gagniuc, Paul A. Markov Chains: From Theory to Implementation and Experimentation (англ.). — USA, NJ: John Wiley & Sons, 2017. — P. 2—8. — ISBN 978-1-119-38755-8.
↑ Майстров, Л. Е. Развитие понятия вероятности. — Наука, 1980. — С. 188. — 269 с.

Литература

Кельберт М. Я., Сухов Ю. М. Вероятность и статистика в примерах и задачах. Т. ІІ: Марковские цепи как отправная точка теории случайных процессов и их приложения. — М.: МЦНМО, 2010. — 295 с. — ISBN 978-5-94057-252-7.
Марков А. А., Распространение закона больших чисел на величины, зависящие друг от друга. — Известия физико-математического общества при Казанском университете. — 2-я серия. — Том 15. (1906) — С. 135—156.
Маркова цепь / А. В. Прохоров // Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов. — М. : Большая российская энциклопедия, 2004—2017.
Kemeny J. G., Snell J. L., Finite Markov chains. — The University Series in Undergraduate Mathematics. — Princeton: Van Nostrand, 1960
- Перевод: Кемени Дж. Дж., Снелл Дж. Л. Конечные цепи Маркова. — М.: Наука. 1970. — 272 с.
Чжун Кай-лай Однородные цепи Маркова. Перев. с англ. — М.: Мир, 1964. — 425 с.
Нуммелин Э., Общие неприводимые цепи Маркова и неотрицательные операторы. — М.: Мир, 1989. — 207 с.
Morimoto T., Markov processes and the H-theorem. — J. Phys. Soc. Jap. 12 (1963), 328—331.
Яглом А. М., Яглом И. М., Вероятность и информация. — М., Наука, 1973. — 512 с.
Kullback S., Information theory and statistics. — Wiley, New York, 1959.
Burg J.P., The Relationship Between Maximum Entropy Spectra and Maximum Likelihood Spectra, Geophysics 37(2) (1972), 375—376.
Tsallis C., Possible generalization of Boltzmann-Gibbs statistics. J. Stat. Phys. 52 (1988), 479—487.
Рудой Ю. Г., Обобщенная информационная энтропия и неканоническое распределение в равновесной статистической механике, ТМФ, 135:1 (2003), 3-54.
Gorban, Alexander N.; Gorban, Pavel A.; Judge, George. Entropy: The Markov Ordering Approach. Entropy 12, no. 5 (2010), 1145—1193.

Ссылки

SolidMinus. Разработка класса для работы с цепями Маркова (рус.). Хабрахабр (1 июня 2016). Дата обращения: 18 августа 2016.

[1] "Markov chain | Definition of Markov chain in US English by Oxford Dictionaries" (англ.). Oxford Dictionaries | English.. Lexico Dictionaries | English (14 декабря 2017). Дата обращения: 1 апреля 2020. Архивировано из оригинала 25 февраля 2021 года.

[2] Gagniuc, Paul A. Markov Chains: From Theory to Implementation and Experimentation (англ.). — USA, NJ: John Wiley & Sons, 2017. — P. 2—8. — ISBN 978-1-119-38755-8.

[3] Майстров, Л. Е. Развитие понятия вероятности. — Наука, 1980. — С. 188. — 269 с.

[1]

[2]

[3]

Ссылки на внешние ресурсы
Тематические сайты	MathWorld nLab
Словари и энциклопедии	Большая китайская Большая китайская Большая китайская Большая российская (старая версия) Britannica (онлайн) Современной Украины
В библиографических каталогах	BNE: XX540042 BNF: 11932425d GND: 4134948-9 J9U: 987007553386405171 LCCN: sh85081369

Классификация состояний и цепей Маркова
Состояние	апериодическое возвратное достижимое невозвратное несущественное нулевое периодическое положительное сообщающееся существенное
Цепь	апериодическая возвратная невозвратная неразложимая нулевая периодическая, в том числе Циклический подкласс положительная разложимая эргодическая

Машинное обучение и data mining
Задачи	Задача классификации Обучение без учителя Обучение с частичным привлечением учителя Регрессионный анализ AutoML Ассоциативные правила Выделение признаков Обучение признакам Обучение ранжированию Грамматический вывод Онлайновое обучение
Обучение с учителем	Метод k ближайших соседей Наивный байесовский классификатор Дерево решений Метод опорных векторов Линейная регрессия Логистическая регрессия Перцептрон Ансамблевое обучение Бэггинг Бустинг Метод случайного леса Метод релевантных векторов
Кластерный анализ	Метод k-средних Метод нечёткой кластеризации Иерархическая кластеризация EM-алгоритм BIRCH CURE DBSCAN OPTICS Mean-shift
Снижение размерности	Факторный анализ Метод главных компонент CCA ICA LDA Неотрицательное матричное разложение t-SNE
Структурное прогнозирование	Графовая вероятностная модель Байесовская сеть Скрытая марковская модель CRF
Выявление аномалий	Метод k ближайших соседей Локальный уровень выброса
Графовые вероятностные модели	Байесовская сеть Марковская сеть Скрытая марковская модель
Нейронные сети	Ограниченная машина Больцмана Самоорганизующаяся карта Функция активации Сигмоида Softmax Радиально-базисная функция Метод обратного распространения ошибки Глубокое обучение Многослойный перцептрон Рекуррентная нейронная сеть Долгая краткосрочная память Управляемый рекуррентный блок Свёрточная нейронная сеть U-Net Автокодировщик
Обучение с подкреплением	Марковский процесс Уравнение Беллмана Жадный алгоритм Q-обучение SARSA Temporal difference (TD)
Теория	Размерность Вапника — Червоненкиса Дилемма смещения–дисперсии Теория вычислительного обучения Минимизация эмпирического риска Оккамово обучение PAC learning Статистическая теория обучения
Журналы и конференции	NeurIPS ICML ML JMLR ArXiv:cs.LG

Цепь Маркова

Содержание

Цепь Маркова с дискретным временем

Определение

Переходная матрица и однородные цепи

Конечномерные распределения и матрица перехода за n шагов

Типы состояний

Примеры

Цепь Маркова с непрерывным временем

Определение

Матрица переходных функций и уравнение Колмогорова — Чепмена

Матрица интенсивностей и дифференциальные уравнения Колмогорова

Свойства матриц P и Q

Граф переходов, связность и эргодические цепи Маркова

Примеры

Основное кинетическое уравнение

Функции Ляпунова для основного кинетического уравнения

Примеры функций Моримото $H_{h}(p)$

Практическое применение

Примечания

Литература

Ссылки

Навигация

Цепь Маркова

Цепь Маркова с дискретным временем

Определение

Переходная матрица и однородные цепи

Конечномерные распределения и матрица перехода за n шагов

Типы состояний

Примеры

Цепь Маркова с непрерывным временем

Определение

Матрица переходных функций и уравнение Колмогорова — Чепмена

Матрица интенсивностей и дифференциальные уравнения Колмогорова

Свойства матриц P и Q

Граф переходов, связность и эргодические цепи Маркова

Примеры

Основное кинетическое уравнение

Функции Ляпунова для основного кинетического уравнения

Примеры функций Моримото H h ( p ) {\displaystyle H_{h}(p)}

Практическое применение

Примечания

Литература

Ссылки

Навигация

Поиск

Примеры функций Моримото $H_{h}(p)$