정의
확률 변수의 시퀀스를 모델링하는 통계 구조로, 미래 상태가 오직 현재 상태에만 의존한다는 강한 가정(Markov assumption)을 둔다. 모든 상태가 직접 관측 가능하다는 점에서 HMM과 구별된다.
핵심 속성
- 구성요소:
- Q: N개 상태 집합
- A: 전이 확률 행렬 (aᵢⱼ = P(qᵢ → qⱼ), ∑aᵢⱼ = 1)
- π: 초기 분포
- Markov 가정: P(qᵢ|q₁…qᵢ₋₁) = P(qᵢ|qᵢ₋₁). 어제 날씨를 못 보고 오늘 날씨로만 내일을 예측하는 것과 같음
- 언어 모델로서: bigram language model이 본질적으로 Markov chain. 각 edge가 P(wᵢ|wⱼ)
- 상태는 무엇이든: 단어·태그·날씨·기호 등 임의 집합 사용 가능
- HMM과의 차이: 관측 = 상태 (투명). HMM은 관측 ≠ 상태 (hidden)
관계
- 20260515-hidden-markov-model — 하위/확장: HMM이 Markov chain을 확장한 형태
- 20260515-daniel-jurafsky — 출처
인용
A Markov chain makes a very strong assumption that if we want to predict the future in the sequence, all that matters is the current state. The states before the current state have no impact on the future except via the current state.