Kafka Transaction Commit Marker로 인한 Phantom Lag 현상들어가며Kafka 기반의 이벤트 드리븐 시스템을 운영하다 보면, 모니터링 대시보드에서 consumer lag이 0이 되지 않는 현상을 마주할 때가 있습니다. 메시지를 모두 처리했는데도 lag이 1씩 남아있는 이 현상을 Phantom Lag이라고 부릅니다.이 글에서는 실제 서비스에서 Phantom Lag을 만나게 된 과정, 원인 분석, 그리고 해결 방안을 공유합니다.시스템 구성CDC(Change Data Capture) 기반으로 검색 엔진 인덱싱을 수행하는 스트림 처리 시스템입니다.[MongoDB CDC] → [Indexer] → (delete-request 토픽) → [Deleter] → [Search Engine]..