문제 정의

초기 Kafka 클러스터는 단일 브로커와 1개의 파티션으로 구성되어, 처리 성능이 제한되고 브로커 장애 시 시스템 가용성에 문제가 있었습니다. 병렬 처리가 불가능해 컨슈머가 늘어도 처리 속도가 개선되지 않았고, 확장성도 한계가 있었습니다.

문제 원인

해결 방안

모니터링 및 확인

로깅 및 모니터링 도구를 사용해 메시지 처리량, 컨슈머의 lag을 추적한 결과, 모든 브로커에 부하가 고르게 분산되고, 처리량 증가 및 컨슈머 lag이 감소한 것을 확인했습니다.

image.png

image.png