Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 데이터엔지니어
- apache spark
- 클라우데라
- spark
- 추천시스템
- AWS SageMaker
- kafka
- 블로그
- 개발자혜성
- DataEngineering
- Data engineering
- mlops
- pyspark
- 하둡
- cloudera
- BigData
- Terraform
- 빅데이터
- 하둡에코시스템
- 개발자
- kubernetes
- eks
- recommendation system
- hadoop
- Python
- 데이터엔지니어링
- redis bloom filter
- 빅데이터플랫폼
- dataengineer
- Spark structured streaming
Archives
- Today
- Total
목록consumer (1)
Hyesung Oh
Kafka 내부 동작 원리 이해하기 (2) Consumer
Kafka 내부 동작 원리 이해하기 (1) Replication 편에 이어서. 다시 한번 강조하면 이 책은 고승덕님의 실전 카프카 개발부터 운영까지를 스터디하며 이해한 내용을 내 나름대로 정리한 포스팅입니다. 따라서 책과 다른 내용이 있다면 그것은 본인이 실수이니 수정 코멘트 부탁드리겠고, 자세하고 정확한 내용은 책을 참고바랍니다. 컨슈머 오프셋 관리 컨슈머가 제대로 동작하려면 오프셋(Offset) 관리가 핵심이다. 어디까지 읽었는지에 대한 북마크라고 이해하면 된다. 그렇다면 오프셋 정보는 어디에서 관리될까? 카프카에 맡길 수도 있고, 컨슈머 자체적으로 HDFS compatible storage에 저장하여 관리할 수도 있다 (ex. Spark Structured Streaming). 전자 방식의 경우 컨..
Data Engineering/Apache Kafka
2022. 5. 31. 11:57