Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 개발자
- recommendation system
- Spark structured streaming
- kubernetes
- 데이터엔지니어
- hadoop
- cloudera
- DataEngineering
- 빅데이터플랫폼
- 빅데이터
- spark
- 블로그
- 하둡
- 개발자혜성
- Data engineering
- Python
- kafka
- eks
- Terraform
- AWS SageMaker
- 클라우데라
- redis bloom filter
- 하둡에코시스템
- pyspark
- dataengineer
- 데이터엔지니어링
- 추천시스템
- mlops
- apache spark
- BigData
Archives
- Today
- Total
목록hadoopecosystem (1)
Hyesung Oh
빅데이터 플랫폼 Pilot 프로젝트 01 feat. Cloudera Data Platform
대표적인 하둡의 배포판 회사인 Cloudera 이번 포스트는 Cloudera의 새로운 서비스인 CDP에 대해 알아보고, 직접 설치해본 과정을 정리한 포스트입니다. 1.주제 CDP Trial Version Installation & Demonstration, PoC 2. 주제 선정 배경 2.1 Cloudera vs. Hortonworks : 차이점은 한 벤더를 다른 벤더보다 선택하는 결정적인 역할을하는 것입니다. Cloudera와 Hortonworks는 크게 다음과 같은 측면에서 다릅니다. Cloudera는 장기 목표가 기업 데이터 허브가되는 것이라고 발표했습니다. 따라서 데이터웨어 하우스의 필요성이 줄어 듭니다. 반면에 Hortonworks는 Hadoop 배포판의 공급 업체로 남아 있으며 데이터웨어 하우..
Data Engineering
2020. 8. 31. 17:33