Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 빅데이터
- Terraform
- Spark structured streaming
- 추천시스템
- kubernetes
- BigData
- 개발자혜성
- apache spark
- 데이터엔지니어
- AWS SageMaker
- 빅데이터플랫폼
- 데이터엔지니어링
- 하둡
- Python
- Data engineering
- pyspark
- 하둡에코시스템
- cloudera
- 블로그
- hadoop
- redis bloom filter
- recommendation system
- spark
- 클라우데라
- mlops
- kafka
- 개발자
- DataEngineering
- dataengineer
- eks
Archives
- Today
- Total
목록hadoopecosystem (1)
Hyesung Oh
빅데이터 플랫폼 Pilot 프로젝트 01 feat. Cloudera Data Platform
대표적인 하둡의 배포판 회사인 Cloudera 이번 포스트는 Cloudera의 새로운 서비스인 CDP에 대해 알아보고, 직접 설치해본 과정을 정리한 포스트입니다. 1.주제 CDP Trial Version Installation & Demonstration, PoC 2. 주제 선정 배경 2.1 Cloudera vs. Hortonworks : 차이점은 한 벤더를 다른 벤더보다 선택하는 결정적인 역할을하는 것입니다. Cloudera와 Hortonworks는 크게 다음과 같은 측면에서 다릅니다. Cloudera는 장기 목표가 기업 데이터 허브가되는 것이라고 발표했습니다. 따라서 데이터웨어 하우스의 필요성이 줄어 듭니다. 반면에 Hortonworks는 Hadoop 배포판의 공급 업체로 남아 있으며 데이터웨어 하우..
Data Engineering
2020. 8. 31. 17:33