데이터 엔지니어가 되기 위한 모든 자료들을 모은 Repo
프로젝트/인터뷰/책/커뮤니티/뉴스레터 들 모음
처음이라면 2024 데이터 엔지니어링 진입 로드맵을 읽는 것부터 시작
꼭 읽어야 하는 책 3가지 와 주요 서적 25권
•
견고한 데이터 엔지니어링
•
데이터 중심 애플리케이션 설계
•
머신러닝 시스템 설계
꼭 가입해야할 커뮤니티 5개 와 주요 커뮤니티들 10여개
[DE] DataExpert.io Community Discord
[DE] Data Talks Club Slack
[DE] Data Engineer Things Community
[ML] AdalFlow Discord
[ML] Chip Huyen MLOps Discord
데이터 엔지니어링 관련 기술 회사 와 블로그들
카테고리별 회사 정리 : Orchestration, Data Lake/Cloud, Warehouse, Data Quality, 교육, Analytics/Visualization, Data Integration, Modern OLAP, LLM 응용, 실시간 데이터
블로그 : Netflix , Uber , Databricks , Airbnb , Amazon AWS Blog , Microsoft Data Architecture Blogs , Microsoft Fabric Blog , Oracle , Meta , Onehouse
데이터 엔지니어링 화이트 페이퍼
A Five-Layered Business Intelligence Architecture
Lakehouse:A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics
Big Data Quality: A Data Quality Profiling Model
The Data Lakehouse: Data Warehousing and More
Spark: Cluster Computing with Working Sets
The Google File System
Building a Universal Data Lakehouse
XTable in Action: Seamless Interoperability in Data Lakes
MapReduce: Simplified Data Processing on Large Clusters
주요 소셜 계정과 팟캐스트
꼭 구독해야할 뉴스레터 4개 및 그외 20개 이상의 뉴스레터들
•
DataEngineer.io Newsletter
•
Joe Reis
•
Start Data Engineering
•
Data Engineering Weekly
각종 교육 코스들