Training data 2024 - up1/training-courses GitHub Wiki
Course 1 :: การจัดการข้อมูลเพื่อใช้ในการวิเคราะห์ข้อมูลขนาดใหญ่
List of software
Outline
- ความรู้พื้นฐานเกี่ยวกับ Big Data
- คุณลักษณะของ Big Data
- 10V of Big Data
- ปัญหาและความท้าทายของ Big Data
- Data modeling
- Processing
- Storage
- Data modeling
- Modeling
- Normalization vs Denormalization
- Big data analysis and processing
- Storage
- Data pipeline (ETL process)
- Data source
- Processing
- Output
- Design data pipelines
- Tools
- Talend Open Studio
- Apache Airflow
- Workshop with Talend Open Studio
- Install and configuration
- Create data pipeline
- Data integration
- Model design
- Create and manage job
- Workshop with Apache Airflow
- Install and configuration
- Create data pipeline
- Load data from data source
- Transform data (pre-processing)
- Processing
- Notification
Course 2 :: การจัดการระบบฐานข้อมูล (RDBMS)
List of software
Outline
- ทำความเข้าใจเกี่ยวกับ Data model ของการจัดการข้อมูล
- Relational
- NoSQL
- Key-value
- Document-based
- Columnar
- Graph
- Time-serie
- Search
- หลักการในการออกแบบ Relational Database Model
- ชุดคำสั่งของ SQL
- การสร้าง table, constraint
- การใช้งาน CRUD(Create, READ, Update, Delete) operation
- การจัดการความสัมพันธ์ระหว่าง table
- One-to-one
- One-to-many
- Many-to-many
- การใช้งาน Index สำหรับการปรับปรุงประสิทธิภาพของการดึงข้อมูล
- Nomalization vs Denomalization
- Design for read and Design for write
- การใช้งาน Database
- Architecture ของ Database
- Standalone
- Master-slave
- Cluster
- Design for scaling
- การออกแบบ และ ใช้งาน Database
- การใช้งาน Index ประเภทต่าง ๆ