Training data 2024 - up1/training-courses GitHub Wiki

Course 1 :: การจัดการข้อมูลเพื่อใช้ในการวิเคราะห์ข้อมูลขนาดใหญ่

List of software

Outline

  • ความรู้พื้นฐานเกี่ยวกับ Big Data
  • คุณลักษณะของ Big Data
  • 10V of Big Data
  • ปัญหาและความท้าทายของ Big Data
    • Data modeling
    • Processing
    • Storage
  • Data modeling
  • Modeling
    • Normalization vs Denormalization
  • Big data analysis and processing
    • Batching
    • Realtime
    • Tools
  • Storage
    • SQL vs NoSQL
    • Tools
  • Data pipeline (ETL process)
    • Data source
    • Processing
    • Output
    • Design data pipelines
    • Tools
      • Talend Open Studio
      • Apache Airflow
  • Workshop with Talend Open Studio
    • Install and configuration
    • Create data pipeline
    • Data integration
    • Model design
    • Create and manage job
  • Workshop with Apache Airflow
    • Install and configuration
    • Create data pipeline
      • Load data from data source
      • Transform data (pre-processing)
      • Processing
      • Notification

Course 2 :: การจัดการระบบฐานข้อมูล (RDBMS)

List of software

Outline

  • ทำความเข้าใจเกี่ยวกับ Data model ของการจัดการข้อมูล
    • Relational
    • NoSQL
      • Key-value
      • Document-based
      • Columnar
      • Graph
      • Time-serie
      • Search
  • หลักการในการออกแบบ Relational Database Model
    • ชุดคำสั่งของ SQL
      • การสร้าง table, constraint
      • การใช้งาน CRUD(Create, READ, Update, Delete) operation
      • การจัดการความสัมพันธ์ระหว่าง table
        • One-to-one
        • One-to-many
        • Many-to-many
      • การใช้งาน Index สำหรับการปรับปรุงประสิทธิภาพของการดึงข้อมูล
    • Nomalization vs Denomalization
    • Design for read and Design for write
  • การใช้งาน Database
    • Architecture ของ Database
      • Standalone
      • Master-slave
      • Cluster
    • Design for scaling
    • การออกแบบ และ ใช้งาน Database
    • การใช้งาน Index ประเภทต่าง ๆ