アナリティクス - SunHigh105/AWS_SAA GitHub Wiki

Amazon EMR

  • Apache系のオープンソースを活用したビックデータのプラットフォーム ペタバイト規模の分析を実行可
  • S3やDynamoDBなどの他のAWSデータストアやデータベースとの間で大量のデータを変換・解析できる
  • ユースケース
    • ビックデータ分析
    • データパイプライン構築
    • リアルタイムデータストリーム処理
    • 機械学習フレームワークを使用したデータ分析

Amazon Kinesis

  • リアルタイムの情報収集、処理、分析
  • データはデフォルトで24時以内までアクセス可

Video Streams

  • 動画のストリーミング

Data Streams

  • スケーラブルで耐久性に優れたリアルタイムデータストリーミング
  • 一連のデータレコードを持つシャードのセット
    • 各データレコートにはシーケンス番号があり、メッセージが失われず、重複されず、到着と同じ順序で伝送可能
  • AWS Lambda または Amazon Kinesis Data Analytics を使用して、クリックストリームデータなどの高頻度のイベントデータ用のアプリケーションを構築
  • データ保持: デフォルト24時間、最大値168時間
  • アップロードされたデータにKMS暗号化キーを指定し、自動的に暗号化を実施
  • コンソールやCloudWatchからメトリクスを参照可能

Data Firehose

  • データストリームをAWSに読み込み準リアルタイムで分析
  • ストリームデータを変換しAmazon S3、Amazon Redshift、Amazon OpenSearch Serviceなどに配信
  • Amazon Kinesis StreamsとAmazon Kinesis Firehoseは何が違うのか
    • Streams: リアルタイム(レイテンシの速さ)、カスタム
    • Firestore: Zero Administration(ゼロ管理)

Data Analytics

  • データストリームをリアルタイムで処理 S3やRedshiftにそのままデータを流す

AWS Glue

  • データの加工などを行うETL(抽出・変換・格納)サービス データを分析する前に使う

Amazon Quicksight

  • ML Insights を含むインタラクティブなダッシュボードを簡単に作成して公開できるBIツール
  • Reservation models for other AWS services リザーブド購入方式
  • 利用可能: RDS, ElastiCache, OpenSearch, RedShift, DynamoDB
  • 利用不可: S3,EFS