AWSの各種データベースサービス - ntuf/Tips GitHub Wiki
名称 | 分類 | 説明 |
---|---|---|
Amazon RDS | 行指向型RDBMS | OS以下の管理不要、高可用性な、既存データベースを簡単使う場合 |
Amazon DynamoDB | NoSQL(Key-Valueストア) | 大量のオンライントランザクションがある場合向き |
Amazon ElastiCache | NoSQL(Key-Valueストア+インメモリ) | DBの負荷低減用のメモリキャッシュ |
Amazon Redshift | 列指向型RDBMS | 大容量データの分析向き |
■DynamoDBとAWS RDS RDSはリレーショナルデータベース DynamoDBはNoSQL NoSQLはどんなデータも入れられる NoSQLは以下が苦手 テーブルの結合や トランザクションコミットロールバック はできない。 比較的複雑ではないシステムに利用される。 スケーラビリティ システムやサービスが増加する負荷や需要に柔軟に対応できる能力
■AWSのデータ分析サービス ※ETLとはDWH(データウェアハウス)に書き込む前処理のこと ※DynamoDBはS3にエクスポートしてから処理するのが一般的。 ※DynamoDBはOLTP向けのデータベースであるため、データ分析に適さ ない
RDSからAWS Glueを使ってAmazon Redshiftに書き込み、 Amazon QuickSightでビジュアライズするイメージ。
• AWS Glue ETLサービス
• Amazon Redshift DWHサービス
• Amazon EMR (Elastic MapReduce) オープンソースの分散データ処理フレームワーク (Apache Hadoopや Apache Sparkなど)を使用して、 大規模なデータセットを処理、分析するためのサービス
• Amazon Athena S3に保存されたデータをSQLクエリを使用して直接照会できる
• Amazon QuickSight ビジュアルデータ分析サービス