Amazon Redshift - kin-kin/memo GitHub Wiki
AWS
Amazon Redshift
- 列指向ストレージ
- ロードされたデータは常時S3に自動的にバックアップされる
- ストレージ容量はノードタイプによって決められたサイズとノード数
- 超並列処理(MPP)
- クラスターは1つのアベイラビリティーゾーン内で構成
- S3に入力データをアップロードし、複数のアベイラビリティーゾーンに展開したRedshiftをロードすることで、可用性を高める
- アクセス制御
- 暗号化
- クラスター作成時にのみ設定可能
- AWS Certificate Managerを利用して証明書をクラスターにインストールする必要がある
- クラスター作成後の場合は、現在のクラスターからデータをアンロードし、暗号化設定を有効化した別クラスターを作成した後、アンロードしておいたデータを別クラスターにロードする
- Redshift Spectrum
- Redshiftから外部表として読み込む
- S3バケット内のデータに対して直接クエリを実行
References