Amazon Redshift - kin-kin/memo GitHub Wiki

AWS

Amazon Redshift

  • 列指向ストレージ
    • ロードされたデータは常時S3に自動的にバックアップされる
      • デフォルトの保持期間は1日、最大35日間
    • ストレージ容量はノードタイプによって決められたサイズとノード数
  • 超並列処理(MPP)
    • クラスターは1つのアベイラビリティーゾーン内で構成
      • S3に入力データをアップロードし、複数のアベイラビリティーゾーンに展開したRedshiftをロードすることで、可用性を高める
  • アクセス制御
    • セキュリティグループを使用する
  • 暗号化
    • クラスター作成時にのみ設定可能
      • AWS Certificate Managerを利用して証明書をクラスターにインストールする必要がある
      • クラスター作成後の場合は、現在のクラスターからデータをアンロードし、暗号化設定を有効化した別クラスターを作成した後、アンロードしておいたデータを別クラスターにロードする
  • Redshift Spectrum
    • Redshiftから外部表として読み込む
    • S3バケット内のデータに対して直接クエリを実行

References