12月2日~6日(米国時間)の5日間に渡って、AWSの年次カンファレンス「AWS re:Invent 2019」が米ラスベガスで開催されています。全世界から集まった参加者は約6万5000人、5つの会場で行われるセッションの数は3000以上にもなります。ちなみに最初のre:Inventが開催された2012年の参加者は5000人だったので、7年で13倍にスケールしたことになります。
これほど巨大なカンファレンスになると、発表されるサービスや事例の数もキャッチアップが難しくなります。本コーナーではre:Invent 2019の期間中、大きなニュースの影に隠れた見落としがちなスキマ的なポイントを拾いつつ、その概要をコンパクトにお届けしていきたいと思います。
なぜ「ストレージにキャッシュレイヤをかぶせた」のか
12月3日に行われたアンディ・ジャシー(Andy Jassy)CEOによるキーノートでは23ものサービスが新たに発表されました。アンディの怒涛のアナウンスメントはre:Inventのお祭り感を象徴するイベントでもありますが、ここでは今回発表された中からひとつだけ、データウェアハウスサービス「Amazon Redshift」の拡張機能である「AQUA for Amazon Redshift」(プレビューベータ)についてご紹介します。
AQUAは"Advanced QUery Accelerator"の略で、ざっくりといえばS3とRedshiftの間で機能するキャッシュレイヤです。つまり、ストレージにコンピュート機能をもたせることで、データを前後に動かす必要がないため、非常に高速、かつ複数のノードでの並列処理が可能になります。アンディは「他のクラウドデータウェアハウスに比較して10倍以上は高速」と断言していましたが、その理由として
- AWSが開発するプラットフォーム「AWS Nitro System」
- AWSが開発するアナリティクスプロセッサ
- NVMe SSD
- FPGAによるフィルタリング
などカスタムデザインによる高速化の影響が大きいとしています。また、データのセキュリティに関しても、カスタムデザインのアナリティクスプロセッサがデータ圧縮、暗号化、データプロセッシングを実行することでセキュリティを担保する設計になっています
なぜストレージにキャッシュレイヤをかぶせたのか ―データウェアハウスやデータベースの世界では、これまで「ストレージがボトルネック」という定説が存在していました。しかし現在では「ストレージよりもコンピュートのほうがネックになっているのでは」という声が、大規模なデータを保有するユーザを中心に上がりはじめています。AQUAはこうしたユーザの声に対するAWSからのアンサーであり、カスタムデザインのハードウェアによってコンピュート機能のパフォーマンスを高め、データベース/データウェアハウスにおけるボトルネック解消につなげようとしているのです。常識にとらわれるのではなく、顧客の声"だけ"にフォーカスすることを掲げているAWSらしいアップデートといえるかもしれません。
なお、アンディはAQUAの前に、「Amazon Redshift RA3インスタンス」の一般提供開始(GA)を発表しています。このインスタンスは、Redshiftのコンピュートとストレージを完全に分離し、それぞれがニーズにあわせてスケールできるため、データウェアハウスのコストを最適化しやすくなります。AQUAはこのR3Aインスタンスの利用を前提に提供される予定ですが、既存のRedshiftとも100%互換を維持するとのこと。GAの時期は明言されていませんが、コンピュート機能の向上に特化したRedshift powered by AQUAがどれほどのパフォーマンスを見せてくれるのか、いまから期待がかかります。