Amazon Web Services、Amazon Athena を発表
従量課金制の新たなインタラクティブ・クエリ・サービスが、Standard SQL を使用したAmazon S3 上のデータ分析を容易に
Gunosy、Japan Taxi 、Nasdaq など、多くのお客様が数秒でクエリ結果を獲得するためにAmazon Athena を利用
Amazon.com, Inc. (NASDAQ:AMZN)の関連会社である Amazon Web Services, Inc.は本日、Standard SQL を使用してAmazon Simple Storage Service (Amazon S3)上のデータを容易に分析できる、サーバーレスのクエリサービス、Amazon Athena を発表しました。Amazon Athena は、AWS マネージメントコンソール上で数回クリックするだけで、Amazon S3 に保存されたデータを特定し、Standard SQL を使用してクエリを実行し、数秒で結果を得ることができます。Amazon Athena を利用するには、クラスタの管理や調整、インフラのセットアップや管理が不要で、実行したクエリの容量に応じて課金されます。また、自動的に容量を拡張し、クエリを並行処理することで、大規模なデータや複雑なクエリであっても素早くクエリ結果を得ることができます。Amazon Athena の詳細については以下の URL をご覧ください。
https://aws.amazon.com/athena
Amazon Redshift やAmazon Elastic MapReduce (Amazon EMR) のような AWS の分析サービスにより、規模の大小を問わず様々な企業がペタバイト規模の分析を行うことができます。Amazon Redshift を使用すれば、膨大な構造化データに対して複雑なクエリを実行し、超高速で結果を得ることができます。非構造化データの場合は、Amazon EMR を使用し、Apache Spark、Presto、Hive、Pig など、一般的なフレームワークを用いて、動的に拡張性に富んだクラスタ全般にわたる膨大なデータを、高速かつコスト効率良く処理、分析することができます。これらのサービスは大規模で複雑なビッグデータアプリケーションを処理するのに十分な拡張性と処理能力を有しています。その一方、多くのお客様は、Hadoop クラスタやデータウェアハウスにわざわざサインアップし、設定することなく、Amazon S3 に保存されたデータ(ウェブログ、クリックストリーム、ローイベント ファイルなど)に対して素早くクエリを実行したいと望んでいました。Amazon Athena を使用すれば、SQL クエリを記述するかのように、簡単にAmazon S3 に保存されたデータを分析することができます。Amazon Athena は、Standard SQL を完全サポートするPresto を採用しており、CSV、JSON、ORC、Parquet など、様々な標準データフォーマットをサポートします。Amazon Athena は高速なアドホッククエリ実行に最適で、Amazon QuickSight に統合されていることから容易に可視化できるおり、大規模な結合、ウインドウ機能、アレイなど複雑な分析も実行可能です。また、Amazon S3 をデータ保存先としながら、複数のアベイラビリティゾーンの演算リソースを活用してクエリを実行するため、複数の施設や各施設の複数のデバイス上に重複して保存されたデータの分析にも有効です。
AWS のデータベース、分析、AI 担当バイスプレジデント、ラジュ・グラバニ(Raju Gulabani)は「ここ数年で、当社はストリーミングデータのリアルタイム分析に始まり、ペタバイト規模のデータウェアハウジング、さらにこれまでSpark やHadoop が実行してきた作業に至るまで、様々な機能を網羅する、高速で拡張性とコスト効率に優れた包括的なビックデータサービス群を構築してきました。当社の 100 万に及ぶお客様は Amazon S3 を主要データソースとし、数十億から数兆のデータを保存しています。これまでに多くのお客様から、『サーバーやクラスタをプロビジョニング、管理することなく、Amazon S3 に保存されたデータを誰もが容易にクエリ実行できるようにしたい』という要望をいただいていました。Amazon Athena により、このニーズに応えることができました。Amazon Athena を使用するのに、特別な管理者は必要なく、SQL クエリを記述できる人なら誰でも Amazon S3 上のデータを分析できます。さらに、Amazon QuickSight と高度に統合されていることから、SQL クエリを記述しなくても、Amazon Athena のクエリ結果を可視化することもできます」と述べています。
日本の大手ニュースキュレーションアプリ・プロバイダである Gunosy のデータ・サイエンティストの阿部洋介氏は「当社は Amazon Athena のプレビュー版をすぐに使い始めましたが、Amazon S3 上のデータを直接クエリ処理しているのに、これまで使用してきたシステムよりも高速にクエリ結果を得られたことに大変感銘を受けています。当社はワークロードを積極的に AWS に移行し、今後、Amazon Athena を当社の分析プラットフォームの中核に据えるつもりです」と述べています。
毎月 200 万人のアクティブユーザーをかかえる、タクシー配車など交通関連アプリを提供する Japan Taxi の最高技術責任者(CTO)の岩田和宏氏は「Amazon S3 上にデータを保存し、そのデータを Standard SQL だけでクエリ実行できる Amazon Athena は本当に素晴らしいサービスです。Amazon Athena により、すでに保存されているデータをわざわざ移動させることなく、クエリの実行が可能になるのです。当社の全てのデベロッパーが費用を抑えながら最も細かいレベルでデータをクエリ処理できるようになり、必要ならば誰もが容易にデータにアクセスできるようになります。また、オープンソースフォーマットを使用していることから、Amazon EMR のような、その他のソリューションで同じデータを活用し、相互運用することもできます。Amazon Athena は特別な管理者を必要としないことから、すぐに使い始めることができました」と述べています。
世界 50 カ国の 70 以上の市場で、全世界の証券取引の 10% に相当する証券を処理している Nasdaq の主任アーキテクトのネイト・サモンス(Nate Sammons)氏は「当社は、破壊的伝統と革新的なビジョンに基づき、当社の証券市場全般における全てのビジネス分野で、効率性を高め、新たな洞察を得るための新手法を常に模索してきました。ビジネスの成功にデータの活用が不可欠であることからも、Amazon Redshift や Amazon S3 など、様々なソースに保存されたデータを分析する新しいツールには常に関心を持っています。当社は常々、Amazon Redshift のデータウェアハウスを拡張し、安全でコスト効率に優れた長期的なデータ保存システムを構築したいと考えていました。そのため、Amazon S3 をストレージに、ANSI-SQL 互換性と高速性能を備えるPresto をクエリおよび分析システムの一部として採用しました。Amazon Athena により、クラスタの必要がなくなり、当社の全てのアナリストが可能な限り高速に Amazon S3 上のデータをクエリ処理できるようになり、このビジョンの実現にさらに近づけるものと期待しています」と述べています。
Amazon Athena は、AWS Management Console 上から利用できます。Amazon Athena は現在、US East (ノースバージニア)、US West (オレゴン)の各リージョンにて展開され、その他のリージョンへの展開は今後発表される予定です。