MapR「コンバージドデータプラットフォーム」見る"オープンソースにこだわらない"Hadoopビジネスのかたち

4月21日、米MapR Technologies(以下MapR)の日本法人であるマップアール・テクノロジーズが、新製品となる「MapRコンバージドデータプラットフォーム」の発表を行いました。発表会では新製品の紹介のほかに、MapRの国内におけるビジネス戦略も明らかにされています。本稿では当日の発表会の内容をもとに、"ソフトウェアベンダ"としてのMapRの方向性を見ていきたいと思います。

クラスタ間でのデータ移動なしですべての分析が完了する

今回発表された「MapRコンバージドデータプラットフォーム」とは、MapRが提供するいくつかのHadoopコンポーネントを統合した製品です。キーコンポーネントはHDFSをC++で書き換えたファイルシステム「MapR-FS」を基盤とした「MapR Data Platform」で、この上でNoSQLの「MapR-DB」や、HDFSベースのアプリケーションやSparkアプリケーションを実行する「MapR Hadoop」などを稼働させることができます。もう少し正確に言えば、⁠各コンポーネントのライセンス契約をすることで、それぞれのコンポーネント機能がアクティベートされる」というしくみです。

「MapRコンバージドデータプラットフォーム」
「MapRコンバージドデータプラットフォーム」

MapRは2015年12月、ストリーミングデータのリアルタイム処理を行うコンポーネントとして「MapR Streams」を発表しました。このMapR Streamsもコンバージドデータプラットフォームに統合され、21日にGA(一般公開)となっています。

日本法人のカントリーマネージャにこの4月に就任した平林良昭氏は、新しくなったコンバージドデータプラットフォームの優位性について「データプロセッシングにおけるすべてのフェーズを、Hadoopクラスタ間でのデータ移動を伴うことなく、ひとつのプラットフォーム上で実現できる業界唯一の製品」と強調しています。Streamsが加わったことで、ストリーミングデータをKafkaなどの外部のパイプを使うことなく、取り込むことが可能になりました。

マップアール・テクノロジーズ カントリーマネージャ 平林良昭氏
マップアール・テクノロジーズ カントリーマネージャ 平林良昭氏

「競合他社製品やApache Hadoopであれば、データソースからのデータ取り込みや活用といったサイクルにおいて、必ずクラスタ間のデータ移動が生じてしまう。データサイズがテラバイト級、ペタバイト級と大きくなればなるほど、負荷も時間もコストも増大する。しかしワンプラットフォームの『MapRコンバージドデータプラットフォーム』であれば、バッチ処理からストリーミングデータのリアルタイム分析まで、すべてのデータプロセッシングのニーズに包括的に応えることができる。そしてこれがMapRの最大の強み」⁠平林氏)

MapR以外のシステムでは、データの移動が必要になる
MapR以外のシステムでは、データの移動が必要になる

10ペタバイトのデータを高速に分析

MapRの採用企業は北米を中心にグローバルで増えていますが、国内での導入事例として同じ発表会の席上でサイバーエージェントのケースが発表されました。サイバーエージェントはアドテク事業(アドテクスタジオ)で、MapR-DBおよびMapR-FSを含むビッグデータプラットフォーム「MapR7」を導入し、10ペタバイトのデータ統合基盤を2ヵ月で構築しています。発表を行ったサイバーエージェントの鷹雄健氏は「レイテンシは5ミリ秒以下という要件だったが、DWHと連携しても問題なく稼働している。テラバイト級のデータでも数十分でデータ転送が可能になり、コスト的にも時間的にも効果が高い」とワンプラットフォームによる運用性の高さやパフォーマンスを高く評価しています。

MapRによるデータ構築基盤を紹介するサイバーエージェント 鷹雄健氏
MapRによるデータ構築基盤を紹介するサイバーエージェント 鷹雄健氏
1台あたり6GbpsのデータをDWHに送り込むことができる
1台あたり6GbpsのデータをDWHに送り込むことができる

現在は「ガネーシャ」という実験プロジェクトでOpenStack MitakaとMapRを組み合わせ、⁠オンプレミスのAmazon Elastic MapReduceのような環境」を構築し、高速なストリーミング処理の実現を目指しているとのこと。ここではMapR Streamsを含むコンバージドデータプラットフォームの採用も検討中だそうです。

Project Ganeshaの紹介
Project Ganeshaの紹介

Hadoop企業ではない、「ソフトウェア企業」という立ち位置

本サイトの読者であればご存知の方も多いと思いますが、MapRが他のHadoopディストリビュータであるHortonworksやClouderaと大きく違うところは、一部のHadoopユーザの間では"魔改造"とも言われるほどにApache Hadoopを大きく書き換えた製品を提供している点です。もちろんインタフェース部分ではApache Hadoopと完全互換を保証していますが、たとえばHDFSのJavaレイヤを取り払ってC++でコードを書き換え、セキュリティやパフォーマンスを「企業レベルでの使用に耐えるレベルにした」というMapR-FSなどは、Apache Hadoopとはまったく異なるフィロソフィーのもとで開発されているといえます。

現に平林氏の前に発表会で挨拶を行ったMapRのCOOであるマット・ミルズ氏は「MapRはソフトウェアカンパニーであり、コンバージドデータプラットフォームは我々の技術の特許と知的財産を結集させたシステム」と強調し、⁠収益の9割がソフトウェアの(サポートやコンサルではなく)売上であり、しかもソフトウェア販売の粗利が90%を超えていることを誇りに思っている」と語っています。競合とは異なり、Hadoop企業ではなくソフトウェア企業、それもOracleやRed Hatに近い、プロプライエタリ企業であることを強く指向している点は、オープンソース中心主義が主流となっているHadoop界隈にあって非常にユニークな立ち位置です。

MapR COO マット・ミルズ氏。半年前にMapRに入社。前職はOracleで北米の製品担当だったとのこと。
MapR COO マット・ミルズ氏。半年前にMapRに入社。前職はOracleで北米の製品担当だったとのこと。

MapRはオープンソースコミュニティに対する貢献度が低い、という声はHadoop界隈で時折耳にします。また、Hadoopの進化の方向性と異なる部分の多い開発方針にも疑問の声が上がることもしばしばです。一方で、ビジネスユーザ、とりわけエンタープライズユーザにとっては「そんなこと(オープンソースにコミットしているかどうか)はまったくどうでもいい。高速性やセキュリティの担保のほうがよっぽど重要」という側面があることもまた事実です。MapRのユーザ企業は業種業界にかかわりなく広がっていますが、ヘルスケアや政府など、データの秘匿性やセキュリティを重要視する業種での採用が増えているのも、MapRへの信頼度の高さを表しているといえます。ミルズ氏は「MapRのユーザは99%が契約を継続してくれる」とそのリテンション率を強調していましたが、これもやはり信頼性の高さに裏打ちされた結果なのでしょう。

もっとも、Hadoopも大きなバージョンアップ(Hadoop 3.0)を控えており、HDFSを含め、劇的に変化することが予想されます。増え続けるエコシステムとの関係性も重要になるでしょう。大きく変化を続けるHadoopと、ある意味"Going My Way"なMapRがこれからどう折り合いをつけていくのか、引き続き注目していきたいと思います。

おすすめ記事

記事・ニュース一覧