レポート

リアルタイムでなければ意味がない ─「Gigaom Structure Data 2016」で見たデータアナリティクス最前線

この記事を読むのに必要な時間:およそ 3 分

Google ─世界最先端のAI企業がいま取り組んでいること

囲碁の世界チャンピオンとGoogleの「AlphaGo」の対決は世界的にも大きなニュースとなりましたが,その対局にも関与していたGoogleのシニアフェロー Jeff Dean氏は韓国での対局の途中から直接本カンファレンスにかけつけました。

Googleはここ数年,検索エンジンの会社からAIを事業の中心とする巨大企業への転身を急速に進めています。Dean氏は「Google Brain(ディープラーニングプラットフォーム⁠⁠Spanner(GPSを駆使したデータセンタープラットフォーム⁠⁠」などGoogleの最先端AIプロジェクトの中心人物として知られており,まさしく"AI企業としてのGoogle"を象徴するひとりです。

Jeff Dean氏(左)

Jeff Dean氏(左)

現在,GoogleがAI研究にどれほどフォーカスしているのか,Dean氏は1枚のスライドを見せてこれを説明しています。現在,AI研究に関するGoogleのプロダクトは1500を超えていますが,その数が急激に増えたのは2015年後半から2015年にかけてのこと。とくに2015年後半からのフォーカスは急激で,その勢いはいまも継続中です。

GoogleのAIプロダクト数の増加

GoogleのAIプロダクト数の増加

このGoogleのAIへの取り組みを象徴するプロダクトがオープンソースのディープラーニングフレームワーク「TensorFlow」です。2015年12月に公開され,世界中で大反響を呼んだこのライブラリは「現在,マシンラーニングのレポジトリとしてはGitHubで一番ダウンロードされている」⁠Dean氏)存在となりました。なおDean氏はTensorFlowを含むGoogleのディープラーニングプロダクトを「ニューラルモデル(Neural Model⁠⁠」と呼んでいました。

TensorFlowではこれまで一般のエンジニアでは手が届かなったような環境がさまざま提供されます。たとえば,任意の画像や写真に対し,ニューラルアルゴリズムを用いてアーティスティックに描画する「Neural Art」などはその一例です。

TensorFlowによる「Neural Art」

TensorFlowによる「Neural Art」

AlphaGoのニュースでふたたびTensorFlowへの注目度が高まっていますが,ディーン氏は現在のニューラルモデルの課題は「人間に比べて表現力と認識力に欠けている」ことを指摘しています。たとえば人間なら「○○さんが小さなグリルを使ってサンドイッチをあたためている」と目で見て認識できる光景を,ニューラルモデでルは「あるひとりの人間が何かの食べ物をグリルで調理している」と表現します。この認識の精度を高め,人間と同等の表現力を得るためにGoogleが始めたマシンラーニングプロジェクトが「Google Cloud Vision API」です。Dean氏は「画像を"トランスレーション"する能力」を飛躍的に高めるためにGoogle内でもチームを拡大中だとしています。この研究がさらに進めば,人間と同等の画像認識能力どころか,その画像に直接は写り込んでいないコンテキストまでを読み取り,人間では分析できないレベルでの予測すら可能になるのではないかと思えてきます。

Google Cloud Vision API

Google Cloud Vision API

Spark登場で“アナリティクスの世界が多様化した”

シリコンバレーでは現在,女性データサイエンティストが急増しており,本カンファレンスのスピーカーのひとりでもあったAirbnbのデータサイエンスマネージャ Elena Grewai氏は「Airbnbでは意図的に女性データサイエンティストを採用する方向にある」と語っています。多様なデータを分析し,多様なアプリケーションを作り,多様なビジネスに対応していくためには,データサイエンティストもダイバーシティに構成されていなければならない ─これはAirbnbだけでなく多くのシリコンバレー企業に共通する認識のようです。

Airbnb,Elena Grewai氏(左)

Airbnb,Elena Grewai氏(左)

取材中,ひとりの若いイラン人女性データサイエンティストと話をする機会があり,彼女はシリコンバレーの現状を次のように語りました。⁠シリコンバレーは本当にいま女性のデータサイエンティストが増えている。PyhtonとSparkが使えれば,とりあえずスタートラインに立てる。Hadoop全盛のころはそういう雰囲気はなかったかもしれないけれど,Sparkが主流になってからは明らかにアナリティクスの世界が多様化したように思う。大きなデータに,時間をかけてちまちまとHadoopでバッチ処理するなんて,もうかったるくてやってられない⁠⁠。

ほしいデータは過去ではなく"いま"にある,その"いま"を"すぐ"に分析するのに女性の力を活用しない手はない…,ダイナミックに動き続けるシリコンバレーのデータアナリティクスは,"リアルタイム"をキーワードに誰も見たことがない世界へと進化を続けています。

著者プロフィール

五味明子(ごみあきこ)

IT系の出版社で編集者としてキャリアを積んだ後,2011年からフリーランスライターに。フィールドワークはオープンソースやクラウドコンピューティング,データアナリティクスなどエンタープライズITが中心。海外カンファレンス取材多め。Blog 「G3 Enterprise」やTwitter(@g3akk),Facebookで日々IT情報を発信中。

北海道札幌市出身/東京都立大学経済学部卒。