「1日5億件のトラフィック」膨大なデータを活かして機械学習で事業に貢献するLINEのMachine Learningチーム開発裏側に迫る

前編 Machine Learningチームのミッション,推薦システム「Smart Channel」の開発事例

この記事を読むのに必要な時間:およそ 3.5 分

国内月間アクティブユーザ数8,400万人(2020年6月時点)を超えるLINE。

メッセンジャーだけではなく,スタンプ,ニュース,マンガといったコンテンツに加え,決済や証券といった金融系サービスまで,さまざまなサービスを展開しています。

サービス上で提供される情報やコンテンツのデータサイズ,ユーザからのアクションなど,LINEのエンジニアたちが開発・運用の中で扱う必要のあるデータは膨大で,多種多様です。

日々データが大量に蓄積・更新される環境であるLINEには,全社・全事業のデータを集約させ,機械学習・データ活用を担うData Science and Engineeringセンター(以下,DSEセンター)という組織があります。

LINE社内における機械学習を活用した企画やプロジェクト・プロダクトの重要性は年々高まっているため,今年2020年3月には,円滑な機械学習ノウハウ共有や,データ関連組織の連携強化によるサービス価値の向上を目的に組織再編も行われました。

LINE ML1チーム マネージャー
菊地 悠 氏

LINE ML1チーム マネージャー 菊地 悠 氏

今回,そのDSEセンター傘下にある,LINEの機械学習を活用したサービス開発を担うMachine Learning1チーム(以下,ML1チーム)マネージャー菊地悠氏に,LINEが取り組む機械学習サービス開発について,オンラインインタビューを行いました。

前編では,ML1チームの開発体制や,チームのミッション,推薦システム「Smart Channel」の開発事例についてお届けします。

LINE全社のデータ戦略を担うDSEセンターとは

――今年3月に行われた組織再編と絡めて,LINEのDSEセンターや,その傘下にあるData Labs,ML1チームについて,組織体制や概要に関してお教えください。

DSEセンターは,2019年3月に発足しまして,データ活用系の組織である「Data Labs⁠⁠,情報セキュリティや法務などとも連携し,データのガバナンスと活用を推進する「Data Management室⁠⁠,インフラ系システムおよびデータ関連の各種システムを開発管理する「Data Platform室⁠⁠,という3つの組織から構成されています。

図1 DSEセンターの組織構造

図1 DSEセンターの組織構造

DSEセンターは,LINE全社・全事業のデータを集約し,全社のサービス横断でのデータ活用やガバナンス・インフラの構築や保守運用を推進しています。

その中でData Labsは,集約されたデータを使って何かしらのアウトプットを行い,事業貢献をしていくデータ活用を担っており,私たちML1チームもData Labsの傘下に属しています。

Data Labsのファンクションとしては,大別して,マシンラーニング系のML1チームとデータ分析系のData Science1〜4チーム(以下,DSチーム)があり,また今年3月の組織再編を経て,OCR, Speech, NLPなどの特定分野に特化したチームや,リサーチを中心に取り組んでいるMachine Learning2チームなども合流しました。

DSチームとML1チームは,いずれもデータ活用を通して事業に貢献することを目指していますが,技術的な強みや関わる相手,あるいは事業側のメンバーとの連携のフェーズなどに違いがあります。

DSチームは,事業の企画,戦略を立てて推進する経営層など,事業側の企画者や意思決定者などとコミュニケーションをする機会が多いです。また,事業が成長フェーズに入ってきてある程度データが集まり始めたときに,次に何をすればよいのか?をデータ分析でアプローチする,といった業務もしています。

一方のML1チームは,機械学習を用いたシステムを開発し,保守運用しながらエンジニアリングプロダクトを提供することをおもな業務としています。たとえばあるサービスでレコメンデーションをしたいという要望があった場合,規模の大きなサービスで十分にデータがあるケースもあれば,ローンチ前でユーザのログデータなどが存在しないケースもあります。

誰と一緒に仕事をするかという観点では,ML1チームは,事業側の開発者との仕事も多いです。仕様を決めるために企画者ともコミュニケーションは取りますが,最終的にはシステムの開発を行い,ローンチ後も機械学習のシステムを運用し続けるというエンジニアリングに集中しています。

――DSチームが集約してきたデータを,ML1チームが,システムをブラッシュアップするため活用する,といった業務の流れが一般的なのでしょうか?

ケースバイケースです。先に述べたように,それぞれ独立に業務を行う場合もありますし,大きなプロジェクトでは,一緒に企画段階から仕事を行う場合もあります。

データを横断的に活用し,機械学習で事業貢献するMachine Learning1チーム

――ML1チームのミッションをお教えください。

ML1チームのミッションは,LINEの提供するさまざまなサービスのデータを横断的に活用して,機械学習で事業貢献することです。この際に,我々は個別の事業に属さない組織として,開発したノウハウを「社内で広く横展開できるかどうか」を強く意識しています。

どういうことかというと,たとえばLINEでは,メッセンジャーだけではなく,スタンプや,ニュース,マンガなど多種多様なサービスを展開しています。

さまざまなサービス個別に要望を聞いていくと,似通ったニーズや課題が出てくるのですが,エンジニアリング観点で考えると,1度開発したソリューションを,その他のサービスでも使うことができれば,開発効率や保守性の観点でもメリットがあります。したがって,何かを作るときには,共通化ができるか,横展開ができるか,などを必ず考えるようにしています。

――ML1チームでは,どのように機械学習を活用したソリューションを社内のサービスに提供しているのでしょうか?

過去には,サービスの企画者から「コンテンツをたくさん用意したので,それらをユーザにパーソナライズして提供したい」といったかたちで要望をもらい,個別に推薦システムを作ることが中心でした。

最近では,DSEセンターの外も含めて,機械学習を取り入れて開発を行うチームがいくつか立ち上がってきているので,我々は,スタンプやマンガなど,いくつかのサービスにも注力しつつ,特定のサービス向けではない,よりプラットフォーム的な推薦システムなどを開発する,といった方向に変わってきています。

ちなみに,過去に開発し,既に運用しているレコメンドエンジンなどは,DSチームと連携してA/Bテストを行い,新しいアルゴリズムに置き換えるなどの改善も行っています。最近では,A/Bテストを通じて,他の組織に開発を引き継ぐようなケースも出てきています。

著者プロフィール

酒井啓悟(さかいけいご)

株式会社技術評論社クロスメディア事業室所属。

1986年生まれ。富山県富山市出身。2011年4月株式会社技術評論社に入社。書籍編集部を経て,現職。電子書籍,オーディオブックなど,出版業界に訪れる新しいジャンルの市場の成長に関わっていくことが当面の目標。

サッカーとねこが好き。