情報推薦システムの基本

第3回 推薦システムの分類とその効果

この記事を読むのに必要な時間:およそ 3 分

フィルタリングの手法

ここからは,フィルタリングの代表的な手法について解説します。

デモグラフィックフィルタリング

デモグラフィックフィルタリングとは一番シンプルな考え方で年齢,性別,居住地等のユーザのプロフィール情報を元にアイテムを推薦する手法です。

内容ベースフィルタリング

内容ベースフィルタリングとは,推薦対象となるコンテンツの情報とユーザの嗜好しこうデータをマッチングし,類似性が高いコンテンツを推薦する手法です。たとえば,映画を推薦する場合を考えてみましょう。ある映画には次のような情報が付加されています。

  • 監督
  • 主演俳優
  • ジャンル
  • 説明文に入っているキーワード

これらの情報とユーザのデータをマッチングして,コンテンツ(今回の場合は映画)を推薦します。ユーザが過去に見て高く評価した映画の監督,俳優,ジャンル,キーワードから推薦するのが内容ベースフィルタリングリングです。これをどのように実現するかは次回で紹介します。

内容ベースフィルタリングによる推薦は一見妥当なように見えて,欠点があります。内容ベースフィルタリングでは,コンテンツを特徴づけるために多くの情報を用いますが,その情報のどれがユーザの興味と関係するのかを特定できないことです。たとえばユーザが,過去に閲覧したことのある映画と同じ監督の別の映画を推薦しても,良い推薦とは限りません。そのユーザはある出演者に対して関心を持って映画を見ている場合があるからです。

また,同じような商品を勧めることにも問題があります。たとえば,ECサイトで椅子を購入したユーザに同じように椅子を進めたところで,購入される可能性は小さいでしょう。椅子を購入したユーザには机や,椅子の足に付けるキャップ,クッションなどを推薦するほうがクロスセル(合わせ買い)の確率を高めることができるだろうというのは,想像に難くありません。

協調フィルタリング

協調フィルタリングとは,対象となるコンテンツに対して,他のユーザがどのような嗜好を持っているかをベースに推薦する手法です。この手法では,実際のユーザの興味に即した形でコンテンツを推薦することが可能となります。いわゆるAmazonにおける「この商品を買ったユーザはこんな商品も買っています」を実現する手法です。

対象となるユーザが購入したり高く評価したりする関心の高いアイテムと,同じ商品に関心を抱いている他のユーザが関心を示している異なるアイテムを推薦するというのが,協調フィルタリングの特徴です。

この手法をどのように実現するかは次回以降で紹介します。

協調フィルタリングは,ほかのユーザの行動や評価をもとにコンテンツを推薦するため,新しいコンテンツには対応できません。誰の評価もないというのは,共通に評価できるユーザが存在しないことになるからです。

新しいコンテンツに対応できるという点でだけみれば、内容ベースフィルタリングの方が優れていると言えます。しかし別の観点からすると、内容ベースフィルタリングには、ユーザがコンテンツのどの特性に関心を持ったのか分からないという欠点がありました。そこを強調フィルタリングでは、興味の類似するユーザから推薦するという切り口で解決しています。

協調フィルタリングは単純な手法でありながら高い効果を発揮する手法であるため,推薦システムを導入する際に使われることの多い方法です。

ハイブリッドフィルタリング

このようにそれぞれの手法に,特長が存在します。そのため協調フィルタリングに内容ベースの手法や,デモグラフィックの手法を取り入れて推薦を行うハイブリッドフィルタリングという手法が提案されています。これらの手法は2000年代前半にはあまり効果を発揮できませんでしたが,近年SNSの登場により,より詳細な情報を容易に獲得できるようになったことから大きな成果を上げ始めています。

推薦システムの効果

このようにユーザひとりひとりの嗜好性に合ったコンテンツを提示することは,すべてのユーザに同じコンテンツを提示する方法と比べると,次の2つの効果が期待されます。

  1. ユーザのコンテンツに対する行動を促進できる
  2. 多くの種類のコンテンツを消費することができる

この2つについては,それぞれ事例研究を紹介して解説します。

1.についてはGoogleが,YouTubeの推薦システムの成果について報告しています。彼らはユーザがどのビデオを見たかという情報を用いて,協調フィルタリングに基づいた推薦システムをYouTubeに適用しました。その結果,推薦による人気ランキングを表示する場合と比較して,ビデオのクリック率が207%向上し,満足度もそれには及ばないものの向上したとしています(参考The impact of YouTube recommendation system on video views⁠。

2.についてはペンシルバニア大学のグループが興味深い実験結果を報告しています(参考Recommender systems and their impact on sales diversity⁠。

彼らは,推薦システムの購買行動について経済モデルを用いてシミュレーションを行いました。その結果,単純な協調フィルタリングの推薦システムを考えたとき,多様なコンテンツの消費を促すということは必ずしも成立しないと主張しています。コンテンツの消費量は,そのシステムにおいて元データとなるユーザがどのような行動をしてきたかに依存するとしています。

上記のYouTubeの例にもあるように,推薦システムを用いることでユーザの回遊性や満足度が向上することは示されており,ECサイトをはじめとしてさまざまなサービスで推薦システムが用いられています。しかし,推薦システムがユーザにどのような効果をもたらすかについてはまだ明らかになっていない部分も多くあります。また,推薦システムが有益に働くかは,保持しているデータやその適用領域によっても異なります。読者のみなさまには,推薦システムが魔法の杖ではないことをご留意いただきたいと思います。

今回は推薦システムの概要を説明し,それがどのような効果をもたらすのかについて紹介しました。次回からは実際の推薦システムの構築方法について紹介していきます。

著者プロフィール

関喜史(せきよしふみ)

株式会社Gunosy共同創業者。

東京大学大学院工学系研究科技術経営戦略学専攻博士後期課程在学中。専門はウェブにおける推薦システムを中心としたデータマイニング応用手法の研究。