Mahoutで体感する機械学習の実践

第4回 顧客に合わせた施策で高い効果を狙う

この記事を読むのに必要な時間:およそ 2.5 分

顧客に合わせて施策を行う2つのマーケティング手法

マーケティングにおいては,実際の予算や機会は限られているため,実施する施策には効果の高さや費用対効果の高さが求められます。そのような要求を満たすために有効な手段の1つとして,顧客をよく知り,顧客に合った施策を実施することが挙げられます。

たとえばDMを送る場合には,すべての顧客に同じ内容,同じタイミングで送るよりも,顧客に合わせて送る内容や,送るタイミングを変えるほうが,より高い効果が期待できます。

では,具体的にはどのような手法があるのでしょうか。

顧客の分析粒度の観点からは,大きく以下の2つの手法に分けることができます。

1 One to Oneマーケティング

1つ目は,顧客一人一人の特性を把握し,その顧客に施策を最適化する「One to Oneマーケティング」です。

One to Oneマーケティングは,顧客一人一人の特性に合った施策を実施するため,高い効果が期待できます。しかし一方で,以下のような課題もあります。

  • 顧客一人一人に対応する分,施策によっては非常に高いコストがかかる
  • 顧客の数が膨大である場合,すべての顧客に対応することが難しくなる

2 セグメンテーションマーケティング

2つ目は,顧客を似た者同士のグループにまとめて,そのグループの特性に適した施策を行う「セグメンテーションマーケティング」です。

セグメンテーションマーケティングは,顧客データや,利用する指標によってはうまくグルーピングできないという問題があります。しかし,うまくグループ化できれば,顧客の特性にあった施策を,One to Oneマーケティングより少ないコストで実施できるというメリットがあります。

このセグメンテーションマーケティングにおいて,似た者同士をグループ分けして分析する手法を「セグメンテーション分析」と呼びます。セグメンテーション分析で利用する指標は,目的によってさまざまですが,よく利用されるのは以下のものです。

  • RFM ⇒ 購買履歴における最終購買日(R)⁠購買回数(F)⁠購買額(M)
  • 生活スタイル ⇒ 性格,趣味,習慣
  • 生活ステージ ⇒ 年齢,職種,役職,家族構成

上記のうち,今回はRFMを利用してセグメンテーション分析を行ってみましょう。

セグメンテーション分析を実現する「クラスタリング」

似たもの同士をグループ分けするための手法として,機械学習でよく使われるのが「クラスタリング)⁠です。クラスタリングは,図1のように,与えられたデータ群を,特定の指標を元にグループ分けする形で行います。

図1 与えられたデータ群を,特定の指標を元にグループ分けする

図1 与えられたデータ群を,特定の指標を元にグループ分けする

このように,クラスタリングは与えられた分析対象のデータのみを元に分析するため,教師あり学習/教師なし学習の2つの分類で考えると,教師なし学習に属する分析手法です。

今回の例では,各顧客のRFMを指標とし,顧客を似た者同士のグループに分けることになります。

※)
分散処理などを目的に,計算機を並列に複数台稼働させるネットワーク構成も「クラスタリング」と呼びますが,ここでの「クラスタリング」とは別の意味になります。

クラスタリングアルゴリズムの2つの分類

クラスタリングにはさまざまなアルゴリズムがあるのですが,大きく以下の2つの観点で分類することができます。

1 階層的クラスタリングと非階層的クラスタリング

たとえば「住所」を指標として顧客をクラスタリングする場合を考えてみましょう。横浜在住の人は,⁠横浜」というクラスタに属します。そして同時に「神奈川」クラスタ,⁠関東」クラスタにも属します。

このように,あるクラスタが別のクラスタに属する階層関係を構築する手法を「階層的クラスタリング」と呼びます。

図2 階層的クラスタリング

図2 階層的クラスタリング

一方,前述の図1のように,すべてのクラスタがそれぞれ独立し,階層関係を構築しない手法を「非階層的クラスタリング(または分割最適化)⁠と呼びます。

両者を比較すると,階層的クラスタリングは図2のようなデンドログラムを用いて階層を視覚化することで,⁠上位のクラスタと下位のクラスタの関係やクラスタ間の距離が直感的に捉えやすい」というメリットがあります。

その反面,利用するアルゴリズムによって程度の差はあるものの,おもに以下のデメリットがあります。

  • 計算量が多くなる
  • 生成された複数の階層の中から,どの階層を採用するか判断する必要がある
  • ノイズデータに弱い

一方で,非階層的クラスタリングは高速なアルゴリズムが多く,階層として表現されないため,⁠クラスタが明確に表現される」というメリットがあります。しかし,生成するクラスタ数,もしくはクラスタ生成に利用する距離などを分析者が明示する必要があり,その値次第で出力が大きく異なってしまうというデメリットがあります。

2 排他的クラスタリングと非排他的クラスタリング

今度は,商品を「カテゴリ」という観点でクラスタリングする場合を考えてみましょう。ミステリー小説は,⁠フィクション」「ミステリー」という複数のクラスタに同時に属します。

このように,あるデータが複数のクラスタに属する場合があるクラスタリング手法を「非排他的クラスタリング(またはソフトクラスタリング)⁠と呼びます。

図3 非排他的クラスタリング(ソフトクラスタリング)

図3 非排他的クラスタリング(ソフトクラスタリング)

一方,前述の図1のように,あるデータが必ず1つのクラスタにしか属さない手法を「排他的クラスタリング(またはハードクラスタリング)⁠と呼びます。

排他的クラスタリングと非排他的クラスタリングを比較すると,複数のクラスタに属することを認める非排他的クラスタリングのほうが,計算量は多くなる傾向にあります。一方,非排他的クラスタリングのほうが,排他的クラスタリングよりも柔軟に分類結果を出力する傾向があります。

著者プロフィール

やまかつ(山下勝司)

開発/インフラ/統計,機械学習/プロジェクトマネージメントをこなす器用貧乏。最近はビッグデータ,Hadoop,機械学習あたりに夢中。

株式会社マーズフラッグ 先端研究開発本部所属。

趣味は妻と子供と過ごすこと。

Twitter:@yamakatu
Facebook:http://www.facebook.com/katsushi.yamashita.9

コメント

コメントの記入