これなら使える!ビッグデータ分析基盤のエコシステム

第7回 アクセスログとマスタデータを使った応用KPI分析 ~準備編

この記事を読むのに必要な時間:およそ 4.5 分

応用KPI分析: パス分析とは

前回までは,Webページ全体やページ単体のように点で捉える分析を基本KPI分析として定義していました。そのため,基本KPI分析では,そのページにアクセスしたユーザがどのような経路をたどってそこに辿りついたのかを焦点にせず,全てのアクセスを同等に扱っていました。

図1 Basic KPI

図1 Basic KPI

しかし,各ユーザはそれぞれ異なった目的を持って,異なったページを辿って同じ場所に辿り着いています。そこでユーザのパス情報を加味することでよりユーザに焦点を当てた分析ができると考えられます。このようなパスについての分析を,応用KPI分析として今回と次回で紹介していきます。ここでのパスとは,ユーザが自社のWebサイトに流入してから辿り着かせたいコンテンツに至るまで一連の経路を指します。

図2 Advanced KPI

図2 Advanced KPI

応用KPI分析をするためには,アクセスログのみではなく,複数の情報を組み合わせることで分析することができます。そのため,幾つかのテーブルを結合し,中間テーブルを作ることも必要になってきます。こうしたクエリの書き方の複雑さだけではなく,クエリ同士に順序関係や依存関係が発生してきてしまう分析だからこそ応用KPI分析と言えるでしょう。

そして,応用KPI分析の中のひとつであるパス分析では,ユーザのサイト上の遷移というパスを見ることによって,下記のような新たな概念がいくつも生まれてきます。PVやUUといった基本KPI分析のみを行ってきたユーザにとっては,まさに分析の新境地となることしょう。以下にいくつか例を挙げてみます。

パス平均長
コンバージョンまでにいくつのページを遷移したのかを算出します。これにより,コンバージョンの効率に関して理解することができます。
コンバージョン時間
Webサイトにきてからコンバージョンに至るまでの時間を算出します。これも同様にコンバージョンの効率に関して理解することができます。
パス類型
長さや組み合わせが膨大なパスに対して,特定のルールに従ってパスを分類し,その分類の中でどのパス類型がコンバージョンに寄与しているかを知ることができます。
スコアリング
パスの概念をもって改めてページを評価するには,パスの中でどの位置に出現するかによって重みを変えることによってパスの中でも重要度を発見できます。

パス分析をするためのテーブル情報

パス分析をするにあたり,2つのテーブルを分析エンジン上に用意します。

  1. アクセスログ
  2. コンバージョンマスタ

アクセスログは基本KPI分析で使ったテーブルです。コンバージョンマスタは,アクセスログ内のパス項目の中でコンバージョンに当たるレコードを抽出したもので,後付けでいくらでも再定義することが可能です。ここでのコンバージョンとは,自社のWebサイトに来たユーザにたどり着かせたいページを指します。今回は,トレジャーデータのWebページを回遊しているユーザを対象としたログデータとするため,ユーザがサインアップをしたことをコンバージョンと呼びます。

下記のテーブルの例は,⁠サインアップ」⁠リソースダウンロード」⁠ラーニングページ」⁠製品紹介ページ」を擬似的にコンバージョンポイントとして定義したコンバージョンマスタになっています。また,コンバージョンのページの他に,コンバージョンごとにレベルの設定を行い,重要度の管理もしておきましょう。

cv_levelcv_pathdescription
3/treasuredata.com/en/press-releasesプレスリリース参照
3/treasuredata.com/jp/press-releasesプレスリリース参照
3/treasuredata.com/en/success-storiesサクセスストーリ閲覧
3/treasuredata.com/jp/success-storiesサクセスストーリ閲覧
3/treasuredata.com/en/case-studiesケーススタディ閲覧
3/treasuredata.com/jp/case-studiesケーススタディ閲覧
4/treasuredata.com/en/whitepapersホワイトペーパーDL
4/treasuredata.com/jp/whitepapersホワイトペーパーDL
4/treasuredata.com/jp/webinarswebinar参加
5/treasuredata.com/en/signupサインアップ
5/treasuredata.com/jp/signupサインアップ
5/treasuredata.com/en/tryalトライアル登録
5/treasuredata.com/jp/tryalトライアル登録
CREATE TABLE IF NOT EXISTS `testdb`.`master` (
  `cv_level` INT,
  `cv_path` VARCHAR(255) NOT NULL ,
  `description` TEXT);

## descrptionは省いています
INSERT INTO `testdb`.`master` (cv_level, cv_path, description)
VALUES
  (3,'/treasuredata.com/en/press-releases',null),
  (3,'/treasuredata.com/jp/press-releases',null),
  (3,'/treasuredata.com/en/success-stories',null),
  (3,'/treasuredata.com/jp/success-stories',null),
  (3,'/treasuredata.com/en/case-studies',null),
  (3,'/treasuredata.com/jp/case-studies',null),
  (4,'/treasuredata.com/en/whitepapers ',null),
  (4,'/treasuredata.com/jp/whitepapers ',null),
  (4,'/treasuredata.com/jp/webinars',null),
  (5,'/treasuredata.com/en/signup',null),
  (5,'/treasuredata.com/jp/signup',null),
  (5,'/treasuredata.com/en/tryal',null),
  (5,'/treasuredata.com/jp/tryal',null);

これらのテーブルを見てわかる通り,応用KPI分析の一つであるパス分析を行うために必要な要素はたった2つの緩い条件のみとなります。

  • ユーザIDやCookieなどの個人を分別できるローデータをもっていること
  • ローデータの中でコンバージョンとなるIDやURLを時系列情報とともにもっていること

つまりここでのコンバージョンマスタは,コンバージョンの定義以外でもユーザ情報を持つ会員DBがあればそれでもいいですし,いろいろな社内の資産が使えます。それらをデータインポートで紹介したEmbulkを利用して分析エンジン上にインポートしましょう。

さて,今回は分析エンジン上でコンバージョンマスタを直接作成します。

著者プロフィール

高橋達(たかはしとおる)

Treasure Data Inc.でテクニカルサポートエンジニアとして,毎日,日米問わず顧客のサポートを担当。サポートエンジニアのエンジニアとしての地位向上を目指して色々模索中。そのために,秋葉原幻橙館で今日も元気にOSS活動を行っている。

URL:http://toru-takahashi.gitbooks.io/secret-ninja/content/

コメント

コメントの記入