概要
クチコミ分析とは,膨大な消費者の声を「見える化」し,商品やサービスの改善に役立つヒントや気づきを得るための技術です。「あの商品はなぜ売れているのか?」,あるいは「この商品はなぜ売れていないのか?」といった疑問に答えてくれます。本書では,クチコミ分析で役立つテキストマイニングと統計学の知識についてゼロから丁寧に説明します。プログラミング経験や数学に関する専門知識は一切必要ありません。
こんな方におすすめ
- マーケティング担当者
- クチコミ分析に興味のある方
- テキストマイニングに興味がある方
目次
第1章 クチコミ分析を支える技術
- クチコミ分析とは?
- インターネットの普及による消費者行動の変化
- マーケティングにおけるクチコミの活用
- アンケート調査とクチコミ分析の違い
- クチコミ分析の手順
- テキストマイニングとは?
- データの背後に隠れた有益な情報の発見
- ビッグデータ時代のテキストマイニング
- 統計学とは?
第2章 テキストマイニングの基本を学ぶ
- データを構築する
- クチコミ分析の手順
- クチコミのありかを知る
- クチコミを集める
- データをきれいにする
- クチコミデータの収集で注意すること
- コンピュータで言葉を分析する
- 単語を自動的に取り出す ~形態素解析~
- 形態素解析ツールChaSen
- 文章の構造を見つける ~係り受け解析~
- 係り受け解析ツールCaBoCha
- クチコミの評価を知る ~評判分析~
- 頻度を計算する
- 言葉を数える ~頻度集計~
- 頻度を比較可能な形にする ~相対頻度~
- 頻度をまとめる ~クロス集計~
第3章 統計学の基本を学ぶ
- トレンドを可視化する
- 時間的な変化を可視化する ~折れ線グラフ~
- 複数の変化を可視化する
- データの特徴を把握する
- データの平均を計算する ~平均値~
- 外れ値に対処する ~中央値~
- データのばらつきを分析する
- ばらつきの幅を調べる ~最大値・最小値・範囲~
- もう少し詳しくばらつきの幅を調べる ~四分位数・5 値要約~
- ばらつきを可視化する ~箱ひげ図~
- 外れ値を図で表す
第4章 複数のデータを比較する 73
- 割合を可視化する
- 推測統計学の考え方を学ぶ
- 一部から全体を推定する ~母集団と標本~
- 母集団の性質について判断する ~仮説検定~
- 差の大きさを数値にする
- 頻度の違いを分析する ~カイ二乗検定~
- 「差がない」場合の頻度を計算する 〜 期待値〜
- 実測値と期待値の「ずれ」を数値にする ~カイ二乗値~
- その差は統計的に意味のある差か? ~カイ二乗分布~
- その差は本当に意味のある差か? ~オッズ比~
- キーワードを自動で抽出する
- キーワード分析のしくみを学ぶ
- オッズ比でキーワードを抽出する
第5章 クチコミを可視化する
- 単語の結びつきを数字にする
- 2つの単語が一緒に使われる頻度を数える ~共起頻度
- 単語の結びつきの強さを調べる ~共起強度
- 単語の結びつきの有意性を調べる ~共起有意性
- 単語の結びつきを可視化する
- 顧客の声を「見える化」する ~共起ネットワーク
- 実際の用例を確認する ~ KWIC コンコーダンス
- 付録A テキストエディタによる前処理
- 付録B KH Coder のコーディング機能
サポート
ダウンロード
本書の学習用サンプルファイルをダウンロードできます。
(2023年4月17日更新)
- ダウンロード
- サンプルデータをダウンロード
第3章のサンプルデータ
(2017年10月2日更新)
第3章のサンプルデータについて,執筆者によるサポートページからダウンロードできます。
正誤表
本書の以下の部分に誤りがありました。ここに訂正するとともに,ご迷惑をおかけしたことを深くお詫び申し上げます。
(2017年10月2日最終更新)
P.95(図4.16の縦軸)
P.97(図4.17の縦軸)
P.103(図4.20の左下)