Lifelog~毎日保存したログから見えてくる個性

第37回ライフログを生活の武器にする

企業の秘匿するライフログデータ

ライフログには、筆者が実践研究しているような個人的な側面と、主として企業(や国)が個人の動向をつかんでマーケティング(や行政)に利用しようとするビッグ・ブラザー的な側面と、二つの面があります。

クレジットカードの利用情報などは、すでに充分にライフログ的でありますが、その情報は基本的にカード会社が保持していて、個人情報であるにもかかわらず、個人が利用可能なかたちでは提供されません。

スーパーでの商品管理はすべて電子化されていますが、それもモノを買っているのは消費者であるのに、情報というかたちでは個人には還元されません。レシートやクレジットカードの利用明細はありますが、基本的に紙ベースなので再利用は困難です。

インターネットによるオンライン電子販売サイトであるところのアマゾンでさえ、購入情報をユーザーは扱いやすいかたちでかんたんに手に入れることはできません。すべてが電子情報なのにもかかわらず、たとえば、年間にどんなジャンルの何冊の本を合計いくらで買っているのかを知るためには、ログをデータベース化する必要が出てきます。まあそういうソフトを作って使えばよいのですが。

ここに、とてもなにか大きなギャップを感じていたのです。

商品に関するメタデータを手に入れて活用できれば、消費者/ユーザー/個人は、もっとよりよい消費行動を取れる可能性があります。そのメタデータを提供しないということは、企業/国/システムは、消費者を依らしむべし知らしむべからずの状態においておきたいのだろうな、と感じていたのです。

これが某スーパーが(たぶん)秘匿としたいリスト
これが某スーパーが(たぶん)秘匿するリスト
今回、ライフログデータ(レシート等の明細)を編集していて手に入れてしまいました。スーパーの底値情報です。

インターネットスーパーのインターフェースを考えた

筆者は、約1年半にわたって、インターネットスーパーを使ってきました。インターネットスーパーのインターフェースは、インターフェースの研究者から見るともう最悪にひどくて、何度も直接提言をしたり(それで改善された点も少なからずあります⁠⁠、よりよく使うためのインターフェースソフトを作ってきました。

現在は、買い物の必要が出てきたらメモを書けば、そのメモを蓄積して週に1回、チェックリスト形式でメモとスーパーのサイトを同時に開けるようにして、だいぶ改善されました。

ここで次の段階に移るために必要なものを考えたところ、先のメタデータだろうと感じたわけです。

普通買いものをするときになにを必要と感じるかは、⁠牛乳」「キャベツ」のようにジャンル名であって、商品名ではないためです。もちろん、なかには「チョココ」のように商標名で指名買いしたいものもないでもないですが、本や音楽などと違って、日用品的な食料のすべてを商標で特定して買いたいとは、筆者はあまり思わないのです。

買いものをするときのインターフェースソフトとリストと商標
買いものをするときのインターフェースソフトとリストと商標
実際に使っているリストでは、⁠かみそりの刃」⁠野菜類」⁠果実」などと書いてある項目が中心で、商標で書いてあるのは三ツ矢サイダーだけだとわかります。いっぽう、左側のスーパーの買い物インターフェース画面では、商品がリスト形式で商標名で表示されています。両者を一致させるのは結構手間どります。

知人に、米は新潟のブランド米で、リンゴは青森の農家から直売で、という主婦のかたがいらっしゃるので、それに較べると筆者の場合はずいぶんぬるいなぁと思いますけど、まあそこまでのエネルギーをかける気力はない。食品偽装大国の日本では、食料をきちんと選ぶことは重要ですけれど、まあたいていはそこにあるものを買っています。

そこにあるといっても、インターネットスーパーは「そこ」を得介するのがむずかしいのです。商品名(商標)では検索できますが、ジャンル名では(ツリーを辿る以外に)検索ができないためです。これはなかなか悩ましいです。実際にスーパーに買いにいけば、野菜コーナーとか精肉コーナーと売り場がわかれていて、だいたいの場所を覚えておけば買い物をできますが、インターネットではそうはいかないのです。

商標名での検索になるために、シソーラスの充実していないインターネットスーパーでは「たまご」「タマゴ」「卵」は別扱いとなり、何度も検索をくり返す必要があります。ともかくこれが煩わしいです。

買い物メモをジャンル名で作り、買いものをするときには商標に照らし合わせる作業は、買い物の件数が10個とかになると、あまりかんたんではないのです。そこで、ジャンル名を商標名に置き換える辞書を作ろうと考えました。これですくなくとも検索の手間は軽減されるだろうからです。

辞書データから期せずして得たデータ

辞書は、メールで送られてきている過去に購入した商品の履歴を見ればいいだろうと考えました。一般化した辞書を作るのは商品の総数を考えるとたいへんですが、自分の購入した範囲で辞書をつくる程度であれば作業量はたかがしれているし、いつも買う定番の辞書を作っておけば、作業量のわりに効率が高いだろうと予想しました。

定番以外のモノを買うときには、あらためて考えることにしました。定番以外を買う作業はルーティンな作業ではないため、そこには時間をかけてもよいわけです。逆にいうと、定番の作業はルーティンなのでできるだけ省力化して作業し、できれば自動化し、ルーティンでないところに時間を振り分けたいわけです。

辞書を作り始めたところ、いくつか重要な知見を得ることができました。

Gmailから履歴ファイルを取得する
Gmailから履歴ファイルを取得する<br>Gmailはメールでコミュニケーションする観点からは強力だが、メールをデータとして扱おうとすると、結構めんどうです。いまのところメールをデータベースとして扱うPileMailの受信部分がアップデート中で動かないため、暫定的に手作業で作業しました。早くPileMailを再稼働しないと…。
Gmailはメールでコミュニケーションする観点からは強力だが、メールをデータとして扱おうとすると、結構めんどうです。いまのところメールをデータベースとして扱うPileMailの受信部分がアップデート中で動かないため、暫定的に手作業で作業しました。早くPileMailを再稼働しないと…。

最初に感じたのは、1年半の購入履歴での商品のバリエーションが、定番といいながらも意外と多かったことです。ざっくり200品目にも上りました。なるほど200品目では、個々の商標全体をぜんぶ覚えていることは困難ですから、このような辞書を必要とするニーズがあることが予想できます。

次に重要なことに気づいてしまいました。商品の辞書は、JANコード 商標 価格からなるのですが、1年半分の全データを一覧したところ、おなじ商品でも価格には相当なばらつきが出ていました。商品によっては200円くらい違うのです。sortしてuniqしても項目が減らなかったのは価格が違っていたためでした。

スーパーの商品は、特売などでひんぱんに変動しています。1年半分のデータを入手したところ、期せずしてその価格の「底値」を手に入れてしまったのです。10円、20円ならともかく、200円も違うとかなりの差です。

なるほど、これはスーパーは消費者に渡したくないデータですね。そのスーパーの底値一覧ですよ。よくスパイの蒐集するデータはほぼすべては公開されたデータだといいますが、それを実地で体験した感じです。

底値一覧がわかり、もうすこし分析をつづければ、1年間の平均消費量もわかるわけです。1年間に何回その商品が底値で販売されるかもわかります。これをマネジメントする機能をつければ…。

たとえば、商品Aの通常価格が500円、底値が300円、底値での販売は年に2回、年間に52個(週1個)消費するとします。これまでは週に1個ずつ買っていました。合計額は500×50+300×2=25,600円です。

これがもし底値で52個買ったとしたら…。合計は15,600円。差額は1万円にもなります。生物(なまもの)などはむずかしいですし、収納量などにも依存しますし、商品の在庫数もありますので、100%理論通りにはいかないと考えられます。それでもこのソフトのマネジメント効果はかなり大きいと予想できます。

今後さらに1年程度かけて、効果を検証したいと考え始めました。節約したお金でどこへ行きましょう。

おすすめ記事

記事・ニュース一覧