LuckyOceanのブログ

新米技術士の成長ブログ

データ・ドリブンマーケティング#1を受講

はじめに
土曜日は、3講座を受講予定だ。午前中がデータ・ドリブンマーケティング、午後がファイナンス、夕方がフィンテックだ。春期前半は、Open Innovation(英語)とフィンテックとビジネスリーダ(米倉教授)だった。英語の授業の代わりにがデータ・ドリブンマーケティングで豊田教授のパートだ。結構面白かった。

データ・ドリブンマーケティングの基本要素
データサイエンティストと呼ばれる人が行うものがデータ・ドリブンマーケティングだろうか。データを集めて、処理をして、結果をアウトプットする。特に大事なのはアウトプットだ。そして、その結果から何かを理解したり、気づきを得たり、ヒントを得たりすることは(今の所)人間にしかできない。そして、データの処理は要約すれば、次の4つの処理になるという。
(1) 要約
(2) 関係
(3) 分類
(4) 縮約

データの要約
これは全体像を理解することだ。つまり、平均をとったり、標準偏差を計算して、ばらつきを見たりする。統計の基本はこの要約と言える。

データの関係
因果関係と相関関係があるが、データの関係性を調べることだ。因果関係を調べる場合には、横軸に原因、縦軸に結果を軸として、そのサンプルデータをプロットする。目安として、回帰直線を最小二乗法で計算する。この場合の最小二乗法は、回帰直線とサンプルデータの縦の距離の二乗が最小となる直線を計算する。相関係数の二乗に相当するばらつきR2も計算する。

データの分類
収集したデータのうちどれとどれが似ているのかを調べることだ。昔、アテネフランセでフランス語を習っていた時に、comme ci comme caと言われたことがある。似たものが集まるという意味で言われた気がする。そんな処理も現在はRというオープンソフトを活用することで簡単に処理できる。

データの縮約
これは変数を作ったり、整理したりという意味だ。これだけではわかりにくい。先述のRで分類すると、似たものを複数のグループに分類して、そのグループへの距離の近さを計算できる。そして、例えば、2つのグループに分割する場合に、その2つをそれぞれ横軸と縦軸にすると、サンプルの傾向を二次元で示すことができる。

宿題
スケジュールの説明はなかったように思うけど、15人いたので、3グループに別れた。それぞれのグループで次の前提でアンケートをとって、その結果を豊田先生がR等を使って、分析し、生徒がその結果に基づいて分析する。
前提1)200人にネットでアンケート調査を行う。
前提2)テーマと9つの選択肢を示す。
 グループで相談して、テーマは遊園地にした。メインは花やしきだ。それ以外の候補は、TDRUSJ八景島シーパラダイスハウステンボス、豊島園、東京ドーム、よみうりランド富士急ハイランドだ。
前提3)属性のセルは最大10
 アンケートを依頼するときに、属性の組み合わせが最大10だという。このため、5つの年齢グループと男女の組み合わせで10セルとする。具体的には、10代、20代、30代、40代、50代以上の、それぞれの男女だ。前提としては、首都圏(東京、千葉、埼玉、神奈川)とした。
前提4:質問事項
 頻度の質問
 利用意向の質問
 イメージするもの
 重視するもの
 自由な質問

Rでの処理イメージ
Rのハードルが高いのは、エクセルで処理できないからだという。ただ、エクセルでの実行も時間の問題だろうと予想されている。現状ではRというソフトを用いて処理する。以前、RはMacでは使えないと聞いたけど、そんなことはないらしい。Rを使うと、下の図のようにサンプルとサンプルの似ている度合いを調べて、グループに分けて、その距離を計算する。これはいわゆる人工知能教師なし学習の機能と似ているようだ。
f:id:hiroshi-kizaki:20190608150459p:plain
 出典:【Pythonで決定木 & Random Forest】タイタニックの生存者データを分析してみた - Np-Urのデータ分析教室

因果関係と相関関係
1) 因果関係:例えば価格と販売量のようなもの。しかし、その前提には時間の関係と意味が大事だという。
2) 相関関係:これは実は目的が2つある。つまり、似たものを調べる場合と、違いものを調べる場合だ。前者は相関関係が強いので縮約する。後者はばらついているので、たとえばマトリックス法で分類する。

デンドログラム
Rで階層化ツリーに分類する方法がデンドログラムだ。
f:id:hiroshi-kizaki:20190608151353p:plain
 出典:R デンドログラムの枝の一部を描画する | エムイーツール株式会社

タイの性別は18種類
日本の性別というと、常識的には男性と女性だ。しかし、最近はその枠には入らない人もいて、ジェンダーの問題とされる。しかし、知らなかったけど、タイの性別は18種類あるという。びっくり。
f:id:hiroshi-kizaki:20190608151602p:plain
 出典:https://bokuiki-reiji.com/2017/07/wearex/

主成分分析
飲料の特徴とはなんだろう。下のグラフでは主成分を美味しさと清涼感でマッピングしたものだ。それぞれのドリンクはどのセグメントをターゲットにするかを明確にして、戦略にしている。しかし、消費者にアンケートをとってみると、思惑とは異なることがあったり、誰も狙っていないゾーンが見つかったりする。このような処理をするのがデータ・ドリブンマーケティングの真骨頂だろうか。
f:id:hiroshi-kizaki:20190608152401p:plain
 出典:主成分分析「使ってみたくなる統計」シリーズ第4回 | ビッグデータマガジン

まとめ
春期前半のマーケティングに続いて受講される人は、自分以外の全員だ。春期前半に受講したOpen Innovationも刺激的だったけど、このデータ・ドリブンマーケティングも面白い。

以上

最後まで読んで頂きありがとうございました。