LuckyOceanのブログ

新米技術士の成長ブログ

データ・ドリブンマーケティング#4を受講して

はじめに
土曜日に3科目履修している。夜は松田ゼミ生との飲み会だ。平日の夜の科目なら、帰りの電車の中でブログの骨子を書いて、寝る前に清書できるが、土曜日の科目のレビューを書くかどうかは時間との戦いだ。つまり、3科目も履修すると、宿題を複数出される可能性が高い。二日酔いでもある。眠い。やることは色々ある。まあ、なんとかなるか。

コンジョイント分析
明らかにしたいのは因果関係だ。つまり、原因と結果の関係を調べたい。話題のAIで実現できていることは、相関関係の明確化だ。ある事象Xとある事象Yの間には相関関係があるのかどうか。ある写真(=X)は猫(=Y)と言えるか。その確率は何%か。そんなことだ。このコンジョイント分析(conjoint analysis)は、特にマーケティングにおいて活用されている。例えば、車を買おうとした時には、めちゃ悩むだろう。燃費はどうか、価格はどうか、デザインはどうか、安全性はどうか。そして、その中には決定的に重要な項目もあれば、そうでもない項目がある。これを寄与度と呼ぶ。このコンジョイント分析を用いると、どの属性の寄与率が高いかがわかる。下の例で言えば、価格の寄与率が30%と高い。次に高いのはスライドドアだった。きっとこのアンケートの回答者は小さな子供とか、お年寄りのいる家族なのかもしれない。燃費の寄与率も20%と高い。サンルーフへの監視度は低いので、女性かもしれない(笑)。アンケートで難しいのは、回答する個人個人で回答が違うことだ。
f:id:hiroshi-kizaki:20190630161936p:plain
 出典:第18回「最適スペックの決定 コンジョイント分析」 | JMA

階層クラスター分析
(1) 散布図

分析すべき属性が2つであれば、行と列でスケールすれば、下のような散布図が出来上がる。例えば、価格の属性への寄与度をX軸、燃費の属性への寄与度をY軸とするとどうなるのだろう。一般には、価格に敏感な人は燃費に敏感だ。しかし、燃費を重視するために、価格は多少の高くても良いと考える人もいるかもしれない。散布図というと、相関係数を計算したくなるが、下のずでは、いくつかのバラツキのあるものをグループに分けて考えている。
f:id:hiroshi-kizaki:20190630163046p:plain
 出典:https://www.trunktools.jp/services/analysis/cluster.html

(2) デンドログラム
分析すべき属性が3つとか、4つかとある場合はどうすれば良いのだろう。支配的な属性や特に重要な属性を2つ選んでも分析するのも効果的かもしれない。しかし、どれが支配的かを選ばないといけない。最近は、属性がよく似たものを樹形図で並び替えてくれる方式がある。これがデンドログラムだ。デンドロビウムユリ科の植物だ。ツリー構造になったものを言う。昔はエクセルのマクロを組んで頑張って分析しないといけなかったけど、最近ならRを使えば簡単なコマンド操作でチャチャっとできる。すごい。
f:id:hiroshi-kizaki:20190630164133p:plain
 出典:https://www.trunktools.jp/services/analysis/cluster.html

Rの基本操作
Rとは、GNU Rとか、R言語と呼ぶべきだけど、一般にはシンプルに「R」と呼ぶ。Rは、統計解析のためのオープンソースだ。元々はベル研が開発したS言語を参考にして、オークランド大学のRoss IhakaとRobert Clifford Gentlemanにより作られた。開発者のイニシャルがともにRだったからRなのだろうか。Rは、ベクトル処理で実行される。ベクトルといっても物理学的なベクトルではない。構造を持ったデータ集合という意味だ。行列計算でも、複素数計算でも自由なデータ構造を宣言することなく自由に変数として扱うことができる。
f:id:hiroshi-kizaki:20190630164624p:plain
 出典:統計ソフト「R」ならデータ分析が可能

Rスタジオ
Rの画面でも、例えば「1+1」と入力してエンターを押すと、「2」と表示される。SIN計算でも簡単だ。これはこれで面白い。でも、Rスタジオを使えば、もっと使い勝手がよくなる。下の写真は、自分のMacにインストールしたRスタジオの画面例だ。4つに分割されていて、左上がソースエディター、左下がコンソール、右上が履歴など、右下はヘルプなどだ。このRスタジオやRを使えば、あなたもデータサイエンティス。年収うん千万円も夢ではないかもしれない。
f:id:hiroshi-kizaki:20190630165610p:plain
 出典:R/RStudio入門

経験と発想力
小学校でもプログラミング教育が始まる。詳細は知らないけど、このRとかRスタジオを教えるようになれば、日本の社会は明るい。でも、うん千万円の年収を稼げるデータサイエンティストを講師に呼ぶ予算は学校にはないかもしれない。金がないなら知恵を出せ。NPO団体でも立ち上げて、クラブ活動の顧問でもするか(笑)。データサイエンティストとしては、このような統計分析ツールを使いこなせることは必須条件だ。しかし、十分条件ではない。アンケートで何を聞くか。何を調べるか。何を明らかにするか。そんなことを想像する発想力が重要だ。

卒業プロジェクトの構想
2年次になったらプロジェクトと呼ぶ卒業研究をする必要がある。しかし、ちょっとまとまったことをするには金がいる。予算を確保するには、構想をぶち上げる必要がある。現状は、2年次になってから構想をまとめるが、予算を確保するにはそれでは遅い。2年の年末になってから焦っても何もできないだろう。個人的には、まだ迷いはあるけど、できれば、やはりベーシックインカム関係の調査と分析をしたい。先週、駒澤大学井上智洋准教授と出会えたのも縁だ。例えば、この夏に試験的なアンケートをとって、その結果を踏まえて、今年の秋に予備調査を日本国内で行う。そして、1年後の秋に海外を含めて本格的な調査を行う。それらの結果を分析して、ベーシックインカムの功罪モデルとその国際比較ができれば最高だ。

まとめ
データ・ドリブンマーケティングの担当教授は豊田准教授だ。丁寧な説明をしてくれる。落ちこぼれがないようによく目を配ってくれる。素晴らしい。このRをマスターできれば、それだけでMBAコースに通った価値はあるような気がする。

以上

最後まで読んでいただきありがとうございます。