LuckyOceanのブログ

新米技術士の成長ブログ

年収は親の学歴と配偶者の年収で決まるのか

はじめに
最近は3Kと言えば、きつい、汚い、危険を連想する人が多いだろう。しかし、1980年代のバブル期は3高(高収入、高身長、高学歴)といった。医者と結婚したければ、医者になれば良いという。東大生と結婚したければ東大生になれば良い。そうかもしれないけどそれはそう簡単な話でもない。

アンケート
マクロミルのQuestantを使えば100名ぐらいの調査を1万円で調査できる。便利になったものだ。貧困のテーマでアンケート調査をした。あまり期待通りの結果ではなかったけど、それなりの傾向はでた。そこで得たデータを元に年収に対する重回帰分析をしてみたいと思った。

重回帰分析
回帰分析とは、ある事象Xとある事象Yの相関関係を分析する手法だ。つまり、年功序列型の給与体系であれば年齢と年収には高い相関係数があるはずだ。しかし、最近はそんな甘い社会ではない。では、年収の決定要因はなんだろう。重回帰分析とは、複数の変数と目的変数の関係を分析する手法だ。今回は、対象者の年齢、性別、学歴、父母の学歴、配偶者の年収などと年収との相関関係の分析にトライした。

重相関Rは1に近いほど相関関係がある
今回のサンプルだと重相関Rは0.93だった。これは結構高い数字だ。つまり相関関係があると言える。R2はRの二乗。注意すべきは補正R2だ。データ数が少ないと自由度の影響を受ける。R2は1に近いほど良いモデルであり、0.5以下では半分以下の説明しかできていないことになる。今回のR2は0.86なのでかなり良いモデルと言える。
f:id:hiroshi-kizaki:20200324120044p:plain

切片と係数
切片とはロケットの発射台だ。ここでは4.44となる。これは調査時の年収のラベル付けで、4が年収200-300万円、5が300-400万円なので、350万円弱を示している。また、その標準偏差が3.27なので、年収のばらつきが高い。これに対する係数が最も大きいのがF1_SEX(性)で-5.24となっている。つまり、男性の年収は女性の年収よりも格段に高いことを示している。次に係数が高いのが本人の学歴ではなくて、両親の学歴だった。

t値とp値
t値は影響度を示す。tの絶対値が大きいほど影響度が大きい。ここで分析した要因では配偶者の年収で22.75と非常に大きかった。一方、p値は危険率の小ささだ。F1_SEXと配偶者の年数のp値はゼロだ。両親の学歴も係数が大きいがt値は2.4程度とそれほど高くなく、p値も0.01ほどなので、それなりに影響を与えているということか。ただ、父の学歴は係数もt値もプラスの値だが、母の学歴はなぜかt値もp値もマイナスの値だ。母親の学歴が高いほど年収が下がるのはちょっと理解し難いが興味深い傾向だ。
f:id:hiroshi-kizaki:20200324120248p:plain

まとめ
重回帰分析を使いこなせると複数の要因のうちどの要因がどの程度の影響度を持っているのかを分析することができる。まだ、慣れていないので、基本的な間違いがあるかもしれないが、練習と思ってトライしてみた。今回の傾向が一般的な傾向なのか特異なのかは、一回の調査のみでは判断できない。ただ、本人の学歴の係数が0.06と低いのはちょっと驚きだった。また、金持ちは喧嘩をしないというが、現在よく家族で喧嘩する人の係数は-0.76なので、それを裏付ける結果だった。また、年齢の係数も0.31と低いので、年功序列型給与の時代ではないということだろう。

以上

最後まで読んでいただきありがとうございました。