統計データ処理/分析

統計データ処理/分析


ShannonLabでは、様々な統計分析手法を用いて仮説の検証を行っております。
ここでは、基本的な統計分析の手法をご紹介します!

<平均値と分散>
平均値は、データの代表的・中心的傾向を示す値の一つです。

 

 

 

分散は、標本データの散らばりを示す値です。
つまり、分散は「平均からのズレやバラツキ」のことです。
「平均からのズレやバラツキ」に注目し、グループ間差異の有無を検定することを分散分析といいます。分散を分析すると、グループ間の平均の差に意味があるか否かがわかります。  

<相関分析>
相関分析は、「2変数間の変動パターン」を示す分析手法です。
「2つの変数間の関係の強さ」を示す係数のことを相関係数といいます。
データをプロットした散布図において直線的な関係があるものを相関関係があるといいます。
また1つの変数が増加するにつれて、もう1つの変数も増加する場合には「正の相関がある」といい、逆の場合は「負の相関がある」といいます。

<回帰分析>
回帰分析は、複数の変数間の因果関係を説明・予測する分析手法です。
一つの結果を表す変数(従属変数と言います。)を、複数の原因を表す変数(独立変数といいます。)によって分析します。
例えば、 あるスーパーマーケットの販売実績と顧客の属性の関係を分析するとします。
顧客の購入額を結果を表す変数として、 顧客の年齢や性別、年収(顧客の属性)を原因を表す変数で説明します。

(重回帰式) y=a+b1x1+b2x2+・・・・+bixi
    (購入額)=a×(年齢)+b1×(性別)+b2(年収)     

この式にa,b1,b2,の値(これを偏回帰係数といいます)と顧客の属性データを入れれば、購入額が推定できるというのが、回帰分析の考え方です。

!相関分析と回帰分析の違い!
相関分析と回帰分析の違いをここでチェックしておきます。
相関分析は「2変数間の変動パターン」を示し、回帰分析は「複数の変数間の因果関係を説明・予測する」分析手法でした。
つまり、相関分析は、一方の変数の値が増えると他方の変数の値がどれだけ変化するか、という「影響力の大きさ」(グラフでいうところの直線の傾き)までは教えてくれません。
なので、「どちらの変数が原因でどちらの変数が結果か」が仮説化されてない場合や特定できない場合に用いられます。しかし、回帰分析は、「一方の変数がこれだけ増えると、他方の変数がどれだけ増えるか」と言うように、影響力の大きさを検討できます。

<因子分析>
因子分析は、「観測された多数の変数(観測変数)」を「少数の変数(因子)」に縮約する統計手法です。
因子分析においては、観測変数がどのような値をとるかは、その背後にある因子によって決まると考えます。
例えば「算数や理科のテスト得点(観測変数)は、その受験者の文系的能力と理系的能力(背後にある潜在的な能力)によって決まってくる」、と考えます。
つまり、因子分析を使うことにより、各科目の点数を1つずつ考えるよりも、背後にある理系・文系能力の大きさを見たほうが、その受験生の能力をカンタンに解釈できる!のです。 

重回帰分析と因子分析の違い!
今度は、重回帰分析と因子分析の違いを確認します。
重回帰分析は、因子分析と似ている様に思われますが目的が違います。
詳しくは下記参照してください。
重回帰分析
因子分析によって多数の観測変数が、少数の因子にまとめられました。
そこで、少数にまとめられた因子(原因)によって、どのような結果が起こるのか、を調べることができます。

データ分析


弊社ではデータ分析のご依頼も承っております。

興味をもたれましたら、是非一度お問合わせください。
後ほど担当者からご連絡致します。
→ 問い合わせフォーム