Shikata Ga Nai

Private? There is no such things.

第44回:t検定・カイ二乗検定・相関分析の基礎

Hello there, ('ω')ノ

統計分析をビジネスで活用したい!と思ったときに避けて通れないのが、「検定」や「分析手法」の選び方です。 その中でも特に使用頻度が高いのが次の3つ:

  1. t検定:2つの平均値の違いを検定
  2. カイ二乗検定:カテゴリ同士の関係性を検定
  3. 相関分析:2つの数値間の関係性を調べる

それぞれ分析の目的や使いどころが異なるので、混乱しないように基礎をしっかり押さえておきましょう!


✅ 1. t検定(ティーけんてい):平均値の差を比較する

🔍 何をするもの?

2つのグループの平均に差があるかを統計的に判断する手法です。


📌 例

  • 男性と女性で満足度スコア(1〜5点)に違いがあるか?
  • 新商品と旧商品の売上に違いがあるか?

✔ 前提条件

  • 数値データ(連続変数)であること
  • データが正規分布に近いこと
  • 各グループが独立していること(独立サンプルt検定の場合)

🧮 Excelでの簡易実行

  • データ分析ツール →「t検定:2標本の平均の差」
  • または関数:T.TEST(配列1, 配列2, 2, 3)(等分散2群の両側検定)

✅ 2. カイ二乗検定(χ²検定):カテゴリの関係を見る

🔍 何をするもの?

2つのカテゴリ(名義尺度)の関係性を検定する方法です。


📌 例

  • 地域(関東・関西・九州)と商品の購入傾向に関係があるか?
  • 性別とアンケート回答(満足/不満)に関連があるか?

✔ ポイント

  • データは「件数」や「比率」で整理する
  • クロス集計表(2×2や3×3表など)を使うことが多い
  • 期待値と実測値のズレを検定する

🧮 Excelでの簡易実行

  • クロス集計表を作成し、関数:CHISQ.TEST(観測値範囲, 期待値範囲)
  • またはピボットテーブル+カイ二乗計算

✅ 3. 相関分析(correlation analysis):数値同士の関係を測る

🔍 何をするもの?

2つの数値データが、どれくらい“関係している”かを数値で表す方法です。


📌 例

  • 広告費と売上金額に関係があるか?
  • 勉強時間とテストの点数に正の相関があるか?

✔ ポイント

  • 相関係数(r)は −1〜+1 の間の数値になる

    • +1:完全に正の相関(増えると増える)
    • −1:完全に負の相関(増えると減る)
    • 0:関係なし(無相関)

🧮 Excelでの実行方法

  • 関数:=CORREL(配列1, 配列2)
  • グラフ:「散布図」を使えば可視化もしやすい!

🎯 3つの手法を比較しよう

手法 データの種類 検定の目的 代表的な使用例
t検定 数値(平均) 平均値の差を比べる 商品AとBの売上比較
カイ二乗検定 カテゴリ(件数) 分布の違いを見る 性別と回答の関係
相関分析 数値(連続) 関係の強さを見る 広告費と売上の関係

🧠 よくある注意点

よくある誤解 正しい理解
相関がある=因果がある 相関 ≠ 因果関係(関連があるだけ)
p値だけで判断する 効果の大きさ(差の幅や相関係数)も確認しよう
正規分布していないのにt検定を使う ノンパラメトリック検定(U検定など)も検討しよう

✅ まとめ:分析の目的に合った手法を選ぼう!

シーン 適した手法 なぜ?
男女の平均点を比べたい t検定 2群の平均の差を見るから
属性別の購入率に違いがあるか知りたい カイ二乗検定 カテゴリ同士の関係を見るから
費用と効果の関係を数値で見たい 相関分析 数値の強弱関係を可視化したいから

Best regards, (^^ゞ