Hello there, ('ω')ノ
統計分析をビジネスで活用したい!と思ったときに避けて通れないのが、「検定」や「分析手法」の選び方です。 その中でも特に使用頻度が高いのが次の3つ:
- t検定:2つの平均値の違いを検定
- カイ二乗検定:カテゴリ同士の関係性を検定
- 相関分析:2つの数値間の関係性を調べる
それぞれ分析の目的や使いどころが異なるので、混乱しないように基礎をしっかり押さえておきましょう!
✅ 1. t検定(ティーけんてい):平均値の差を比較する
🔍 何をするもの?
2つのグループの平均に差があるかを統計的に判断する手法です。
📌 例
- 男性と女性で満足度スコア(1〜5点)に違いがあるか?
- 新商品と旧商品の売上に違いがあるか?
✔ 前提条件
- 数値データ(連続変数)であること
- データが正規分布に近いこと
- 各グループが独立していること(独立サンプルt検定の場合)
🧮 Excelでの簡易実行
- データ分析ツール →「t検定:2標本の平均の差」
- または関数:
T.TEST(配列1, 配列2, 2, 3)
(等分散2群の両側検定)
✅ 2. カイ二乗検定(χ²検定):カテゴリの関係を見る
🔍 何をするもの?
2つのカテゴリ(名義尺度)の関係性を検定する方法です。
📌 例
- 地域(関東・関西・九州)と商品の購入傾向に関係があるか?
- 性別とアンケート回答(満足/不満)に関連があるか?
✔ ポイント
- データは「件数」や「比率」で整理する
- クロス集計表(2×2や3×3表など)を使うことが多い
- 期待値と実測値のズレを検定する
🧮 Excelでの簡易実行
- クロス集計表を作成し、関数:
CHISQ.TEST(観測値範囲, 期待値範囲)
- またはピボットテーブル+カイ二乗計算
✅ 3. 相関分析(correlation analysis):数値同士の関係を測る
🔍 何をするもの?
2つの数値データが、どれくらい“関係している”かを数値で表す方法です。
📌 例
- 広告費と売上金額に関係があるか?
- 勉強時間とテストの点数に正の相関があるか?
✔ ポイント
相関係数(r)は −1〜+1 の間の数値になる
- +1:完全に正の相関(増えると増える)
- −1:完全に負の相関(増えると減る)
- 0:関係なし(無相関)
🧮 Excelでの実行方法
- 関数:
=CORREL(配列1, 配列2)
- グラフ:「散布図」を使えば可視化もしやすい!
🎯 3つの手法を比較しよう
手法 | データの種類 | 検定の目的 | 代表的な使用例 |
---|---|---|---|
t検定 | 数値(平均) | 平均値の差を比べる | 商品AとBの売上比較 |
カイ二乗検定 | カテゴリ(件数) | 分布の違いを見る | 性別と回答の関係 |
相関分析 | 数値(連続) | 関係の強さを見る | 広告費と売上の関係 |
🧠 よくある注意点
よくある誤解 | 正しい理解 |
---|---|
相関がある=因果がある | 相関 ≠ 因果関係(関連があるだけ) |
p値だけで判断する | 効果の大きさ(差の幅や相関係数)も確認しよう |
正規分布していないのにt検定を使う | ノンパラメトリック検定(U検定など)も検討しよう |
✅ まとめ:分析の目的に合った手法を選ぼう!
シーン | 適した手法 | なぜ? |
---|---|---|
男女の平均点を比べたい | t検定 | 2群の平均の差を見るから |
属性別の購入率に違いがあるか知りたい | カイ二乗検定 | カテゴリ同士の関係を見るから |
費用と効果の関係を数値で見たい | 相関分析 | 数値の強弱関係を可視化したいから |
Best regards, (^^ゞ