Hello there, ('ω')ノ
「この商品の売上は“平均すると”どのくらい?」 「社員の年齢の“中央値”ってどれくらい?」 「“一番多い”商品価格帯は?」
このような分析のときに使うのが、「中心傾向(ちゅうしんけいこう)」という考え方です。 つまり「データの中心ってどこ?」という問いに答えるための指標ですね。
中心傾向には、主に次の3つがあります:
- 平均(Mean)
- 中央値(Median)
- 最頻値(Mode)
それぞれどんな特徴があって、どんなときに使い分けるべきなのか?
✅ 1. 平均(Mean):みんな大好き、算数の基本
すべての値の合計を、件数で割ったもの。 Excelや日常の計算でもよく使われます。
🔍 計算方法の例
例:年収データが [300万, 400万, 500万, 2000万] の場合 → 平均 = (300 + 400 + 500 + 2000) ÷ 4 = 800万円
✔ 特徴
- 値のバランスをとる指標
- 計算が簡単で、比較しやすい
- 外れ値に弱い(極端に大きい値に引っ張られる)
✅ 2. 中央値(Median):真ん中の値
データを小さい順に並べて、真ん中の値をとる。
🔍 計算方法の例
[300万, 400万, 500万, 2000万] → 昇順に並べる → 中央は 400万 と 500万の間 → 中央値 = (400 + 500) ÷ 2 = 450万円
※ 奇数件なら、真ん中の値1つをそのまま使います。
✔ 特徴
- 外れ値の影響を受けにくい
- 所得や年齢など、偏りのあるデータに向いている
- データの「典型的な位置」を示すのに便利
✅ 3. 最頻値(Mode):いちばん多い値
データの中で最も多く登場する値。
🔍 例
[300万, 400万, 400万, 500万, 2000万] → 最頻値は「400万」
✔ 特徴
- 数値でも文字列でも使える(例:都道府県、職種など)
- 売れ筋・人気商品などの“一番選ばれているもの”を知るのに適している
- データに複数の最頻値が存在する場合もある
🎯 比較まとめ表
指標 | 特徴 | 向いているデータ | 注意点 |
---|---|---|---|
平均 | 全体のバランス | 点数・温度・売上など | 外れ値に引っ張られる |
中央値 | 真ん中の値 | 年収・不動産価格など | 並び替えが必要 |
最頻値 | 一番多い値 | 購入商品・地域・職業など | 複数出る場合もある |
📘 Excelでの使い方
目的 | 関数 | 使用例 |
---|---|---|
平均 | =AVERAGE(範囲) |
=AVERAGE(A2:A10) |
中央値 | =MEDIAN(範囲) |
=MEDIAN(B2:B10) |
最頻値 | =MODE.SNGL(範囲) |
=MODE.SNGL(C2:C10) |
🧠 実務での使い分け例
シーン | おすすめ指標 | 理由 |
---|---|---|
年収の傾向 | 中央値 | 一部の高所得者に影響されない |
テストの平均点 | 平均 | 生徒全体のバランスを比較しやすい |
人気商品の把握 | 最頻値 | 最も売れている商品の把握に使える |
家賃相場 | 中央値 | 高額物件が多くても誤差が小さい |
✅ まとめ:「中心」を見る視点を変えると、分析が深まる
ポイント | 内容 |
---|---|
中心傾向には3つの代表指標がある | 平均・中央値・最頻値 |
外れ値があるときは平均より中央値が有効 | 特に金額・時間系データで |
分布の形に応じて使い分ける | 歪み(ゆがみ)やバラつきも意識しよう |
実務では“3つすべて”出すのが理想 | 複数指標の比較でバランス確認! |
Best regards, (^^ゞ