Shikata Ga Nai

Private? There is no such things.

第36回:中心傾向:平均・中央値・最頻値の違い

Hello there, ('ω')ノ

「この商品の売上は“平均すると”どのくらい?」 「社員の年齢の“中央値”ってどれくらい?」 「“一番多い”商品価格帯は?」

このような分析のときに使うのが、「中心傾向(ちゅうしんけいこう)」という考え方です。 つまり「データの中心ってどこ?」という問いに答えるための指標ですね。

中心傾向には、主に次の3つがあります:

  1. 平均(Mean)
  2. 中央値(Median)
  3. 最頻値(Mode)

それぞれどんな特徴があって、どんなときに使い分けるべきなのか?


✅ 1. 平均(Mean):みんな大好き、算数の基本

すべての値の合計を、件数で割ったもの。 Excelや日常の計算でもよく使われます。

🔍 計算方法の例

例:年収データが [300万, 400万, 500万, 2000万] の場合  
→ 平均 = (300 + 400 + 500 + 2000) ÷ 4 = 800万円

✔ 特徴

  • 値のバランスをとる指標
  • 計算が簡単で、比較しやすい
  • 外れ値に弱い(極端に大きい値に引っ張られる)

✅ 2. 中央値(Median):真ん中の値

データを小さい順に並べて、真ん中の値をとる。

🔍 計算方法の例

[300万, 400万, 500万, 2000万] → 昇順に並べる → 中央は 400万 と 500万の間  
→ 中央値 = (400 + 500) ÷ 2 = 450万円

※ 奇数件なら、真ん中の値1つをそのまま使います。

✔ 特徴

  • 外れ値の影響を受けにくい
  • 所得や年齢など、偏りのあるデータに向いている
  • データの「典型的な位置」を示すのに便利

✅ 3. 最頻値(Mode):いちばん多い値

データの中で最も多く登場する値。

🔍 例

[300万, 400万, 400万, 500万, 2000万] → 最頻値は「400万」

✔ 特徴

  • 数値でも文字列でも使える(例:都道府県、職種など)
  • 売れ筋・人気商品などの“一番選ばれているもの”を知るのに適している
  • データに複数の最頻値が存在する場合もある

🎯 比較まとめ表

指標 特徴 向いているデータ 注意点
平均 全体のバランス 点数・温度・売上など 外れ値に引っ張られる
中央値 真ん中の値 年収・不動産価格など 並び替えが必要
最頻値 一番多い値 購入商品・地域・職業など 複数出る場合もある

📘 Excelでの使い方

目的 関数 使用例
平均 =AVERAGE(範囲) =AVERAGE(A2:A10)
中央値 =MEDIAN(範囲) =MEDIAN(B2:B10)
最頻値 =MODE.SNGL(範囲) =MODE.SNGL(C2:C10)

🧠 実務での使い分け例

シーン おすすめ指標 理由
年収の傾向 中央値 一部の高所得者に影響されない
テストの平均点 平均 生徒全体のバランスを比較しやすい
人気商品の把握 最頻値 最も売れている商品の把握に使える
家賃相場 中央値 高額物件が多くても誤差が小さい

✅ まとめ:「中心」を見る視点を変えると、分析が深まる

ポイント 内容
中心傾向には3つの代表指標がある 平均・中央値・最頻値
外れ値があるときは平均より中央値が有効 特に金額・時間系データで
分布の形に応じて使い分ける 歪み(ゆがみ)やバラつきも意識しよう
実務では“3つすべて”出すのが理想 複数指標の比較でバランス確認!

Best regards, (^^ゞ