Hello there, ('ω')ノ
Zスコア(標準得点)とは、データが平均からどれだけ離れているかを標準偏差を基準にして示す指標です。データの分布が正規分布に従う場合、特定のデータが全体の中でどの位置にあるのかを把握するのに役立ちます。
Zスコアの計算式
[
Z = \frac{X - \mu}{\sigma}
]
- ( X ) = 個々のデータ値
- ( \mu ) = 母集団の平均
- ( \sigma ) = 母集団の標準偏差
この値は、データが平均から何標準偏差分離れているかを表します。
Zスコアの解釈
- Z = 0 → データは平均と同じ
- Z > 0 → 平均より大きい(右側)
- Z < 0 → 平均より小さい(左側)
- Z = ±1 → 平均から1標準偏差以内
- Z = ±2 → 平均から2標準偏差以内(約95%のデータがこの範囲に収まる)
- Z = ±3 → 平均から3標準偏差以内(約99.7%のデータがこの範囲に収まる)
Zスコアの用途
- 異常値の検出(アウトライアーの特定)
- Zスコアが±3を超えるデータは外れ値の可能性が高い。
- 正規分布の標準化(比較を容易にする)
- 異なる単位のデータを統一基準で比較できる。
- 確率の計算(正規分布表を利用)
- あるデータが特定の範囲にある確率を求める。
Zスコアの例
例えば、テストの平均点が70点、標準偏差が10点のとき、80点のZスコアを求めると、
[ Z = \frac{80 - 70}{10} = 1.0 ]
これは、80点が平均より1標準偏差高い位置にあることを意味します。
Zスコアを使うことで、データの分布内での位置を直感的に理解しやすくなります。
Best regards, (^^ゞ