Shikata Ga Nai

Private? There is no such things.

仮説検定におけるタイプIエラーとタイプIIエラーの違い

Hello there, ('ω')ノ

仮説検定では、帰無仮説((H_0))と対立仮説((H_1))を設定し、統計的にどちらが妥当かを判断します。その際、誤った結論を下す可能性があり、タイプIエラー(第一種の過誤)タイプIIエラー(第二種の過誤)の2種類のエラーが発生することがあります。


タイプIエラー(第一種の過誤)

  • 定義: 実際には帰無仮説が正しいのに、それを棄却してしまう誤り。
  • 誤った結論: 「差がある」と判断したが、実際には差がない。
    • 無罪の人を誤って有罪と判決する。
    • 健康な人を「病気である」と診断する。
  • エラーの確率: α(有意水準)
    • 通常、α = 0.05(5%)と設定される。これは「5%の確率で誤って帰無仮説を棄却する」ことを意味する。

タイプIIエラー(第二種の過誤)

  • 定義: 実際には帰無仮説が間違っているのに、それを棄却できない誤り。
  • 誤った結論: 「差がない」と判断したが、実際には差がある。
    • 本当に有罪の人を誤って無罪と判決する。
    • 病気の人を「健康である」と診断する。
  • エラーの確率: β(検出力の補数)
    • 1 - β(検出力)を高くすることで、タイプIIエラーの確率を減らせる。
    • 検出力を上げるには、サンプルサイズを増やすことが有効。

タイプIエラー vs. タイプIIエラー

タイプIエラー(α) タイプIIエラー(β)
意味 実際には正しい帰無仮説を誤って棄却 実際には間違っている帰無仮説を誤って受け入れ
誤った判断 「差がある」と誤認 「差がない」と誤認
無罪の人を有罪にする 有罪の人を無罪にする
対策 有意水準を低くする(例: 0.01) 検出力を上げる(サンプルサイズを増やす)

トレードオフと実際の使い分け

  • αを小さくすると、βが大きくなる(タイプIIエラーが増える)
    • 例: α = 0.01 にすると厳密な検定ができるが、本当に差がある場合でも検出できないことがある。
  • βを小さくすると、αが大きくなる(タイプIエラーが増える)
    • 例: 検出力を上げるためにサンプルを増やすと、わずかな差でも有意になり、誤った判断をする可能性が増える。

まとめ

  • タイプIエラー(α): 「差がないのにあると判断する誤り」→ 誤検知のリスク
  • タイプIIエラー(β): 「差があるのにないと判断する誤り」→ 見逃しのリスク
  • どちらを重視するかは状況による
    • 医療(病気の診断)タイプIIエラーを減らす(見逃しを防ぐ)
    • 裁判(刑事事件)タイプIエラーを減らす(冤罪を防ぐ)

状況に応じて、有意水準や検出力を適切に設定することが重要です。

Best regards, (^^ゞ