Hello there, ('ω')ノ
仮説検定では、帰無仮説((H_0))と対立仮説((H_1))を設定し、統計的にどちらが妥当かを判断します。その際、誤った結論を下す可能性があり、タイプIエラー(第一種の過誤)とタイプIIエラー(第二種の過誤)の2種類のエラーが発生することがあります。
タイプIエラー(第一種の過誤)
- 定義: 実際には帰無仮説が正しいのに、それを棄却してしまう誤り。
- 誤った結論: 「差がある」と判断したが、実際には差がない。
- 例
- 無罪の人を誤って有罪と判決する。
- 健康な人を「病気である」と診断する。
- エラーの確率: α(有意水準)
- 通常、α = 0.05(5%)と設定される。これは「5%の確率で誤って帰無仮説を棄却する」ことを意味する。
タイプIIエラー(第二種の過誤)
- 定義: 実際には帰無仮説が間違っているのに、それを棄却できない誤り。
- 誤った結論: 「差がない」と判断したが、実際には差がある。
- 例
- 本当に有罪の人を誤って無罪と判決する。
- 病気の人を「健康である」と診断する。
- エラーの確率: β(検出力の補数)
- 1 - β(検出力)を高くすることで、タイプIIエラーの確率を減らせる。
- 検出力を上げるには、サンプルサイズを増やすことが有効。
タイプIエラー vs. タイプIIエラー
タイプIエラー(α) | タイプIIエラー(β) | |
---|---|---|
意味 | 実際には正しい帰無仮説を誤って棄却 | 実際には間違っている帰無仮説を誤って受け入れ |
誤った判断 | 「差がある」と誤認 | 「差がない」と誤認 |
例 | 無罪の人を有罪にする | 有罪の人を無罪にする |
対策 | 有意水準を低くする(例: 0.01) | 検出力を上げる(サンプルサイズを増やす) |
トレードオフと実際の使い分け
- αを小さくすると、βが大きくなる(タイプIIエラーが増える)
- 例: α = 0.01 にすると厳密な検定ができるが、本当に差がある場合でも検出できないことがある。
- βを小さくすると、αが大きくなる(タイプIエラーが増える)
- 例: 検出力を上げるためにサンプルを増やすと、わずかな差でも有意になり、誤った判断をする可能性が増える。
まとめ
- タイプIエラー(α): 「差がないのにあると判断する誤り」→ 誤検知のリスク
- タイプIIエラー(β): 「差があるのにないと判断する誤り」→ 見逃しのリスク
- どちらを重視するかは状況による
- 医療(病気の診断) → タイプIIエラーを減らす(見逃しを防ぐ)
- 裁判(刑事事件) → タイプIエラーを減らす(冤罪を防ぐ)
状況に応じて、有意水準や検出力を適切に設定することが重要です。
Best regards, (^^ゞ