第9章 9-3 / 統計的な推測

仮説検定

このページで学ぶこと

統計検定3級講座、いよいよ最終ページです。本ページでは、統計的推測のもうひとつの柱「仮説検定」──「立てた仮説が正しいかを統計的に判断する」方法を整理します。

扱う内容は、仮説検定の手順有意水準の意味片側検定と両側検定、そして棄却域。第7章の正規分布、9-2の信頼区間の知識を活かして、「データから判断する力」を最後に手に入れましょう。

本ページも、3級としては概念の紹介が中心です。具体例を軸に、手順を一つずつ追いかけていきます。

さえちゃん
さえ

ついに最後のページ! 仮説検定は「もしこの仮説が正しかったら、こんな結果は珍しすぎて起こらないはず」という発想で判断する手法だよ! ちょっと回りくどい論理だけど、慣れると癖になる思考法!

1. 仮説検定の発想 ─ 「もしも本当だったら」

仮説検定は、独特な論理の流れを持つ手法です。最初に発想を整理しておきましょう。

身近な例で考える

友人が「このコインは公平だよ」と言って、目の前で10回投げたら10回連続で表が出ました。あなたはどう思いますか?

おそらく「本当に公平?」と疑い始めるはず。なぜなら、「公平なコインで10連続表」というのは確率があまりにも小さいからです((1/2)¹⁰ ≒ 0.001、つまり1000回に1回)。「もし公平なら、こんなことは滅多に起こらないはず → だから公平じゃない可能性が高い」と判断するわけです。

この「もしも仮説が本当だったら、こんな結果は珍しすぎる」という発想こそ、仮説検定の本質です。

仮説検定の論理

POINT

仮説検定は、「ある仮説が正しいと仮定したら、観測されたデータは確率的にどれくらい起こりうるか」を計算し、その確率が小さすぎるなら「仮説が間違っている可能性が高い」と判断する手法です。

ちょっと回りくどい論理ですよね。これを正確に運用するために、統計学では「帰無仮説」「対立仮説」「有意水準」といった用語が用意されています。

2. 帰無仮説と対立仮説

仮説検定では、2つの仮説を立てて対比させます。

帰無仮説 H₀

帰無仮説(きむかせつ、null hypothesis)は、検定で「否定したい仮説」です。記号 H₀(エイチ・ゼロ)で表します。

コインの例だと「このコインは公平である(p = 0.5)」が帰無仮説。一見「これを否定したい?」と感じるかもしれませんが、仮説検定では「もし帰無仮説が正しかったら…」と仮定して計算するので、これが出発点になります。

対立仮説 H₁

対立仮説(たいりつかせつ、alternative hypothesis)は、「主張したい仮説」です。記号 H₁(エイチ・イチ)で表します。

コインの例なら「このコインは公平でない(p ≠ 0.5)」が対立仮説。「公平じゃないよ」というのが、私たちが本当に主張したい結論ですね。

2つの仮説の関係

名称 意味 コインの例
帰無仮説 H₀否定したい仮説p = 0.5(公平)
対立仮説 H₁主張したい仮説p ≠ 0.5(公平でない)

仮説検定の流れは、「帰無仮説H₀が正しいと仮定して計算 → データの確率がとても小さければ、H₀を否定して(=棄却して)、対立仮説H₁を採用」となります。「敵を仮定して、その敵を倒す」イメージですね。

3. 有意水準 ─ 「珍しすぎる」の境界線

ここで重要なのが、「確率がどれくらい小さければ『珍しすぎる』と判断するのか」という基準。これを決めるのが有意水準です。

有意水準とは

POINT

有意水準(ゆういすいじゅん、significance level)とは、「珍しすぎると判断する確率の境界線」のこと。記号 α(アルファ)で表します。

よく使われる有意水準は5%(α = 0.05)1%(α = 0.01)。3級では特に5%が基本です。

有意水準の意味

有意水準5%とは、「もし帰無仮説が正しかったとしても、20回に1回くらいは『珍しい結果』が偶然出てしまう」というラインを引くこと。それより小さい確率の結果が出たら、「偶然とは思えない → 帰無仮説が間違っている」と判断します。

有意水準と信頼度の関係

「あれ、5%の有意水準と95%の信頼区間って似ている?」と気づいた方、鋭いです。実際、その2つは裏表の関係にあります。

「100% − 信頼度 = 有意水準」。同じ世界を、別の角度から見ているわけですね。

4. 棄却域 ─ 「ここに入ったらアウト」

有意水準を決めたら、それに対応する棄却域を確定します。

棄却域とは

POINT

棄却域(ききゃくいき、rejection region)とは、「観測値がここに入ったら帰無仮説を棄却する」と決めた範囲のこと。

検定統計量が棄却域に入れば「H₀を棄却(対立仮説H₁を採用)」、入らなければ「H₀を棄却できない」と判断します。

有意水準5%・両側検定の棄却域

標準正規分布で、有意水準5%の場合の棄却域はどこになるでしょうか? 9-2で見たとおり、±1.96の外側に5%(両端それぞれ2.5%ずつ)が入ります。

0 -1.96 +1.96 採択域 95% 棄却域 2.5% 棄却域 2.5% 両側検定(α=5%)の棄却域

標準正規分布で両側検定(α=5%)の場合、±1.96の外側が棄却域。中央95%は採択域

検定統計量(標準化したZの値)を計算して、±1.96の範囲内なら採択域(=H₀を棄却できない)、±1.96より外側なら棄却域(=H₀を棄却)と判断します。

5. 片側検定と両側検定

ここまで見てきたのは「両側検定」でした。検定にはもう1種類「片側検定」があります。

両側検定

対立仮説が「等しくない」(≠)のとき、検定は両側検定になります。

コインの例のように、「公平か、そうじゃないか」を判定するときに使います。左右両方に棄却域を取るので、α=5%なら左右に2.5%ずつ分けます。

片側検定

対立仮説が「より大きい」(>)または「より小さい」(<)のとき、検定は片側検定になります。

新薬の効果テストで「従来より効くか?」を判定するような場面ですね。片側だけに棄却域を取るので、α=5%ならその片側に5%全部を割り当てます。

POINT

両側検定の境界値(α=5%):±1.96(両端2.5%ずつ)
片側検定の境界値(α=5%):1.645 または -1.645(片側5%)

使い分けの判断

片側検定 vs 両側検定の判断は、対立仮説が「方向を持つか」で決まります。

6. 仮説検定の手順

ここまで学んだ要素を組み合わせて、仮説検定の標準的な手順を整理します。

5ステップで実行

仮説検定は、次の5つのステップで行います。

① 仮説を立てる
帰無仮説 H₀ と対立仮説 H₁ を明確にします。

② 有意水準 α を決める
慣例的に α = 5% (= 0.05) が標準です。

③ 棄却域を決める
両側検定なら ±1.96 の外側、片側検定なら ±1.645 の外側。

④ 検定統計量を計算する
標本データから検定統計量(標準化したZ値など)を計算します。

⑤ 判定する
検定統計量が棄却域に入れば「H₀を棄却(H₁を採用)」、入らなければ「H₀を棄却できない」。

具体例:コインは公平か?

EXAMPLE

あるコインを100回投げたところ、表が62回出ました。このコインは公平と言えるでしょうか? 有意水準5%で検定してください。

ステップ通りに解く

① 仮説

対立仮説は「等しくない」なので両側検定です。

② 有意水準 α = 0.05

③ 棄却域 |Z| > 1.96

④ 検定統計量

H₀(p=0.5)が正しいとすると、9-1で学んだ通り、標本比率 p̂ の標準偏差は √(p(1-p)/n) = √(0.5×0.5/100) = 0.05。

標本比率 p̂ = 62/100 = 0.62 を標準化すると、

Z = (0.62 − 0.5) / 0.05 = 2.4

⑤ 判定

|Z| = 2.4 は 1.96 より大きいので、棄却域に入っています。よってH₀を棄却。「このコインは公平でないと言える」が結論です。

もし表が55回(Z=1.0)だったら、|Z|=1.0 で棄却域には入らず「公平でないとは言えない」となっていたはずです。62回はギリギリ「珍しすぎる」とみなされた、というわけですね。

7. 仮説検定の注意点

最後に、仮説検定を扱うときに注意すべきポイントを整理しておきます。3級の試験でも問われやすいので押さえておきましょう。

注意1:「棄却できない」は「正しい」ではない

検定で「H₀を棄却できない」という結果が出たとき、「H₀が正しい」と結論してはいけません。これは仮説検定でもっとも誤解されやすい点です。

正しい解釈は「現時点のデータでは、H₀を否定する証拠が不十分」。データが少ない、効果が小さい、といった理由で否定できなかっただけかもしれません。「証拠不十分」と「無罪確定」は違いますよね。

注意2:有意 ≠ 重要

検定で「有意な差がある」と出ても、それが実用上「重要」かどうかは別問題です。標本サイズが大きいと、ごく小さな差でも統計的には有意になりがち。

たとえば、新薬で測定値が0.001%上昇していて、それが統計的に有意だったとしても、医学的に意味のある差なのかは別の判断が必要です。「有意」は数字の話、「重要」は中身の話──これは分けて考える必要があります。

注意3:有意水準は事前に決める

有意水準はデータを見る前に決めます。「結果が出てから、有意になるように水準を調整する」のは恣意的で、検定としての意味を失います。3級では普通5%が選ばれますが、扱う問題の性質によっては1%を使うこともあります。

POINT

仮説検定は「データから結論を引き出す強力なツール」ですが、結果の解釈には慎重さが必要です。「有意=正しい」「有意=重要」と短絡しないこと、これが統計を学んだ人の見方です。

8. 第9章を終えて

第9章「統計的な推測」、おつかれさまでした。最後に章全体を俯瞰しておきましょう。

テーマ 身につけた力
9-1統計的な推測母集団パラメータと標本統計量、標本分布の概念
9-2区間推定母平均と母比率の95%信頼区間、信頼区間の正しい解釈
9-3本ページ仮説検定の手順、有意水準、棄却域、片側・両側検定

第9章は3級の出題範囲としては概念紹介が中心でしたが、ここで学んだ「標本から母集団を推測する」という発想は、2級・準1級・現代のデータサイエンスへのそのまま続く扉です。第一種・第二種の過誤、t検定、χ²検定など、より高度な内容は2級・準1級で順に出会うことになります。

CHAPTER 9 完了! そして3級講座の終わりに

第9章「統計的な推測」、ここで完了です。

そして同時に──統計検定3級講座、全章完了です!

たどってきた道のり

9章までを振り返ってみましょう。

身につけた力

あなたは「データを見る力」「データから判断する力」「データで未来を推測する力」を手に入れました。これは3級の合格のためだけではなく、データに溢れる現代社会を生き抜くための道具箱を揃えた感じです。

ニュースの世論調査、ビジネスの意思決定、科学的な研究、医療の判断、選挙の議席予測──あらゆる場面で「数字の意味を正しく読み解く」力が、統計学を学ぶ意義です。

これから先へ

統計学にさらに興味を持ったら、統計検定2級に挑戦してみてください。2級では、本講座で「参考」として触れた中心極限定理、第一種・第二種の過誤、t検定、χ²検定など、より精密な手法を体系的に学べます。あるいは、データサイエンス・機械学習の世界へ進むのも素敵です。3級で身につけた基礎が、新しい学びのすべての土台になります。

まずは全9章、本当におつかれさまでした!

さえちゃん
さえ

3級講座、コンプリート! 本当におつかれさま! 第1章から第9章まで、第6章の確率がいちばん大変だったかな。ここまで理解できたら、もう「統計の人」って名乗っても問題ありません! これからも、データを正しく見る力を大切にしてくださいね!