第4章 4-3 / 統計的仮説検定

検定統計量の構成 — なぜその統計量で判断できるのか

このページで学ぶこと

前回まで（4-1・4-2）で、仮説検定の「考え方」と「言葉」は整いました。帰無仮説 $H_0$、対立仮説 $H_1$、有意水準、棄却域、$p$ 値。でも、まだ肝心の道具がありません。観測されたデータから、いったい何を計算すれば「$H_0$ が怪しい」と言えるのか?──その計算する量が検定統計量です。

本ページの主役は、検定統計量がなぜその形をしているのかです。結論を先に言うと、「$H_0$ が正しいと仮定したとき、分布が完全に分かる量」を作ること。これさえできれば、観測値がどれだけ起こりにくいかを数表で測れます。標本平均から $Z=\dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}$ を1ステップずつ作り、そこから「（推定量）−（帰無値）÷標準誤差」というすべての検定に共通する設計図を取り出します。

さえ

「$z$ 検定はこの式、$t$ 検定はこの式」って、検定統計量を丸暗記してない?　実はね、全部おなじ発想から生まれてるの。合言葉は「$H_0$ が正しいなら分布が分かる量を作る」。これさえ腑に落ちると、$z$ も $t$ も $\chi^2$ も $F$ も、ぜんぶ同じ顔に見えてくるよ。今日はその設計図を手に入れる回！

1. 何を測りたいのか（直感）

仮説検定がやりたいことを、ひとことで言い直してみます。「もし帰無仮説 $H_0$ が正しいとしたら、いま手元にあるような観測は、どれくらい起こりにくいことなのか?」──これを数値で測りたいのです。あまりに起こりにくければ、「$H_0$ が正しい」という前提のほうが怪しい、と判断する。これが背理法に似た検定の骨格でした（4-1）。

たとえば「この銘柄の内容量は平均 $200\,\text{g}$ だ」（$H_0:\mu=200$）を疑っているとします。$n=25$ 個を測って標本平均が $\bar{x}=205\,\text{g}$ だったとき、この「$5\,\text{g}$ のズレ」は誤差で済む範囲なのか、それとも明らかに重すぎるのか。ズレの大きさ $5\,\text{g}$ をそのまま眺めても判断できません。そのズレが、偶然のばらつきと比べてどれだけ大きいかを測るモノサシが要ります。

POINT

測りたいのは「起こりにくさ」、つまり確率です。確率を計算するには分布が分かっていないといけません。ところが $\bar{X}$ の分布には、未知の母平均 $\mu$ や母分散 $\sigma^2$ といった母数が混じっていて、そのままでは数表が引けない。そこで「$H_0$ が正しい」という仮定を逆手に取り、母数を消して分布を既知の形に固定した量をこしらえます。それが検定統計量です。

2. 出発点 ─ 標本平均の分布

母平均 $\mu$、母分散 $\sigma^2$ の母集団から大きさ $n$ の標本を取ります。ここではまず母分散 $\sigma^2$ は既知としておきます（未知の場合は §5 で扱います）。2-13c 中心極限定理より、標本平均 $\bar{X}$ は次の分布に従います。

FORMULA

$$\bar{X} \sim N\!\left(\mu,\ \frac{\sigma^2}{n}\right)$$ 期待値は母平均 $\mu$、分散は $\sigma^2/n$。母集団が正規分布ならどんな $n$ でも厳密に、そうでなくても $n$ が大きければ中心極限定理で近似的に成り立ちます。これは区間推定（3-5）の出発点とまったく同じ式です。

ところが、この式の中の $\mu$ は未知です。未知の母数が入ったままでは、「$\bar{X}$ が $205$ 以上になる確率」を計算しようにも、どの正規分布で計算すればいいのか定まりません。ここで $H_0$ が効いてきます。

3. 帰無仮説を「代入」する

帰無仮説とは、母数に具体的な値を1つ指定する仮説でした。母平均についての検定なら、$H_0:\mu=\mu_0$ という形を取ります。この $\mu_0$ を帰無値と呼びます（さきの例なら $\mu_0=200$）。「$H_0$ が正しいと仮定する」とは、$\bar{X}$ の分布の $\mu$ に、この既知の値 $\mu_0$ を代入してよい、ということです。

FORMULA（H₀ のもとでの分布）

$H_0:\mu=\mu_0$ が正しいと仮定すると、 $$\bar{X} \sim N\!\left(\mu_0,\ \frac{\sigma^2}{n}\right)$$ $\mu_0$ も $\sigma^2$ も $n$ もすべて既知の数になりました。未知だった母数が消え、分布が一つに定まっています。これで「$\bar{X}$ がこの値以上になる確率」が原理的には計算できる状態です。

あとは、この正規分布を標準化して、誰でも数表で扱える標準正規分布 $N(0,1)$ に直すだけ。標準化とは「期待値を引いて標準偏差で割る」操作でした（2-10）。これが検定統計量づくりの山場です。

4. 検定統計量を作る（導出★）

ここが本ページの心臓部です。$H_0$ のもとでの $\bar{X}$ の分布を標準化し、母数の消えた統計量 $Z$ を組み立てます。途中を飛ばさず、1ステップずつ追っていきます。

直感：標準化で「物差し」を作る

標準化の正体は「ズレを、ばらつきの単位で測り直す」ことです。$\bar{X}-\mu_0$ は帰無値からの生のズレ。これを $\bar{X}$ の標準偏差 $\sigma/\sqrt{n}$（＝標本平均がどれくらいブレるかの目安、これを標準誤差といいます）で割れば、「ズレは標準誤差の何個ぶんか」という無単位の物差しになります。$\text{g}$ や $\text{cm}$ といった単位が消え、どんな問題でも同じ尺度で比較できるようになるのです。

導出

DERIVATION

$$ \begin{aligned} \bar{X} &\sim N\!\left(\mu_0,\ \frac{\sigma^2}{n}\right) &&\text{(H0 を代入。母数が既知になった)}\\[4pt] E[\bar{X}] = \mu_0,\quad \sqrt{V[\bar{X}]} &= \sqrt{\frac{\sigma^2}{n}} = \frac{\sigma}{\sqrt{n}} &&\text{(期待値と標準偏差を取り出す)}\\[4pt] Z &= \frac{\bar{X}-E[\bar{X}]}{\sqrt{V[\bar{X}]}} = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} &&\text{(期待値を引き、標準偏差で割る＝標準化)}\\[4pt] Z &\sim N(0,1) &&\text{(正規分布の標準化はつねに } N(0,1) \text{)} \end{aligned} $$

FORMULA（母平均の検定統計量・分散既知）

$$Z = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1)\quad(\text{H}_0\text{ のもとで})$$ この $Z$ こそが検定統計量です。中身を見ると、未知の母数はどこにも残っていません。$\bar{X}$ は観測から計算でき、$\mu_0$ は $H_0$ が与え、$\sigma$ と $n$ は既知。すべて手元の数字だけで値が出せて、しかも従う分布は $N(0,1)$ という誰でも知っている形に固定されている──これが「検定に使える」ということの中身です。

POINT（なぜ判断に使えるのか）

$Z$ が $N(0,1)$ に従うなら、$Z$ の値が $0$ の近くなら「$\bar{X}$ は $\mu_0$ の近くにいる＝$H_0$ と整合的」、$Z$ が $\pm 2$ や $\pm 3$ のように大きく振れたら「$H_0$ のもとではめったに起きない場所に観測が来た＝$H_0$ が怪しい」と読めます。観測の珍しさを、$N(0,1)$ という共通の物差しの上の位置として測れる。だから $Z$ の値ひとつで判断できるのです。観測の珍しさを確率にしたものが、次回学ぶ棄却域や $p$ 値です。

さえ

ポイントは「$\mu$ を $\mu_0$ に置き換えた瞬間に、分布が完全に決まる」こと！　ふだん $\mu$ は未知でモヤモヤしてるけど、$H_0$ を信じれば $\mu=\mu_0$ ってハッキリする。だから確率が計算できるようになるの。検定統計量は、「$H_0$ が正しいと信じきった世界」で初めて分布が見える量──そう思うとスッキリするよ！

5. 一般原理 ─ すべての検定に共通の設計図

いま作った $Z=\dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}$ を、もう一段抽象化してみます。分子の $\bar{X}$ は母平均 $\mu$ の推定量、$\mu_0$ は $H_0$ が指定する帰無値、分母の $\sigma/\sqrt{n}$ は推定量の標準誤差でした。役割だけで書き直すと、次の形が見えてきます。

FORMULA（検定統計量の一般形）

$$\text{検定統計量} = \frac{(\text{推定量}) - (\text{帰無値})}{\text{標準誤差}}$$ 「推定量が帰無値からどれだけズレているか」を、「そのズレが偶然どれくらい生じうるか（標準誤差）」で割る。分子でズレを測り、分母でばらつきの単位に直す。この一行が、2級で出てくるほぼすべての検定統計量の設計図です。

この設計図のうれしいところは、「何を推定するか」を差し替えるだけで、いろいろな検定が同じ発想で生まれることです。相手（推定量）を変えると、分子と分母の中身が変わり、それにともなって従う分布も変わります。代表的な4つを並べてみましょう。

検定の相手	推定量	検定統計量（H₀ のもと）	従う分布
母平均（分散既知）	$\bar{X}$	$\dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}$	$N(0,1)$（$z$）
母平均（分散未知）	$\bar{X}$	$\dfrac{\bar{X}-\mu_0}{s/\sqrt{n}}$	$t_{n-1}$（$t$）
母分散	$s^2$	$\dfrac{(n-1)s^2}{\sigma_0^2}$	$\chi^2_{n-1}$
2つの母分散の比	$s_1^2,\,s_2^2$	$\dfrac{s_1^2}{s_2^2}$	$F$ 分布

母分散や分散比の統計量は分数の形が少し違って見えますが、発想は同じです。「$H_0$ を代入すると母数が消え、分布が既知になる量」を、相手に合わせて組み立てているだけ。母平均なら標準正規や $t$、母分散なら $\chi^2$、分散比なら $F$ という標本分布（2-12）が出てくる、というわけです。

母分散が未知なら $t$ になる理由（さわりだけ）

母平均の検定で、もし母分散 $\sigma^2$ が分からなければ、分母の $\sigma$ を不偏分散の平方根 $s$ で代用します。すると分母までもが標本ごとにゆらぐ確率変数になり、ばらつきが上乗せされて、分布は標準正規より裾の重い $t$ 分布（自由度 $n-1$）に変わります。これは区間推定で $z$ から $t$ に切り替えたとき（3-7）とまったく同じ理由です。検定でも推定でも、「$\sigma$ を $s$ で代用 → $t$」という対応は共通します。

6. 区間推定との対応

実は、いま作った検定統計量と、3章でやった区間推定は同じ式の表と裏です。両方とも出発点は $Z=\dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1)$。違いは、その式をどちらの未知数について読むかだけなのです。

POINT（推定と検定は同じコインの裏表）

区間推定（3-5）では、$\mu$ を未知のまま残し、$P(-z_{\alpha/2}\le Z\le z_{\alpha/2})=1-\alpha$ を$\mu$ について解いて、$\mu$ をはさむ区間 $\bar{X}\pm z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}}$ を作りました。
仮説検定では逆に、$\mu=\mu_0$ という具体値を先に代入して $Z$ の値を計算し、それが中央 $1-\alpha$ の外（裾）に落ちるかどうかを見ます。
だから両者は表裏一体です。「信頼区間に $\mu_0$ が含まれない」と「有意水準 $\alpha$ の両側検定で $H_0$ が棄却される」は、まったく同じ条件になります（次回 4-4 で確かめます）。

区間推定は μ について解き、検定は μ0 を代入して Z を見る。出発点の式は同じ。「区間に μ0 が入らない」＝「両側検定で棄却」は等価。

7. 数値例で組み立てる

EXAMPLE 1（検定統計量を作って読む）

ある銘柄の内容量は母標準偏差 $\sigma=10\,\text{g}$ と分かっており、表示は「平均 $200\,\text{g}$」です。$n=25$ 個を測ると標本平均 $\bar{x}=205\,\text{g}$ でした。$H_0:\mu=200$ のもとで検定統計量を計算します。

まず標準誤差は $\dfrac{\sigma}{\sqrt{n}}=\dfrac{10}{\sqrt{25}}=\dfrac{10}{5}=2\,\text{g}$。検定統計量は $$z = \frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}} = \frac{205-200}{2} = \frac{5}{2} = 2.5$$

$5\,\text{g}$ という生のズレが、「標準誤差 $2\,\text{g}$ の $2.5$ 個ぶん」と読み替えられました。$N(0,1)$ の上で $2.5$ はかなり外側。「$H_0$ が正しければ $\bar{X}$ がここまで重く出るのは珍しい」と言えそうです（実際の棄却判定は次回 4-4 で）。

EXAMPLE 2（標準化の御利益＝単位が消える）

同じデータを $\text{kg}$ で測り直したらどうなるでしょう。$\bar{x}=0.205\,\text{kg}$、$\mu_0=0.200\,\text{kg}$、$\sigma=0.010\,\text{kg}$、標準誤差 $=0.010/5=0.002\,\text{kg}$。検定統計量は $$z = \frac{0.205-0.200}{0.002} = \frac{0.005}{0.002} = 2.5$$

単位を変えても $z=2.5$ で不変です。分子と分母が同じ単位なので約分で消えるから。生のズレ（$5\,\text{g}$ なのか $0.005\,\text{kg}$ なのか）では比べようがありませんが、標準化した $z$ ならどんな単位・どんな問題でも同じ尺度で珍しさを測れる──これが検定統計量を作る最大の御利益です。

8. まとめ

第4章 4-3、ポイントを整理します。

測りたいもの：$H_0$ が正しいと仮定したとき、観測がどれだけ起こりにくいか（確率）
そのための工夫：母数が消えて分布が既知になる量＝検定統計量を作る
導出：$\bar{X}\sim N(\mu,\sigma^2/n)$ に $H_0:\mu=\mu_0$ を代入 → 標準化 → $Z=\dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1)$
一般原理：$\dfrac{(\text{推定量})-(\text{帰無値})}{\text{標準誤差}}$。分子でズレ、分母でばらつきの単位に直す
相手で分布が変わる：母平均→$z$／$t$、母分散→$\chi^2$、分散比→$F$。発想はすべて同じ
区間推定との対応：同じ式を $\mu$ で解けば推定、$\mu_0$ を代入すれば検定。表裏一体

次回 4-4 1標本：母平均のz検定・t検定では、今日作った $Z$（と $\sigma$ 未知版の $T$）を実際に使い、棄却域・$p$ 値の両アプローチで結論まで出す手順を、数値例で固めます。設計図はもう手の中にあります。あとは使うだけです。

さえ

検定統計量の正体、つかめたね！　「$H_0$ を代入 → 母数が消える → 標準化 → 既知の分布」。この流れと、「（推定量−帰無値）÷標準誤差」の設計図を覚えれば、$z$・$t$・$\chi^2$・$F$ がぜんぶ同じ家族に見えるよ。次回はいよいよ実戦、$z$ 検定と $t$ 検定で結論まで出すよ！