第4章 4-4 / 統計的仮説検定

1標本:母平均のz検定・t検定 — 棄却域とp値で結論まで

このページで学ぶこと

前回(4-3)で、検定統計量という道具が手に入りました。本ページはいよいよ実戦です。1つの標本から母平均 $\mu$ についての仮説を検定し、結論まで出しきります。

場合分けはたったひとつ。母分散 $\sigma^2$ が既知なら $z$ 検定未知なら $t$ 検定。あとは片側か両側かで棄却域の取り方が変わるだけです。判定のしかたには棄却域アプローチ$p$ 値アプローチの2つがありますが、両者は必ず同じ結論に至ります。$z$ 検定・$t$ 検定それぞれの数値例を、結論まで一気に追いましょう。

さえちゃん
さえ

いよいよ検定を「最後まで解く」回だよ! 迷ったらこの2択から。母分散がわかってる→$z$、わからない→$t$。これだけ。あとは「片側か両側か」で棄却ラインの引き方を決めるの。棄却域でも $p$ 値でも、ちゃんとやれば結論は一致するから安心してね。一緒に1問ずつ解ききろう!

1. 検定の手順(全体像)

個別の式に入る前に、1標本の母平均検定の流れを5ステップで俯瞰します。どの検定でもこの骨格は変わりません。

POINT(検定の5ステップ)

(1) 仮説を立てる:帰無仮説 $H_0:\mu=\mu_0$ と対立仮説 $H_1$(両側 $\mu\neq\mu_0$/片側 $\mu>\mu_0$ または $\mu<\mu_0$)。
(2) 有意水準 $\alpha$ を決める:ふつう $0.05$ や $0.01$。
(3) 検定統計量を計算する:分散既知なら $z$、未知なら $t$(4-3 の設計図)。
(4) 判定する:棄却域に入るか(棄却域アプローチ)、または $p$ 値と $\alpha$ を比べる($p$ 値アプローチ)。
(5) 結論を書く:「$H_0$ を棄却し $H_1$ を採択」または「$H_0$ を棄却できない」。

2. 母分散が既知のとき ─ z検定

母分散 $\sigma^2$(あるいは母標準偏差 $\sigma$)が分かっている場合、検定統計量は 4-3 で作った $z$ をそのまま使います。

FORMULA(z検定の統計量)

$H_0:\mu=\mu_0$ のもとで、 $$Z = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1)$$ 観測から計算した値 $z$ が、$N(0,1)$ の上でどれだけ外側に来るかで判定します。母集団が正規分布、または $n$ が大きく中心極限定理が効くこと、が前提です。

棄却域の取り方(片側・両側)

対立仮説の向きによって、$N(0,1)$ のどこを「棄却域」にするかが変わります。有意水準 $\alpha$ ぶんの確率を、両側なら左右に $\alpha/2$ ずつ、片側ならその向きの裾にまとめて $\alpha$ だけ取ります。

対立仮説 $H_1$棄却域($z$ 検定)$\alpha=0.05$ の臨界値
$\mu \neq \mu_0$(両側)$|z| \ge z_{\alpha/2}$$z_{0.025}=1.96$
$\mu > \mu_0$(右片側)$z \ge z_{\alpha}$$z_{0.05}=1.645$
$\mu < \mu_0$(左片側)$z \le -z_{\alpha}$$-z_{0.05}=-1.645$
両側検定 −z(α/2) +z(α/2) α/2 α/2 右片側検定 +z(α) α 両側は左右に α/2 ずつ、片側はその向きの裾に α をまとめて取る 統計量が塗った棄却域に入ったら H0 を棄却

棄却域(アクセント色)の取り方。両側は両裾に α/2 ずつ、片側は対立仮説の向きの裾に α をまとめる。臨界値が片側のほうが内側(小さい)になる。

POINT(片側と両側で臨界値が変わる)

同じ $\alpha=0.05$ でも、両側なら $1.96$、片側なら $1.645$。片側のほうが臨界値が内側(小さい)=棄却しやすいのは、$5\%$ を裾の片方に集中させているからです。どちらを使うかは対立仮説の立て方で決まります(4-2)。「増えたかどうか」だけ知りたいなら右片側、「変わったかどうか」なら両側です。

3. 棄却域アプローチと p 値アプローチ

統計量を計算したあと、判定のしかたは2通りあります。どちらも同じ結論になります。

POINT(2つのアプローチ)

棄却域アプローチ:先に臨界値(例:$1.96$)で棄却域を決め、統計量がそこに入るかを見る。「$|z|\ge 1.96$ なら棄却」。
$p$ 値アプローチ:統計量より外側の確率($p$ 値)を求め、$\alpha$ と比べる。「$p \le \alpha$ なら棄却」。$p$ 値は「$H_0$ が正しいとき、いま以上に極端な値が出る確率」(4-1)。
両者が一致するのは当然で、「統計量が臨界値より外」と「その外側確率 $p$ が $\alpha$ より小さい」は同じことを別の言葉で言っているだけだからです。両側検定では $p$ 値を両裾あわせて取る点に注意します。

4. 母分散が未知のとき ─ t検定

現実には母分散 $\sigma^2$ が分かっていることはまれです。そのときは $\sigma$ を標本から計算した不偏分散の平方根 $s$ で代用します。すると統計量は標準正規ではなく自由度 $n-1$ の $t$ 分布に従います(理由は 3-74-3 で見たとおり、分母の $s$ もゆらぐため裾が重くなる)。

FORMULA(t検定の統計量)

$H_0:\mu=\mu_0$ のもとで、 $$T = \frac{\bar{X}-\mu_0}{s/\sqrt{n}} \sim t_{n-1},\qquad s^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2$$ $z$ 検定との違いは2か所だけ。$\sigma \to s$(母標準偏差を不偏分散の平方根に)と、使う分布が $N(0,1) \to t_{n-1}$(臨界値を $t$ 分布表から自由度 $n-1$ で読む)。正規母集団であることが前提です。

棄却域の取り方は $z$ 検定と同じ発想で、臨界値を $t$ 分布表から読むだけです。両側なら $|t|\ge t_{\alpha/2,\,n-1}$、右片側なら $t\ge t_{\alpha,\,n-1}$、左片側なら $t\le -t_{\alpha,\,n-1}$。$t$ は正規より裾が重いので、臨界値は同じ $\alpha$ でも $z$ より外側(大きい)になります。

さえちゃん
さえ

試験で最初に見るのは「母分散 $\sigma^2$ が与えられてるか」だよ! 与えられてれば $z$、なければ手元のデータから $s$ を出して $t$。$t$ は自由度 $n-1$ を忘れずにね。あと、問題文の「増えたか?」「減ったか?」「変わったか?」で片側・両側を見抜くのも大事。ここを取り違えると臨界値ごと間違っちゃうから要注意!

5. 数値例 ─ z検定(両側)

EXAMPLE 1(z検定・両側・α=0.05)

ある製品の内容量は、長年の管理から母標準偏差 $\sigma=10\,\text{g}$ と分かっており、表示は「平均 $200\,\text{g}$」です。最近のロットから $n=25$ 個を無作為に測ると、標本平均 $\bar{x}=205\,\text{g}$ でした。内容量が表示と変わったかを有意水準 $5\%$ で検定します。

(1) 仮説:$H_0:\mu=200$、$H_1:\mu\neq 200$(「変わったか」なので両側)。
(2) 有意水準:$\alpha=0.05$。
(3) 統計量:標準誤差 $\dfrac{\sigma}{\sqrt{n}}=\dfrac{10}{\sqrt{25}}=2$ より $$z = \frac{205-200}{2} = 2.5$$

(4) 判定(棄却域):両側 $5\%$ の臨界値は $z_{0.025}=1.96$。$|z|=2.5 \ge 1.96$ なので棄却域に入る
(4') 判定($p$ 値):$p = 2\times P(Z \ge 2.5) = 2\times 0.00621 = 0.01242$。$p \approx 0.0124 \le 0.05$ なのでやはり棄却。両アプローチで一致。

(5) 結論:$H_0$ を棄却。「内容量は表示の $200\,\text{g}$ と有意に異なる($5\%$ 水準)」と結論します。$z>0$ なので、向きとしては重い側にズレています。

6. 数値例 ─ t検定(片側)

EXAMPLE 2(t検定・右片側・α=0.05)

ある工程の改良で「処理時間が長くなっていないか」を確かめます。従来の平均は $\mu_0=50\,\text{分}$。母分散は未知です。改良後に $n=10$ 回測ったところ、標本平均 $\bar{x}=53\,\text{分}$、不偏分散の平方根(標本標準偏差)$s=4\,\text{分}$ でした。処理時間は正規分布に従うとして、有意水準 $5\%$ で検定します。

(1) 仮説:$H_0:\mu=50$、$H_1:\mu>50$(「長くなっていないか」なので右片側)。
(2) 有意水準:$\alpha=0.05$。
(3) 統計量:自由度 $n-1=9$。標準誤差 $\dfrac{s}{\sqrt{n}}=\dfrac{4}{\sqrt{10}}\approx 1.2649$ より $$t = \frac{53-50}{4/\sqrt{10}} = \frac{3}{1.2649} \approx 2.372$$

(4) 判定(棄却域):右片側 $5\%$、自由度 $9$ の臨界値は $t_{0.05,\,9}=1.833$。$t \approx 2.372 \ge 1.833$ なので棄却域に入る
(4') 判定($p$ 値):$p = P(T_9 \ge 2.372) \approx 0.0209$。$p \approx 0.021 \le 0.05$ なのでやはり棄却
(5) 結論:$H_0$ を棄却。「処理時間は従来より有意に長くなった($5\%$ 水準)」と結論します。

POINT(区間推定とのつながり)

EXAMPLE 1 を区間推定で見ると、$95\%$ 信頼区間は $205\pm 1.96\times 2 = [201.08,\ 208.92]$。この区間に帰無値 $\mu_0=200$ が含まれていません。これは「両側 $5\%$ 検定で棄却」と完全に一致します(4-3 §6 の表裏一体)。両側検定に迷ったら、信頼区間に $\mu_0$ が入るかで確かめる手もあります。

7. 結論と使いどころ

POINT(1標本・母平均の検定の早見)
  • 母分散 $\sigma^2$ 既知 → $z$ 検定:$Z=\dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1)$
  • 母分散 $\sigma^2$ 未知 → $t$ 検定:$T=\dfrac{\bar{X}-\mu_0}{s/\sqrt{n}}\sim t_{n-1}$
  • 両側($\mu\neq\mu_0$)→ 棄却域は両裾に $\alpha/2$、$p$ 値は両裾合算
  • 片側($\mu>\mu_0$ または $\mu<\mu_0$)→ その向きの裾に $\alpha$、臨界値は内側
  • $n$ 大(おおむね $30$ 以上)では $t$ と $z$ がほぼ一致。迷ったら $t$ が安全

これで「1つの標本から母平均を検定する」基本がそろいました。棄却域でも $p$ 値でも結論は同じ。実務では $p$ 値を併記するのが主流ですが、試験では棄却域・$p$ 値どちらで問われても対応できるようにしておきましょう。

8. まとめ

第4章 4-4、ポイントを整理します。

次回 4-5 1標本:母分散・母比率の検定 では、検定の相手を平均から「ばらつき(母分散)」と「割合(母比率)」へ広げます。母分散には $\chi^2$ 分布、母比率には大標本の正規近似が登場しますが、設計図(4-3)は今日とまったく同じです。

さえちゃん
さえ

母平均の検定、結論まで出せたね! 「分散既知なら $z$、未知なら $t$」「片側か両側か」「棄却域でも $p$ 値でも結論は同じ」──この3点セットを体に入れれば、1標本の母平均はもう怖くないよ。次は相手が「ばらつき」と「割合」になるけど、作り方の設計図は今日とおんなじ。安心してついてきてね!