巻末資料 / 付録A

付録A 確率分布表の引き方 — 標準正規・t・χ²・F

このページで学ぶこと

統計検定2級の試験では、標準正規分布・$t$ 分布・$\chi^2$ 分布・$F$ 分布の数値表が問題冊子に配布されます。だから値そのものを暗記する必要はありません。大事なのは「どの行・どの列を見れば、いま欲しい値が出てくるか」を迷わず判断できることです。

本付録では、4つの分布表それぞれについて「縮小版の抜粋表」を載せ、自由度と上側確率(または累積確率)をどう手がかりにするかを、検定・推定の具体的な場面と結びつけて整理します。表の構造さえ頭に入れば、本番では「指で押さえて交点を読む」だけ。落ち着いて引けるよう、ここで型を作っておきましょう。

さえちゃん
さえ

分布表って、最初は数字がびっしりで圧倒されるよね。でも大丈夫! 表は「行と列の交点を読むだけ」のシンプルな道具なんだ。コツは「いま欲しいのは上側の確率? それとも下からの累積?」をはっきりさせること。試験では表が配られるから、引き方さえ体に入れば怖くないよ!

1. 標準正規分布表 ─ 2つの形式に注意

最初は標準正規分布 $N(0,1)$ の表です。横軸の値($z$ 値)に対して確率を返してくれる表ですが、ここで最初の落とし穴があります。標準正規分布表には「上側確率」型と「下側累積確率」型の2つの形式があり、本によって違うのです。同じ $z=1.96$ でも、表が返す数字が $0.025$ なのか $0.975$ なのかが変わります。

POINT

標準正規分布表の2形式──

  • 上側確率型:与えた $z$ より右側の面積 $P(Z \ge z)$ を返す。$z=1.96$ なら $0.025$。
  • 下側累積型:与えた $z$ より左側の面積 $P(Z \le z)$ を返す。$z=1.96$ なら $0.975$。

2つは $P(Z \le z) = 1 - P(Z \ge z)$ という関係で結ばれます。どちらの表かは、表の見出しと、そえられている小さな分布の絵(左右どちら側が塗られているか)で見分けるのが確実です。迷ったら $z=0$ を引いてみて、上側確率型なら $0.5$、下側累積型でも $0.5$ と同じですが、$z=1.96$ を引けば $0.025$(上側型)か $0.975$(下側型)かで一発で区別できます。

ここでは説明のしやすさから上側確率型(右側の面積を返す形式)を例に進めます。$z$ の値を「整数部・小数第1位」で行を、「小数第2位」で列を選び、その交点を読む、という二次元の引き方が一般的です。下に抜粋を示します。

$z$.00.05.06
$0.0$$0.5000$$0.4801$$0.4761$
$1.0$$0.1587$$0.1469$$0.1446$
$1.6$$0.0548$$0.0495$$0.0485$
$1.9$$0.0287$$0.0256$$0.0250$
$2.5$$0.0062$$0.0054$$0.0052$

抜粋:上側確率 $P(Z \ge z)$ の表(一部)。行=$z$ の小数第1位まで、列=小数第2位

EXAMPLE 1(z=1.96 を引く)

$z=1.96$ の上側確率を読みます。行「$1.9$」と列「.06」の交点を見ると $0.0250$。つまり $P(Z \ge 1.96) = 0.025$ です。これは右側に $2.5\%$ が残るということで、両側だと $5\%$。だから $z_{0.025}=1.96$ は信頼度 $95\%$ の区間でおなじみの値になります。

逆に「上側 $5\%$ となる $z$ は?」と問われたら、表の本体から $0.05$ に最も近いセルを探します。行「$1.6$」列「.05」が $0.0495$(ほぼ $0.05$)。よって $z_{0.05} \approx 1.645$。区間推定・片側検定で頻出です。

標準正規分布は左右対称なので、表は $z \ge 0$ の側だけ載っているのがふつうです。負の $z$ が必要なときは対称性 $P(Z \le -z) = P(Z \ge z)$ を使えば、同じ表で間に合います。

z = 1.96 N(0,1) 上側 = 0.025

標準正規分布の上側確率:z=1.96 より右側の面積(塗った部分)がちょうど 0.025

2. t分布表 ─ 行=自由度、列=上側確率

$t$ 分布表は、標準正規と構造が少し違います。$t$ 分布は自由度ごとに形が変わるので、表は二次元になります──行が自由度列が上側確率です。表の本体には、その自由度・その上側確率に対応する上側確率点 $t$ の値が入ります。

POINT

$t$ 分布表の引き方は「自由度の行 × 上側確率の列」。記号で書くと、自由度 $n-1$・上側確率 $\alpha$ の点を $t_{\alpha,\,n-1}$ と表します。たとえば標本サイズ $n=10$(自由度 $9$)で両側 $5\%$ の検定なら、片側 $\alpha=0.025$ の列を見て $t_{0.025,\,9}$ を読みます。

自由度 \ 上側確率$0.05$$0.025$$0.01$
$5$$2.015$$2.571$$3.365$
$9$$1.833$$2.262$$2.821$
$10$$1.812$$2.228$$2.764$
$15$$1.753$$2.131$$2.602$
$20$$1.725$$2.086$$2.528$

抜粋:$t$ 分布の上側確率点 $t_{\alpha,\,k}$(行=自由度 $k$、列=上側確率 $\alpha$)

EXAMPLE 2(母平均のt検定で引く)

母分散未知の正規母集団から $n=10$ 個を取り、母平均の $95\%$ 信頼区間を作る、あるいは両側 $5\%$ で $t$ 検定をするとします。使う点はどこでしょう。

自由度は $n-1 = 9$。両側 $5\%$ なので片側に $2.5\%$ ずつ、つまり上側確率 $\alpha=0.025$ の列。行「$9$」と列「$0.025$」の交点で $t_{0.025,\,9} = 2.262$。信頼区間なら $\bar{X} \pm 2.262 \times \dfrac{s}{\sqrt{n}}$、検定なら $|t| > 2.262$ で帰無仮説を棄却、という具合に使います。

表の一番下には「$\infty$(無限大)」の行が用意されていることが多く、その値は標準正規分布の $z$ と一致します(自由度が大きいほど $t$ 分布は $N(0,1)$ に近づくため)。たとえば $t_{0.025,\,\infty} = 1.960$。自由度が表にない大きな値のときは、この行で近似すれば十分です。

3. χ²分布表 ─ 両側は左右の2点を引く

$\chi^2$ 分布表も「行=自由度、列=上側確率」の構造です。ただし $\chi^2$ 分布は左右非対称($0$ 以上で右に裾を引く)なので、両側を扱うときに正規や $t$ とは勝手が違います。両側 $5\%$ の区間なら、左の点と右の点を別々に引かねばなりません。

POINT

$\chi^2$ 分布の点は $\chi^2_{\alpha,\,k}$(自由度 $k$、上側確率 $\alpha$)と書きます。$P(\chi^2 \ge \chi^2_{\alpha,\,k}) = \alpha$ です。両側 $5\%$(信頼度 $95\%$)の区間では、左右で確率が偏らないように $$\chi^2_{0.975,\,k} \ \ \text{(左の点)} \qquad \chi^2_{0.025,\,k} \ \ \text{(右の点)}$$ の2点を引きます。左の点は「上側確率 $0.975$」、つまり下側に $2.5\%$ しか残らない小さな値になる点に注意してください。

自由度 \ 上側確率$0.975$$0.95$$0.05$$0.025$
$5$$0.831$$1.145$$11.07$$12.83$
$10$$3.247$$3.940$$18.31$$20.48$
$15$$6.262$$7.261$$25.00$$27.49$
$20$$9.591$$10.85$$31.41$$34.17$

抜粋:$\chi^2$ 分布の上側確率点 $\chi^2_{\alpha,\,k}$。左の点($0.975, 0.95$)は小さく、右の点($0.05, 0.025$)は大きい

EXAMPLE 3(母分散の区間推定で引く)

標本サイズ $n=11$(自由度 $10$)で母分散の $95\%$ 信頼区間を作るとします。母分散の区間推定では統計量 $\dfrac{(n-1)S^2}{\sigma^2}$ が自由度 $n-1$ の $\chi^2$ 分布に従うので、両側の2点が要ります。

行「$10$」を見て、右の点 $\chi^2_{0.025,\,10} = 20.48$、左の点 $\chi^2_{0.975,\,10} = 3.247$。区間は $$\frac{(n-1)S^2}{\chi^2_{0.025,\,10}} \ \le\ \sigma^2\ \le\ \frac{(n-1)S^2}{\chi^2_{0.975,\,10}}$$ となります。大きい点で割ると下限、小さい点で割ると上限になる(割る数が小さいほど商は大きい)点が、最初は混乱しやすいので意識しておきましょう。

一方、適合度検定や独立性検定(第6章)は右片側だけを使います。ズレが大きいほど $\chi^2$ 統計量は大きくなるので、棄却域は右の裾だけ。たとえば自由度 $10$・有意水準 $5\%$ なら $\chi^2_{0.05,\,10} = 18.31$ を読み、統計量がこれを超えたら棄却、という片側の使い方になります。

左の点 右の点 両側区間は左右2点ではさむ(χ²は非対称)

χ²分布の両側:左の点と右の点を別々に引く。適合度・独立性の検定は右の点だけを使う

4. F分布表 ─ 分子・分母の自由度、確率ごとに別表

最後は $F$ 分布表です。これが4つの中でいちばん引き方が複雑です。$F$ 分布は2つの自由度(分子の自由度 $k_1$ と分母の自由度 $k_2$)で形が決まるので、表は本来三次元。そこで実際の表は、上側確率 $\alpha$ ごとに1枚ずつの別表に分け、各表を「列=分子の自由度 $k_1$、行=分母の自由度 $k_2$」の二次元にしています。

POINT

$F$ 分布の点は $F_{\alpha}(k_1, k_2)$ と書きます(上側確率 $\alpha$、分子の自由度 $k_1$、分母の自由度 $k_2$)。$P\big(F \ge F_{\alpha}(k_1,k_2)\big) = \alpha$ です。引くときの手順は──(1) まず使う上側確率 $\alpha$ の表($\alpha=0.05$ 用、$0.025$ 用…)を選ぶ。(2) その表で列に $k_1$、行に $k_2$ を取り、交点を読む。分子と分母を取り違えると別の値になるので、順番は厳守です。

$k_2$ \ $k_1$$1$$2$$3$$4$$5$
$10$$4.96$$4.10$$3.71$$3.48$$3.33$
$12$$4.75$$3.89$$3.49$$3.26$$3.11$
$15$$4.54$$3.68$$3.29$$3.06$$2.90$
$20$$4.35$$3.49$$3.10$$2.87$$2.71$

抜粋:上側 $5\%$ 点 $F_{0.05}(k_1, k_2)$ の表(列=分子の自由度 $k_1$、行=分母の自由度 $k_2$)。上側確率が違えば別の表になる

EXAMPLE 4(分散分析・分散比で引く)

1元配置分散分析で、群間の自由度(分子)が $3$、群内(残差)の自由度(分母)が $12$、有意水準 $5\%$ とします。棄却の基準となる $F$ の値はどこでしょう。

まず上側 $5\%$ 用の表を選びます。次に列「$k_1=3$」、行「$k_2=12$」の交点を読むと $F_{0.05}(3, 12) = 3.49$。計算した $F$ 比がこれを超えたら、群の効果は有意(帰無仮説を棄却)と判断します。もし分子と分母を逆に $F_{0.05}(12, 3)$ と引いてしまうと、まったく別の大きな値(約 $8.7$)になってしまうので、「分子が先、分母が後」を必ず確認しましょう。

$F$ 分布は分散の比の検定や分散分析(第5章)で使い、$\chi^2$ と同じく右に裾を引く非対称分布です。分散分析や分散比の片側検定では右の裾だけを使うのがふつうなので、上側確率の表を1枚引けば足ります。両側の分散比検定では、$\alpha/2$ 用の表を使い、必要なら $F_{1-\alpha/2}(k_1,k_2) = 1/F_{\alpha/2}(k_2,k_1)$ という関係で左の点を出します(分子・分母を入れ替えて逆数を取る)。

さえちゃん
さえ

4つの表、引き方の「軸」を整理しよう! 標準正規は$z$ から確率(上側か下側かに注意)、$t$ は自由度×上側確率、$\chi^2$ も自由度×上側確率だけど両側は左右2点、$F$ は確率ごとの別表で分子×分母の自由度。$F$ は分子と分母の順番がいちばんの落とし穴だよ!

5. まとめて使いこなす ─ どの検定でどの表か

最後に、本編で学んだ主な検定・推定が、どの分布表のどこを見るのかを一望できる形に整理します。試験で「この場面はどの表?」と迷ったとき、ここに戻ってこられるようにしておきましょう。

分布表の構造記号主な場面
標準正規$z$ → 確率(上側 or 下側)$z_{\alpha}$母分散既知の母平均、母比率、大標本
$t$ 分布行=自由度、列=上側確率$t_{\alpha,\,n-1}$母分散未知の母平均、回帰係数の検定
$\chi^2$ 分布行=自由度、列=上側確率(両側は左右2点)$\chi^2_{\alpha,\,k}$母分散、適合度・独立性の検定
$F$ 分布確率ごとの別表、列=分子・行=分母の自由度$F_{\alpha}(k_1,k_2)$分散の比、分散分析、回帰の有意性
POINT

表を引くときの共通の合言葉は「自由度と確率を先に決めてから、交点を読む」です。手順は──(1) どの分布か(統計量の形から判断)、(2) 自由度はいくつか、(3) 片側か両側か、上側確率 $\alpha$ はいくつか。この3つさえ確定すれば、あとは表の上を指でたどって交点を読むだけ。値の暗記ではなく、この手順を体に入れておくのが本番でいちばん効きます。

まとめ

付録A、ポイントを整理します。

数表の引き方が固まれば、本編で導いた検定統計量・信頼区間の式に、いよいよ実際の数字を入れられます。次の 付録B Rの使い方 では、こうした計算をコンピュータに任せる方法を紹介します(試験範囲外ですが、出力の読み取りは本編とつながります)。

さえちゃん
さえ

分布表の引き方、つかめたかな? 「自由度と確率を決めてから交点を読む」が合言葉だよ。本番では表が配られるから、引く手順さえ身についていれば落ち着いて解けるはず。$t_{0.025,9}=2.262$ みたいに、自分で表を一度引いてみると感覚が定着するよ!