独立性の検定 — 分割表で2変数の独立を調べる
1-12 クロス集計表で、2つの質的変数のクロス表を眺めて「関連がありそう/なさそう」と感覚的に判断しました。本ページでは、その「関連」を統計的に判定します。これが独立性の検定です。本編の最終記事、いよいよ総仕上げです。
使う統計量は前回 6-3 適合度の検定とまったく同じ $\displaystyle \chi^2=\sum_i\sum_j\frac{(O_{ij}-E_{ij})^2}{E_{ij}}$ の形。違うのは期待度数 $E_{ij}$ の作り方だけです。「もし2変数が独立だったら、各マスは何個になるはずか」を計算し、観測度数とのズレを $\chi^2$ で測ります。期待度数の式 $E_{ij}=\dfrac{(\text{行和}_i)\times(\text{列和}_j)}{\text{総和}}$ がどこから来るのか、独立の定義からきちんと導いていきましょう。
独立性の検定は、6-3 の適合度検定の「分割表バージョン」だよ。$\chi^2$ の式は同じ。ポイントは期待度数を「行和 × 列和 ÷ 総和」で作ること。これが「2変数が独立だったらこうなるはず」っていう理論値なんだ。式の意味がわかれば暗記いらずだよ!
1. 何を検定するのか(直感)
たとえば「ある薬を投与したかどうか(処置あり/なし)」と「回復したかどうか(回復/非回復)」という2つの質的変数があるとします。これらを分割表(クロス集計表)にまとめ、薬と回復に関連があるか=独立でないかを調べたい。これが独立性の検定の典型場面です。
独立性の検定とは、分割表でまとめた2つの質的変数が独立かどうかを調べる検定です。仮説は次のように置きます。
・帰無仮説 $H_0$:2つの変数は独立である(関連がない)
・対立仮説 $H_1$:2つの変数は独立でない(関連がある)
ここで $r$ 行 $c$ 列の分割表を考え、第 $i$ 行・第 $j$ 列のマス(セル)の観測度数を $O_{ij}$ と書きます。行ごとの合計(行和)、列ごとの合計(列和)、全体の合計(総和 $n$)を周辺度数と呼ぶのは、1-12で見たとおりです。検定の戦略は適合度検定と同じ。「もし独立なら各セルは何個になるはずか」という期待度数 $E_{ij}$ を作り、観測とのズレを $\chi^2$ で測ります。
2. 期待度数 $E_{ij}$ の導出★
では「独立だったときの期待度数」を、独立の定義から導きます。ここが本ページの山場です。
ステップ1:独立なら同時確率は積
2つの事象が独立であるとは、同時に起こる確率が、それぞれの確率の積に等しいことでした(2-2 乗法定理)。第 $i$ 行に入る確率を $p_{i\cdot}$、第 $j$ 列に入る確率を $p_{\cdot j}$ とすると、独立のもとでセル $(i,j)$ に入る確率は
$$ \begin{aligned} p_{ij} &= p_{i\cdot}\times p_{\cdot j} &&\text{(独立なら同時確率は周辺確率の積)}\\[2pt] E_{ij} &= n\, p_{ij} = n\, p_{i\cdot}\, p_{\cdot j} &&\text{(期待度数は総数 } n \text{ と確率の積)} \end{aligned} $$ ここで行・列の確率は周辺度数から推定します。第 $i$ 行の確率は「行和 $\div$ 総和」、第 $j$ 列の確率は「列和 $\div$ 総和」と見積もれるので、 $$ \begin{aligned} p_{i\cdot} &= \frac{(\text{行和}_i)}{n}, \qquad p_{\cdot j} = \frac{(\text{列和}_j)}{n}\\[6pt] E_{ij} &= n\times \frac{(\text{行和}_i)}{n}\times \frac{(\text{列和}_j)}{n} = \frac{(\text{行和}_i)\times(\text{列和}_j)}{n} \end{aligned} $$
独立を仮定したときの期待度数: $$E_{ij} = \frac{(\text{行和}_i)\times(\text{列和}_j)}{(\text{総和})}$$ 各セルの期待度数は「そのセルの属する行の合計」と「列の合計」を掛けて、総和で割るだけ。覚えやすい形ですが、出どころは独立なら同時確率は周辺確率の積という定義です。
この式が「丸暗記の公式」ではなく、独立の定義から自然に出てくることが見えたでしょうか。$\sum p_i = 1$ や周辺確率の考え方は1-12そのもの。期待度数 $E_{ij}$ は「行の比率と列の比率が独立に効いた、理想の分割表」を表しているのです。
3. 検定統計量と自由度
期待度数さえできれば、あとは適合度検定とまったく同じです。観測度数とのズレを「標準化したズレの二乗」として全セル分足し合わせます。
独立性検定の検定統計量: $$\chi^2 = \sum_{i=1}^{r}\sum_{j=1}^{c} \frac{(O_{ij}-E_{ij})^2}{E_{ij}}$$ $H_0$(独立)が正しいとき、この統計量は近似的に自由度 $(r-1)(c-1)$ の $\chi^2$ 分布に従います。
自由度がなぜ $(r-1)(c-1)$ になるのかも、適合度検定の考え方の延長です。期待度数は行和・列和(周辺度数)をデータから決めて作るので、その分の縛りが入ります。$r\times c$ 個のセルのうち、行和を固定すると各行で自由に動けるのは $c-1$ 個、列和も固定すると行方向でも $r-1$ 行ぶんだけ、というように縛りが効き、結局自由に動けるのは $(r-1)\times(c-1)$ 個ぶん、と理解できます。
$$(\text{自由度}) = (r-1)(c-1)$$ $r$ は行数、$c$ は列数。たとえば $2\times2$ 表なら $(2-1)(2-1)=1$、$2\times3$ 表なら $(2-1)(3-1)=2$、$3\times3$ 表なら $(3-1)(3-1)=4$ です。
4. 数値例:$2\times2$ 表
判定はやはり右片側です。$\chi^2$ がその自由度の上側 $\alpha$ 点 $\chi^2_\alpha$ を超えたら $H_0$(独立)を棄却し、「関連あり」と結論します。
ある治療法の効果を調べ、$140$ 人について「処置あり/なし」と「回復/非回復」を集計したところ、次の分割表になりました。処置と回復は独立か、有意水準 $5\%$ で検定します。
| 観測 $O_{ij}$ | 回復 | 非回復 | 行和 |
|---|---|---|---|
| 処置あり | 40 | 20 | 60 |
| 処置なし | 30 | 50 | 80 |
| 列和 | 70 | 70 | 140 |
期待度数は $E_{ij}=\dfrac{(\text{行和}_i)\times(\text{列和}_j)}{140}$ で計算します。たとえば「処置あり・回復」は $E_{11}=\dfrac{60\times70}{140}=30$。同様に全セルを埋めます。
| 期待 $E_{ij}$ | 回復 | 非回復 |
|---|---|---|
| 処置あり | 30 | 30 |
| 処置なし | 40 | 40 |
各セルの寄与 $\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$ を足し合わせます。 $$ \begin{aligned} \chi^2 &= \frac{(40-30)^2}{30}+\frac{(20-30)^2}{30}+\frac{(30-40)^2}{40}+\frac{(50-40)^2}{40}\\[2pt] &= \frac{100}{30}+\frac{100}{30}+\frac{100}{40}+\frac{100}{40}\\[2pt] &= 3.333+3.333+2.5+2.5 = 11.667 \end{aligned} $$ 自由度は $(2-1)(2-1)=1$。$\chi^2$ 分布の上側 $5\%$ 点は $\chi^2_{0.05}(1)=3.841$ です。
$11.667 > 3.841$ なので棄却域に入り、$H_0$ を棄却します($p$ 値 $\approx 0.0006$)。すなわち「処置と回復には関連がある(独立でない)」と結論できます。観測表で「処置ありは回復が多い」という見た目の傾向が、偶然では説明できない、ということです。
自由度1のχ²分布。観測値11.67は棄却域(3.84より右)に深く入り、H₀(独立)は棄却される
5. 数値例:$2\times3$ 表
列が増えても手順はまったく同じです。今度は $2\times3$ 表で確かめます。
$250$ 人について「性別」と「学習しやすい時間帯(朝/昼/夜)」を集計しました。性別と時間帯は独立か、有意水準 $5\%$ で検定します。
| 観測 $O_{ij}$ | 朝 | 昼 | 夜 | 行和 |
|---|---|---|---|---|
| 男性 | 75 | 48 | 27 | 150 |
| 女性 | 25 | 32 | 43 | 100 |
| 列和 | 100 | 80 | 70 | 250 |
期待度数は $E_{ij}=\dfrac{(\text{行和}_i)\times(\text{列和}_j)}{250}$。たとえば $E_{11}=\dfrac{150\times100}{250}=60$、$E_{12}=\dfrac{150\times80}{250}=48$ という具合です。
| 期待 $E_{ij}$ | 朝 | 昼 | 夜 |
|---|---|---|---|
| 男性 | 60 | 48 | 42 |
| 女性 | 40 | 32 | 28 |
各セルの寄与を足し合わせます($E=48$ の列はズレが $0$ なので寄与もゼロ)。 $$ \begin{aligned} \chi^2 &= \frac{(75-60)^2}{60}+0+\frac{(27-42)^2}{42}+\frac{(25-40)^2}{40}+0+\frac{(43-28)^2}{28}\\[2pt] &= 3.75+0+5.357+5.625+0+8.036 = 22.768 \end{aligned} $$ 自由度は $(2-1)(3-1)=2$。上側 $5\%$ 点は $\chi^2_{0.05}(2)=5.991$ です。
$22.768 > 5.991$ なので$H_0$ を棄却します($p$ 値 $\approx 0.00001$)。性別と学習しやすい時間帯には関連がある、と結論できます。
6-3 と 6-4 の違いは一点だけ! 適合度は期待度数を「理論の確率 × $n$」で作る。独立性は「行和 × 列和 ÷ 総和」で作る。あとの $\chi^2$ の足し算も、右片側で上側 $\alpha$ 点と比べるのも、ぜんぶ同じ。期待度数の作り方さえ押さえれば、両方マスターしたも同然だよ!
6. 関連の「強さ」:クラメールの連関係数 $V$
独立性の検定で「関連あり」と判定できても、$\chi^2$ の値そのものは関連の強さを直接は表しません。$\chi^2$ はサンプルサイズ $n$ が大きいほど大きくなりやすいからです。そこで、関連の強さを $0$〜$1$ の物差しで測る指標がクラメールの連関係数 $V$ です。
$$V = \sqrt{\frac{\chi^2}{n\,(\min(r,c)-1)}}$$ ここで $\min(r,c)$ は行数 $r$ と列数 $c$ の小さいほう。$V$ は $0$(まったく無関連)から $1$(完全な関連)の値をとり、相関係数の質的変数版のように関連の強さを表します。
EXAMPLE 1($2\times2$、$\chi^2=11.667$、$n=140$)で計算すると、$\min(r,c)=2$ なので $$V=\sqrt{\frac{11.667}{140\times(2-1)}}=\sqrt{0.0833}\approx 0.29$$ EXAMPLE 2($2\times3$、$\chi^2=22.768$、$n=250$)でも $\min(r,c)=2$ なので $V=\sqrt{\dfrac{22.768}{250\times1}}\approx 0.30$ です。どちらも「中程度の関連」といえる水準です。検定で関連の有無を判定し、$V$ で関連の強さを補足する──この2段構えが実務での定番です。
まとめ
第6章 6-4、ポイントを整理します。
- 目的:分割表で2つの質的変数が独立かを検定。$H_0$:2変数は独立
- 期待度数:$E_{ij}=\dfrac{(\text{行和}_i)\times(\text{列和}_j)}{(\text{総和})}$。独立なら同時確率は積、から導く
- 統計量:$\chi^2=\sum_i\sum_j \dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$(適合度検定と同じ形)
- 自由度:$(r-1)(c-1)$($r$=行数、$c$=列数)
- 判定:右片側。$\chi^2 > \chi^2_\alpha\big((r-1)(c-1)\big)$ なら $H_0$ を棄却=関連あり
- 関連の強さ:クラメールの連関係数 $V=\sqrt{\dfrac{\chi^2}{n(\min(r,c)-1)}}$($0$〜$1$)
これで本編全6章が完結です。記述統計から確率、推定・検定、回帰、そして $\chi^2$ 検定まで──「公式の暗記」ではなく「なぜその式になるのか」を一歩ずつ追ってきました。$\chi^2$ 検定の期待度数も、独立の定義から導けば自然な式でしたね。ここまで積み上げた導出の力は、過去問演習でもきっと効いてきます。統計検定2級トップから、気になる章をいつでも復習してください。本当におつかれさまでした!
ついに本編コンプリート、おめでとう! $\chi^2$ 検定の「期待度数を作って、ズレを二乗して足す」流れ、もう自分の手で書けるよね。あとは過去問でこの流れを体に染み込ませよう。わからなくなったらいつでも各章に戻ってきてね。あなたの合格、心から応援してるよ!