検出力・検出力関数
4-2 で、差を見抜く力検出力 $1-\beta$ を学びました。あのときは「真の値 $\mu_1$ がこの1点だったら検出力はいくつ」という1点だけの話でした。でも本当の値は、$\mu_1$ かもしれないし、それより手前かもしれないし、ずっと遠いかもしれない。
そこで今回は、検出力を「真のパラメータ $\theta$ を動かしたときに、棄却される確率がどう変わるか」という関数として眺めます。これが検出力関数 $\pi(\theta)$ です。横軸に $\theta$、縦軸に検出力をとった検出力曲線を1枚描けば、有意水準・効果量・標本サイズ $n$ が検出力にどう効くかが一望できます。最後は「検出力を確保するには $n$ をいくつにすればいい?」という標本サイズ設計までつなげましょう。
前回の検出力は「真の値が1点だけ」の話だったよね。でも実際は真の値がどこにあるかわからない。だから検出力を「真のパラメータ $\theta$ の関数」として見ちゃおう、というのが今日のテーマ! 1本の曲線にすると、$\alpha$・差の大きさ・$n$ のぜんぶが見えてくるよ。
1. 検出力 $1-\beta$ の復習
まず 4-2 の要点を1行で。検定には2種類の誤りがありました。本当は $H_0$ が正しいのに棄却してしまう第1種の誤り(確率 $\alpha$)と、本当は差があるのに見逃す第2種の誤り(確率 $\beta$)です。この $\beta$ の裏返しが検出力でした。
$$1 - \beta = P(\,H_0 \text{ を棄却} \mid H_1 \text{ が正しい}\,)$$ 検出力(power)は「本当に差があるとき、それをちゃんと差ありと見抜ける確率」。検定の目の良さを表します。
ここで大事な視点。$\alpha$ は「$H_0$ が正しい」という1つの状況での誤り確率なので、ひとつの数に決まります。ところが検出力のほうは、「$H_1$ が正しい」と言っても真の値がどこかでガラッと変わります。真の値が帰無値のすぐ隣なら見抜きにくい(検出力は低い)、うんと離れていれば楽勝(検出力は高い)。つまり検出力は1つの数ではなく、真の値しだいで変わる量なのです。だったら関数として扱うのが自然ですね。
2. 検出力関数 $\pi(\theta)$ という見方
そこで、検定の棄却ルールはそのまま固定しておいて、真のパラメータ $\theta$ だけを動かすことを考えます。$\theta$ がいろいろな値を取るとき、「$H_0$ を棄却する確率」を $\theta$ の関数とみなしたものが検出力関数です。
$$\pi(\theta) = P(\,H_0 \text{ を棄却} \mid \theta\,)$$ 検出力関数(power function) $\pi(\theta)$ とは、真のパラメータが $\theta$ だったときに $H_0$ を棄却する確率を、$\theta$ の関数として表したものです。母平均の検定なら $\theta=\mu$ にあたります。
この1本の関数が、$\alpha$ も $\beta$ も検出力もぜんぶ飲み込んでいるのがポイントです。$\theta$ を帰無値に合わせれば $\pi$ は第1種の誤りの確率(=$\alpha$)を返し、$\theta$ を対立側のどこかに合わせれば $\pi$ はそこでの検出力(=$1-\beta$)を返します。場合分けして別々に覚えていた量が、1つの関数の読みどころが違うだけだった、というわけです。
検出力関数 $\pi(\theta)$ の2つの読みどころ。
① $\theta$ が帰無値 $\theta_0$ のとき:$\pi(\theta_0)=\alpha$。これは第1種の誤りの確率。検定の設計では、ここがちょうど決めた有意水準になるように棄却域を作ります。
② $\theta$ が対立側の値のとき:$\pi(\theta)=1-\beta$。これはその $\theta$ での検出力。$\theta$ が $\theta_0$ から離れるほど大きくなります。
3. 検出力関数を式で書く
具体的に、母平均の片側検定で $\pi(\theta)$ を書き下してみます。設定は 4-2 と同じで、母標準偏差 $\sigma$ は既知、$H_0:\mu=\mu_0$、$H_1:\mu>\mu_0$ の右片側とします。
棄却ルール
標本平均 $\bar{X}$ は、真の平均が $\mu$ のとき $\bar{X}\sim N\!\left(\mu,\ \dfrac{\sigma^2}{n}\right)$ にしたがいます(標準誤差は $\sigma/\sqrt{n}$)。有意水準 $\alpha$ の右片側検定では、標準正規の上側 $\alpha$ 点 $z_\alpha$ を使って、棄却の境界を次のように置きます。
棄却の境界となる標本平均 $c$: $$c = \mu_0 + z_\alpha\,\frac{\sigma}{\sqrt{n}}$$ $\bar{X} > c$ なら $H_0$ を棄却します。$z_\alpha$ は標準正規分布の上側 $\alpha$ 点(片側 $\alpha=0.05$ なら $z_\alpha=1.645$)。
真の値が $\mu$ のときに棄却される確率
真の平均が $\mu$ のとき、$\bar{X}>c$ となる確率が検出力関数 $\pi(\mu)$ です。$\bar{X}\sim N(\mu,\sigma^2/n)$ を標準化して求めます。
$$ \begin{aligned} \pi(\mu) &= P(\bar{X} > c \mid \mu) &&\text{(棄却される確率)}\\[2pt] &= P\!\left(\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} > \frac{c-\mu}{\sigma/\sqrt{n}}\right) &&\text{(両辺を標準化)}\\[2pt] &= 1 - \Phi\!\left(\frac{c-\mu}{\sigma/\sqrt{n}}\right) &&\text{(}\Phi\text{ は標準正規の分布関数)}\\[2pt] &= 1 - \Phi\!\left(z_\alpha - \frac{\mu-\mu_0}{\sigma/\sqrt{n}}\right) &&\text{(}c=\mu_0+z_\alpha\sigma/\sqrt{n}\text{ を代入)} \end{aligned} $$
最後の式の中に出てくる $\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}$ が主役です。これは「真の値が帰無値からどれだけ離れているか」を標準誤差で測った量。この値が大きいほど $\Phi$ の中身は小さくなり、$\pi(\mu)$ は1に近づきます。式の形から、検出力を決める要素がそのまま読み取れますね。
$\mu=\mu_0$ を代入すると $\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}=0$ なので $\pi(\mu_0)=1-\Phi(z_\alpha)=\alpha$。ちゃんと帰無値で検出力関数が $\alpha$ を返します。$\mu$ が $\mu_0$ から大きくなるほど $\pi(\mu)$ は単調に増えて1へ近づき、逆に $\mu<\mu_0$ 側では $\alpha$ より小さくなります(この向きの片側検定では、間違った向きの差は拾えないからです)。
4. 検出力曲線を描く
いよいよ検出力関数をグラフにします。横軸に真の平均 $\theta=\mu$、縦軸に棄却確率 $\pi(\theta)$ をとった曲線が検出力曲線です。設定は $\mu_0=100$、$\sigma=15$、$n=25$、片側 $\alpha=0.05$。標準誤差は $\sigma/\sqrt{n}=3$ になります。
横軸=真の平均 $\theta=\mu$、縦軸=棄却確率 $\pi(\theta)$。帰無値 $\mu_0=100$ では $\pi=\alpha=0.05$、$\mu$ が離れるほど $\pi$ は単調に1へ近づく。$\mu=108$ での高さ $0.85$ がそこでの検出力
曲線の読み方はシンプルです。左端の帰無値 $\mu_0=100$ では高さがちょうど $\alpha=0.05$。ここから右へ進む(真の差が大きくなる)ほど曲線はぐんぐん立ち上がり、やがて1に張り付きます。「真の差が大きいほど見抜きやすい」という直感が、そのまま右肩上がりの曲線になっているわけです。$\mu=108$ のところに目を上げると高さは約 $0.85$。これがその点での検出力 $1-\beta$ です。
5. $\alpha$・効果量・$n$ が検出力を動かす
§3 で導いた式 $\pi(\mu)=1-\Phi\!\left(z_\alpha-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}\right)$ を見れば、検出力を左右する3つのつまみがそのまま読み取れます。
① 有意水準 $\alpha$:$\alpha$ を大きくすると $z_\alpha$ が小さくなり、$\Phi$ の中身が減って $\pi$ が上がる。つまり $\alpha$ を緩めると検出力は上がる(ただし第1種の誤りも増える)。曲線全体が上に持ち上がります。
② 効果量 $\mu-\mu_0$:帰無値から真の値が離れるほど $\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}$ が大きくなり、$\pi$ が上がる。曲線の右側ほど高いのはこのためです。
③ 標本サイズ $n$:$n$ を増やすと標準誤差 $\sigma/\sqrt{n}$ が小さくなり、同じ効果量でも $\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}$ が大きくなる。検出力が上がり、曲線は急に立ち上がる形になります。
①②は 4-2 でも触れましたが、検出力関数の式を1本持っておくと、3つのつまみがすべて同じ分母・分子の中で効いていることが一目でわかります。とくに実務で自分の意思で動かせるのは主に $n$。次節で、その $n$ を「狙った検出力から逆算する」設計を見ます。
$\mu_0=100$、$\sigma=15$、片側 $\alpha=0.05$、真の値 $\mu=108$(効果量 $8$)で、$n$ を変えて検出力 $\pi(108)$ を比べます。
$n=25$ では標準誤差 $3$、$\pi(108)=1-\Phi\!\left(1.645-\tfrac{8}{3}\right)=1-\Phi(-1.02)\approx 0.847$。
$n=50$ では標準誤差 $\approx 2.12$、$\pi(108)\approx 0.983$。
$n=100$ では標準誤差 $1.5$、$\pi(108)\approx 0.9999$。
同じ効果量でも、$n$ を増やすほど検出力がぐんぐん上がります。検出力曲線でいえば、$n$ が大きいほど帰無値のすぐ右で急峻に立ち上がる、ということです。
6. 必要標本サイズの設計
検出力関数の最大の実用は標本サイズ設計です。考え方を逆にします。「この $n$ なら検出力はいくつ?」ではなく、「検出力 $1-\beta$ を確保したい。そのために $n$ をいくつにすればいい?」と問うのです。式 $\pi(\mu)=1-\Phi\!\left(z_\alpha-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}\right)$ を $n$ について解きます。
検出力を $1-\beta$ にしたい。検出すべき差(効果量)を $\delta=\mu_1-\mu_0$ とおくと、 $$ \begin{aligned} 1-\beta &= 1-\Phi\!\left(z_\alpha - \frac{\delta}{\sigma/\sqrt{n}}\right) &&\text{(検出力関数に } \mu=\mu_1 \text{)}\\[2pt] \Phi\!\left(z_\alpha - \frac{\delta}{\sigma/\sqrt{n}}\right) &= \beta &&\text{(両辺を整理)}\\[2pt] z_\alpha - \frac{\delta}{\sigma/\sqrt{n}} &= -z_\beta &&\text{(}\Phi^{-1}(\beta)=-z_\beta\text{)}\\[2pt] \frac{\delta\sqrt{n}}{\sigma} &= z_\alpha + z_\beta &&\text{(移項して整理)}\\[2pt] n &= \left(\frac{(z_\alpha+z_\beta)\,\sigma}{\delta}\right)^{2} \end{aligned} $$
ここで $z_\beta$ は標準正規の上側 $\beta$ 点です(検出力 $0.80$ なら $\beta=0.20$ で $z_\beta=0.842$)。この式は、必要な $n$ が効果量 $\delta$ の2乗に反比例することを語っています。検出したい差が半分になると、必要な標本は4倍。「ごくわずかな差を確実に拾うには、とても大きな標本がいる」という現実が、$\delta^2$ の形に表れています。
$\mu_0=100$、$\sigma=15$、片側 $\alpha=0.05$(よって $z_\alpha=1.645$)。検出したい差を $\delta=8$ とし、検出力 $1-\beta=0.80$($z_\beta=0.842$)を確保したいとします。必要な標本サイズは?
$$n = \left(\frac{(1.645+0.842)\times 15}{8}\right)^{2} = \left(\frac{37.3}{8}\right)^{2} \approx 21.7$$
端数は切り上げて $n=22$ あれば、検出力 $0.80$ を確保できます。実際に $n=22$ で検出力を計算し直すと約 $0.80$ となり、設計どおりです。なおこれは「差 $8$ を検出したい」という前提あっての値で、もっと小さい差 $\delta=4$ を狙うなら必要な $n$ は約4倍の $87$ ほどに膨らみます。
必要な $n$ は「検出したい差 $\delta$」の2乗に反比例! つまり半分の差を見抜きたいなら標本は4倍いるの。「とりあえずデータ集めよう」じゃなくて、調べる前に「どれくらいの差を、どれくらいの確率で見抜きたいか」を決めて $n$ を逆算する──これが検出力関数のいちばんおいしい使い道だよ!
まとめ
発展3、ポイントを整理します。
- 検出力:$1-\beta=P(H_0\text{を棄却}\mid H_1)$。真の値しだいで変わる量
- 検出力関数:$\pi(\theta)=P(H_0\text{を棄却}\mid\theta)$。棄却確率を真のパラメータ $\theta$ の関数として見る
- 2つの読みどころ:$\pi(\theta_0)=\alpha$(帰無値で第1種の誤り)、対立側では $\pi(\theta)=1-\beta$(検出力)
- 正規母平均の片側:$\pi(\mu)=1-\Phi\!\left(z_\alpha-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}\right)$
- 検出力曲線:横軸 $\theta$。帰無値で $\alpha$、離れるほど単調に1へ
- 3つのつまみ:$\alpha$ を緩める/効果量が大きい/$n$ を増やす、で検出力が上がる
- 標本サイズ設計:$n=\left(\dfrac{(z_\alpha+z_\beta)\sigma}{\delta}\right)^2$。必要 $n$ は効果量 $\delta$ の2乗に反比例
次回 発展4 ネイマン・ピアソンの基本定理 では、視点をさらに一段上げます。ここまでは検出力を「測る」話でしたが、次は「検出力が最も高くなる検定を、どう作るか」。与えられた $\alpha$ のもとで最強の検定を与える、検定理論の土台となる定理です。
検出力を「点」じゃなく「曲線」で見られるようになったね! 合言葉は「帰無値で $\alpha$、離れるほど1へ」。そして $n$ は逆算して決める。次はいよいよ「最強の検定はどう作る?」というネイマン・ピアソンの定理だよ。検定理論のボス戦、楽しみにしててね!