平均への回帰
「回帰(regression)」という言葉、じつは由来があります。$19$ 世紀の科学者ゴルトンが、背の高い親からは「親ほどは高くない」子が、背の低い親からは「親ほどは低くない」子が生まれやすい──つまり子の身長が平均のほうへ戻っていく傾向に気づいたのが始まりです。これを平均への回帰(regression to the mean)と呼びます。
本ページでは、この現象が回帰直線の傾き $\hat{\beta}=r\dfrac{s_y}{s_x}$ にひそむ $|r|<1$ から自然に出てくることを確かめます。標準化すると $\hat{z}_y=r\,z_x$ というシンプルな形になり、仕組みが一目で分かります。さらに、回帰効果を実力と取り違える「平均への回帰の誤謬」(2年目のジンクス、罰と褒めの錯覚など)も整理します。
「回帰」って、もともと“平均に戻る”って意味だったの! すごく高い人の予測は、ちょっとだけ平均寄りになる。これ、$r$ が $1$ より小さいせいで自動的に起こるんだ。しかもこの現象、知らないと「2年目のジンクス」みたいに勘違いの原因にもなる。今日はその正体を式と例でハッキリさせるよ!
1. ゴルトンの発見(直感)
ゴルトンは親と子の身長を大量に集め、散布図に回帰直線を引きました。すると不思議なことに気づきます。親が平均より $10\,\text{cm}$ 高くても、子は平均より $10\,\text{cm}$ 高くはならず、$6\,\text{cm}$ ほど高いところに落ち着く。逆に親が平均より低くても、子は親ほどには低くならない。極端な親からは、少しだけ平均に戻った子が生まれやすかったのです。
これは「子が親に似ない」という話ではありません。平均的にみると、子の予測値は親の値ほど極端にならないという、回帰直線そのものが持つ性質です。ゴルトンはこれを「平凡への回帰」と呼び、ここから今日の回帰分析という名前が生まれました。
平均への回帰は「親が低いと子も低くなりがち」という因果のゆり戻しではありません。極端な値の一部はたまたまの運で生じており、その運は次に持ち越されないため、予測は平均側へ引き戻される──これが本質です。物理的な力でも遺伝の反発でもなく、$|r|<1$ という統計的な事実から生まれます。
2. なぜ起きるのか ─ 傾きにひそむ $|r|<1$
1-11・5-1 で見たとおり、回帰直線の傾きは2通りに書けました。鍵になるのは右側の形です。
$$\hat{\beta} = \frac{s_{xy}}{s_x^2} = r\,\frac{s_y}{s_x}$$ $r$ は相関係数、$s_x,\,s_y$ は $x,\,y$ の標準偏差です。相関係数は必ず $-1\le r\le 1$ の範囲に入る(1-9)ので、完全な直線関係でないかぎり $|r|<1$ です。
この $|r|<1$ が効いてきます。いちばん見やすいのは、$x,\,y$ を標準化したときです。標準化とは、平均を引いて標準偏差で割り、「平均からのズレが標準偏差いくつ分か」を表す $z$ 得点に直す操作でした(1-6)。
$z_x=\dfrac{x-\bar{x}}{s_x}$、$\hat{z}_y=\dfrac{\hat{y}-\bar{y}}{s_y}$ とおいて、回帰直線 $\hat{y}-\bar{y}=\hat{\beta}(x-\bar{x})$ を変形します。 $$ \begin{aligned} \hat{y}-\bar{y} &= \hat{\beta}\,(x-\bar{x}) &&\text{(回帰直線は重心を通る)}\\[2pt] \frac{\hat{y}-\bar{y}}{s_y} &= \frac{\hat{\beta}}{s_y}\,(x-\bar{x}) &&\text{(両辺を } s_y \text{ で割る)}\\[2pt] \hat{z}_y &= \frac{1}{s_y}\cdot r\,\frac{s_y}{s_x}\,(x-\bar{x}) &&\Big(\hat{\beta}=r\tfrac{s_y}{s_x}\text{ を代入}\Big)\\[2pt] \hat{z}_y &= r\,\frac{x-\bar{x}}{s_x} = r\,z_x &&\text{(} s_y \text{ が約分、} z_x \text{ の定義)} \end{aligned} $$
標準化した回帰式 $$\hat{z}_y = r\,z_x$$ 標準化の世界では、回帰直線の傾きはちょうど相関係数 $r$ になります。
この式が平均への回帰の正体です。たとえば $r=0.5$ のとき、$x$ が平均より $2$ 標準偏差ぶん高い($z_x=2$)人について、$y$ の予測は $\hat{z}_y=0.5\times 2=1$、つまり平均より $1$ 標準偏差ぶんしか高くないと見積もられます。$|r|<1$ だから、予測値は入力よりも必ず平均($z=0$)寄りに縮むのです。
標準化平面では回帰直線の傾きは $r$。点線(傾き1)より寝ているぶん、予測 $\hat{z}_y$ は入力 $z_x$ より平均(0)側に縮む($z_x=2$ でも予測は $\hat{z}_y=1$)
標準化すると傾きが $r$ になる──$\hat{z}_y=r\,z_x$。$r$ は $1$ より小さいから、入力を $r$ 倍に“縮めて”予測することになるの。だから極端な値ほど平均に引き戻される。これが「平均への回帰」のタネあかしだよ!
3. 数値例 ─ 親子の身長で確かめる
具体的な数で見てみましょう。父親と息子の身長について、ともに平均 $170\,\text{cm}$、標準偏差 $6\,\text{cm}$、相関係数 $r=0.5$ だとします。標準偏差が等しい($s_x=s_y$)ので、傾きはちょうど $\hat{\beta}=r\dfrac{s_y}{s_x}=r=0.5$ です。
身長 $182\,\text{cm}$(平均より $+2$ 標準偏差)の父親の息子の予測身長は、$\hat{z}_y=r\,z_x=0.5\times 2=1$ なので $$\hat{y} = 170 + 1\times 6 = 176\ \text{cm}$$ 父は平均より $12\,\text{cm}$ 高いのに、息子の予測は $6\,\text{cm}$ 高いだけ。逆に $158\,\text{cm}$($-2$ 標準偏差)の父親なら $\hat{z}_y=0.5\times(-2)=-1$ で $$\hat{y} = 170 + (-1)\times 6 = 164\ \text{cm}$$ 平均より $12\,\text{cm}$ 低い父の息子の予測は $6\,\text{cm}$ 低いだけ。どちらも平均 $170$ のほうへ半分だけ戻っています。
注意したいのは、これは「全員が平均に近づく(ばらつきが消える)」という意味ではない点です。集団全体の身長のばらつきは世代を超えてほぼ一定に保たれます。あくまで「極端な親を選んでその子を予測すると、平均寄りになる」という条件つきの話で、矛盾はありません。
4. 平均への回帰の誤謬
平均への回帰がやっかいなのは、本当はただの統計的なゆり戻しなのに、それを「実力」や「効果」と取り違えてしまうことです。これを平均への回帰の誤謬(regression fallacy)といいます。代表例を見ておきましょう。
ルーキー(新人)の年に大活躍した選手が、2年目に成績を落とす──「2年目のジンクス」。1年目に飛び抜けた成績を出せたのは、実力に加えて運や好調が重なった面があります。その上ぶれは翌年そのまま持ち越されないので、2年目は実力相応=平均寄りに戻るだけ。プレッシャーや慢心だけが原因とはかぎりません。
とても悪い結果を出した部下を叱ると次は改善し、とても良い結果を出した部下を褒めると次は落ちる。これを見て「叱るほうが効く」と結論しがちですが、極端に悪い・良い結果の次は、どちらにせよ平均へ戻りやすいだけかもしれません。叱責の効果でも称賛の害でもなく、回帰効果を取り違えた錯覚の可能性があります。
ほかにも「健康診断で血圧が極端に高かった人が、薬を飲まなくても再検査で下がる」「成績が急落した生徒が補習を受けたら戻った(補習の効果に見える)」など、日常にあふれています。共通の構造は、極端な値で選んだ対象を再測定すると平均寄りになるという1点です。
誤謬を見抜くコツは「極端な値だけを選んで、その後を追っていないか?」と問うこと。極端な群を選べば、施策の有無にかかわらず次は平均へ戻ります。本当に効果があったかを知るには、3-2 研究デザイン で学んだ対照群(比較対象)を置いた比較が欠かせません。「処置した群が戻った」だけでなく「処置しない群と比べてより戻ったか」を見るのです。
5. 結論と使いどころ
平均への回帰は、回帰分析という分野の名前の由来であると同時に、データ解釈の落とし穴としても頻出のテーマです。$\hat{z}_y=r\,z_x$ という一行を覚えておけば、現象の本質も誤謬の見抜き方も同時に手に入ります。
$|r|<1$ であるかぎり、予測値は入力よりも平均寄りになる──これは欠陥ではなく、最小二乗法が「外れすぎない安全な予測」をしている証拠です。問題は現象そのものではなく、それを因果や実力と取り違える解釈のほう。極端な値からの変化を見たら、まず「平均への回帰では?」と疑う習慣をつけましょう。
まとめ
第5章 5-4、ポイントを整理します。
- ゴルトンの発見:極端な親から平均寄りの子が生まれやすい → 「回帰」の語源
- 仕組み:傾き $\hat{\beta}=r\dfrac{s_y}{s_x}$ にひそむ $|r|<1$ のせいで予測は平均に縮む
- 標準化形:$\hat{z}_y=r\,z_x$。標準化平面では傾きが相関係数 $r$ そのもの
- 数値例:$r=0.5$ なら $+2$ 標準偏差の入力でも予測は $+1$ 標準偏差(半分に縮む)
- 誤謬:2年目のジンクス、罰と褒めの錯覚など、回帰効果を実力・効果と取り違える
- 見抜き方:極端な値で選んでいないか確認。効果判定には対照群との比較が必要
次回 5-5 重回帰モデル では、説明変数を2つ以上に増やします。偏回帰係数の意味、多重共線性、質的変数を扱うダミー変数まで、単回帰の考え方を多変数へ広げていきます。
$\hat{z}_y=r\,z_x$──たった一行で「平均への回帰」も「2年目のジンクス」も説明できちゃう。$|r|<1$ だから予測は平均に縮む、それだけ! 極端な変化を見たら「回帰効果かも?」って一回立ち止まれる人は、データにだまされにくいよ。次は説明変数が増える重回帰だよ!