2変量正規分布・共分散と相関
前回までは1つの確率変数 $X$ を見てきましたが、ここでは $X$ と $Y$ という2つの正規分布を同時に考えます。これが2変量正規分布です。身長と体重、数学と物理の点数のように、ペアで動くデータを表すのに使います。
鍵を握るのが相関係数 $\rho$。$\rho$ が分布の「楕円の傾き」をどう決めるかを図で確認し、最後に2級の最重要ポイント──正規分布では「無相関 $\Leftrightarrow$ 独立」が成り立つ(でも一般の分布では成り立たない!)という事実を、対比例つきで押さえます。
2つの変数を同時に見る回だよ! 主役は相関係数 $\rho$。$\rho$ で分布の楕円が傾くイメージをつかもう。そして今日の山場は「無相関と独立はふつう別物。でも正規分布なら一致する」──ここ、試験で超ねらわれるよ!
1. 共分散と相関係数のおさらい
まず、2つの確率変数の関係を測る道具を確率変数の言葉で復習します。第1章(1-9)ではデータの共分散・相関を学びましたが、ここでは確率変数 $X,Y$ についての定義です。
共分散:$X,Y$ がそれぞれの平均からどれだけ「一緒に」ずれるか。 $$\mathrm{Cov}(X,Y) = E\big[(X-\mu_X)(Y-\mu_Y)\big] = E[XY]-E[X]E[Y]$$ 相関係数:共分散を各標準偏差で割って $-1\sim 1$ に正規化したもの。 $$\rho = \frac{\mathrm{Cov}(X,Y)}{\sigma_X\,\sigma_Y}$$
共分散には単位($X$ と $Y$ の単位の積)が残るので大小を比べにくいのですが、$\sigma_X\sigma_Y$ で割った相関係数 $\rho$ はつねに $-1\le\rho\le 1$ に収まり、関係の強さと向きを単位なしで表せます。$\rho>0$ なら右上がり、$\rho<0$ なら右下がり、$\rho=0$ なら直線的な関係なし、というのは第1章と同じです。
2. 2変量正規分布の概形
2変量正規分布は、$X$ と $Y$ がともに正規分布に従い、しかも「どの方向から眺めても正規分布に見える」ように結びついた分布です。形を決めるパラメータは5つ──$\mu_X,\ \mu_Y$(中心)、$\sigma_X,\ \sigma_Y$(各方向の広がり)、そして $\rho$(傾き具合)です。
密度 $f(x,y)$ は3次元の山(中心がいちばん高い釣鐘を2次元に広げた形)になります。式の全体を覚える必要はありませんが、「中心が最も高く、外へ向かってなだらかに低くなる山」というイメージを持ってください。この山を真上から見て、同じ高さ(同じ密度)の点を結ぶと等高線が描けます。2変量正規分布では、この等高線が楕円になります。
2変量正規分布の特徴をつかむ近道は、「等高線=楕円」と覚えること。楕円の中心が $(\mu_X,\mu_Y)$、横と縦の広がりが $\sigma_X,\sigma_Y$、そして傾きが相関 $\rho$ で決まります。$\rho$ が分布の見た目をどう変えるかは、次の図でつかみましょう。
3. $\rho$ と楕円の形
相関 $\rho$ の値によって、等高線の楕円がどう変わるかを並べてみます。$\sigma_X=\sigma_Y$ の場合で見ると、傾きの違いがよくわかります。
2変量正規分布の等高線:ρ=0 なら円、ρ>0 なら右上がり、ρ<0 なら右下がりの楕円。|ρ|が大きいほど細長くなる
- $\rho=0$:楕円は円($\sigma_X=\sigma_Y$ のとき)。$X$ と $Y$ に直線的な傾きなし
- $\rho>0$:右上がりに傾いた楕円。$X$ が大きいほど $Y$ も大きい傾向
- $\rho<0$:右下がりに傾いた楕円。$X$ が大きいほど $Y$ は小さい傾向
- $|\rho|\to 1$:楕円はどんどん細長くなり、直線に近づく(関係がほぼ完全な直線)
2変量正規分布に従う $(X,Y)$ で、$\mathrm{Cov}(X,Y)=12$、$\sigma_X=4$、$\sigma_Y=5$ とします。相関係数は $$\rho = \frac{\mathrm{Cov}(X,Y)}{\sigma_X\,\sigma_Y} = \frac{12}{4\times 5} = \frac{12}{20} = 0.6$$ $\rho=0.6$ なので、やや右上がりに傾いた楕円になります。正の相関が中程度に強い、という読み方です。
4. 正規分布では「無相関 $\Leftrightarrow$ 独立」
ここが本ページの山場です。まず一般論として、独立と無相関の関係を整理しておきます。
一般には「独立 $\Rightarrow$ 無相関」だけ
$X$ と $Y$ が独立なら $E[XY]=E[X]E[Y]$ が成り立つので、$\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]=0$、したがって $\rho=0$(無相関)になります。つまり「独立ならば無相関」はつねに正しい。
ところが、その逆は一般には成り立ちません。無相関($\rho=0$)でも独立とは限らないのです。相関係数はあくまで直線的な関係しか捉えられないため、曲がった関係があると見落としてしまうからです。
$X$ を $N(0,1)$ に従う確率変数とし、$Y=X^2$ と定めます。$Y$ は $X$ から完全に決まるので、明らかに独立ではありません。ところが共分散を計算すると($X$ の対称性から $E[X]=E[X^3]=0$)、 $$\mathrm{Cov}(X,Y)=E[X\cdot X^2]-E[X]E[X^2]=E[X^3]-0=0$$ となり、$\rho=0$(無相関)。$Y=X^2$ という放物線の関係は「右上がりでも右下がりでもない」ため、相関係数では関係を検知できないのです。
正規分布なら逆も成り立つ
ところが $(X,Y)$ が2変量正規分布に従うときは特別で、逆も成り立ちます。
$(X,Y)$ が2変量正規分布に従うとき、 $$\rho = 0 \iff X \text{ と } Y \text{ は独立}$$ が成り立ちます。理由は、2変量正規分布の密度 $f(x,y)$ に $\rho=0$ を代入すると、ちょうど $X$ の密度と $Y$ の密度の積 $f(x)\,g(y)$ にきれいに分かれるから。密度が積に分解できることが、まさに独立の定義です。$\rho=0$ で楕円が「傾きのない円(または軸に平行な楕円)」になり、$X$ の値が $Y$ に何の情報も与えなくなる──と図でイメージしてもよいでしょう。
| 関係 | 一般の分布 | 2変量正規分布 |
|---|---|---|
| 独立 $\Rightarrow$ 無相関 | ○ 成り立つ | ○ 成り立つ |
| 無相関 $\Rightarrow$ 独立 | × 成り立たない($Y=X^2$ など) | ○ 成り立つ |
ここ、試験の大本命だよ! 合言葉は「独立なら必ず無相関。でも無相関でも独立とは限らない──正規分布のときだけは一致する」。$Y=X^2$ の反例もセットで覚えておけば完璧。相関係数は『直線の関係だけ』を測るってことも忘れずにね!
5. 結論と使いどころ
2変量正規分布は、第3章以降で2つの量の関係を推定・検定する場面(相関係数の検定、回帰分析など)の土台になります。ここで押さえるべきは次の3点です。
① 相関係数 $\rho=\dfrac{\mathrm{Cov}(X,Y)}{\sigma_X\sigma_Y}$ は $-1\sim 1$ で、楕円の傾きを決める。
② 相関係数は直線的な関係しか測れない。曲がった関係は $\rho=0$ でも存在しうる。
③ 「独立 $\Rightarrow$ 無相関」はつねに真。「無相関 $\Rightarrow$ 独立」は2変量正規分布のときだけ真。
まとめ
第2章 2-11、ポイントを整理します。
- 共分散・相関:$\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]$、$\rho=\dfrac{\mathrm{Cov}(X,Y)}{\sigma_X\sigma_Y}$($-1\le\rho\le 1$)
- 2変量正規分布:$\mu_X,\mu_Y,\sigma_X,\sigma_Y,\rho$ の5つで決まり、等高線は楕円
- $\rho$ と形:$\rho=0$ で円、$\rho>0$ で右上がり、$\rho<0$ で右下がり、$|\rho|\to 1$ で細長く直線に近づく
- 独立 $\Rightarrow$ 無相関:つねに成り立つ
- 無相関 $\Rightarrow$ 独立:一般には不成立(反例 $Y=X^2$)。2変量正規分布なら成立
次回 2-12 標本分布(χ²・t・F分布) では、正規分布から派生する3つの重要な分布を扱います。これらは第3章・第4章の推定・検定で実際に使う「道具の分布」。確率分布の章はいよいよ大詰めです。
2変量正規分布、おつかれさま! $\rho$ で楕円が傾くイメージと、「無相関 $\Leftrightarrow$ 独立は正規分布だけ」──この2つを持ち帰ってね。$Y=X^2$ の反例は一度自分で確かめると一生忘れないよ。次は χ²・t・F の3兄弟だよ!