第2章 2-5c / 確率と確率分布

確率変数の和と差 — 共分散と $V[X+Y]$ の導出

このページで学ぶこと

2-5a で「和の期待値」$E[X+Y]=E[X]+E[Y]$ は無条件で成り立つことを見ました。今回は和や差の分散がどうなるかを追います。結論を先に言うと、分散はそう単純にはいかず、$2$つの変数の連動具合を表す共分散 $\mathrm{Cov}(X,Y)$ が顔を出します。

山場は $V[X+Y]=V[X]+V[Y]+2\,\mathrm{Cov}(X,Y)$ の導出です。さらに $X,Y$ が独立なら共分散が $0$ になり、和でも差でも分散はただの足し算 $V[X]+V[Y]$ になる──この「差でも+」が大きな落とし穴。「期待値の和は無条件、分散の和は独立が必要」という対比を、ここで完成させましょう。

さえちゃん
さえ

期待値の和は「いつでもバラせる」だったよね。でも分散の和は要注意! $2$人が連動してると共分散っていう項が出てくるの。しかも独立なら、和でもでも分散は足し算になるんだよ。「引いたのに+?」って混乱しがちなところだから、今日でスッキリさせよう!

1. 同時分布の復習と和の期待値

$2$つの確率変数 $X,Y$ を同時に扱うときは、$X=x_i$ かつ $Y=y_j$ となる確率 $p_{ij}=P(X=x_i,\,Y=y_j)$ を並べた同時分布を使います。片方の変数について足し合わせると、もう片方単独の分布(周辺分布)に戻る、という関係も 2-5a で確認したとおりです。

この同時分布を使うと、まず和の期待値は次のように、独立性を一切仮定せずに成り立ちました(2-5a の再掲)。

FORMULA

$$E[X+Y] = E[X] + E[Y]$$ これは期待値の線形性そのもので、無条件(独立でなくても)成立します。差についても同様に $E[X-Y]=E[X]-E[Y]$。期待値は、和も差もそのまま分けられます。

問題はここからです。「期待値はいつでもバラせる」のと同じ感覚で分散をバラそうとすると、つまずきます。分散がどうなるかを正しく追うために、まず共分散という新しい量を準備します。

2. 共分散 $\mathrm{Cov}(X,Y)$

共分散は、$2$つの変数が「いっしょに大きくなる/小さくなる」傾向(連動の強さと向き)を表す量です。それぞれの中心 $\mu_X=E[X]$、$\mu_Y=E[Y]$ からのズレのを平均します。

FORMULA

$$\mathrm{Cov}(X,Y) = E\big[(X-\mu_X)(Y-\mu_Y)\big]$$ $X$ も $Y$ も同時に中心より大きい(あるいは同時に小さい)ことが多ければ積はプラスに偏り、$\mathrm{Cov}>0$。片方が大きいとき他方が小さい傾向なら $\mathrm{Cov}<0$ になります。

分散のときと同じように、共分散にも計算向きの形があります。導き方も分散とそっくりで、積を展開して期待値の線形性で整理するだけです。

導出:$\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]$

DERIVATION

$$ \begin{aligned} \mathrm{Cov}(X,Y) &= E\big[(X-\mu_X)(Y-\mu_Y)\big] &&\text{(定義)}\\[2pt] &= E\big[XY - \mu_Y X - \mu_X Y + \mu_X \mu_Y\big] &&\text{(積を展開)}\\[2pt] &= E[XY] - \mu_Y E[X] - \mu_X E[Y] + \mu_X \mu_Y &&\text{(線形性、} \mu_X,\mu_Y \text{ は定数)}\\[2pt] &= E[XY] - \mu_Y \mu_X - \mu_X \mu_Y + \mu_X \mu_Y &&\text{(} E[X]=\mu_X,\ E[Y]=\mu_Y \text{)}\\[2pt] &= E[XY] - \mu_X \mu_Y \\[2pt] &= E[XY] - E[X]\,E[Y] &&\text{(} \mu \text{ を戻す)} \end{aligned} $$

FORMULA

$$\mathrm{Cov}(X,Y) = E[XY] - E[X]\,E[Y]$$ 「積の期待値」から「期待値の積」を引く。分散の $V[X]=E[X^2]-(E[X])^2$ とそっくりな形ですね。実際、$Y=X$ とおくと $\mathrm{Cov}(X,X)=E[X^2]-(E[X])^2=V[X]$。分散は「自分自身との共分散」なのです。

3. 和の分散 $V[X+Y]$(導出★)

準備が整いました。和 $X+Y$ の分散を、分散の定義から導きます。新しい中心は $E[X+Y]=\mu_X+\mu_Y$ なので、偏差は $(X+Y)-(\mu_X+\mu_Y)=(X-\mu_X)+(Y-\mu_Y)$。これを2乗して期待値を取ります。

導出

DERIVATION

$$ \begin{aligned} V[X+Y] &= E\big[\,(X+Y) - (\mu_X+\mu_Y)\,\big]^2 &&\text{(分散の定義)}\\[2pt] &= E\big[\,(X-\mu_X) + (Y-\mu_Y)\,\big]^2 &&\text{(偏差ごとにまとめる)}\\[2pt] &= E\big[(X-\mu_X)^2 + 2(X-\mu_X)(Y-\mu_Y) + (Y-\mu_Y)^2\big] &&\text{(和の2乗を展開)}\\[2pt] &= E\big[(X-\mu_X)^2\big] + 2\,E\big[(X-\mu_X)(Y-\mu_Y)\big] + E\big[(Y-\mu_Y)^2\big] &&\text{(線形性で分ける)}\\[2pt] &= V[X] + 2\,\mathrm{Cov}(X,Y) + V[Y] &&\text{(各項を定義で読み替え)} \end{aligned} $$

FORMULA

$$V[X+Y] = V[X] + V[Y] + 2\,\mathrm{Cov}(X,Y)$$ 和の分散は、それぞれの分散の和に共分散の $2$倍が加わります。期待値の和とちがって、$2$つの変数の連動具合($\mathrm{Cov}$)を無視できないのです。真ん中の交差項 $2(X-\mu_X)(Y-\mu_Y)$ が、まさに共分散の正体でした。

4. 差の分散 $V[X-Y]$

差についても同じ手順です。$X-Y=X+(-Y)$ と見て、$\mathrm{Cov}(X,-Y)=-\mathrm{Cov}(X,Y)$(マイナスが外に出る)を使えば、交差項の符号だけが変わります。

FORMULA

$$V[X-Y] = V[X] + V[Y] - 2\,\mathrm{Cov}(X,Y)$$ ここで大事なのは、$V[X]$ と $V[Y]$ はどちらも+のままだということ。引き算になったのは共分散の項だけ。$V[-Y]=(-1)^2V[Y]=V[Y]$(2-5b の $V[aX]=a^2V[X]$)なので、$Y$ の分散は引いても消えず、足されます。

5. 独立なら共分散は0(差でも+になる)

では、$X$ と $Y$ が独立のときはどうなるでしょう。独立とは「片方の値が他方の確率に影響しない」こと。同時確率が周辺確率の積に分解できます。

FORMULA

独立の定義(離散型):すべての $i,j$ で $$p_{ij} = P(X=x_i,\,Y=y_j) = P(X=x_i)\,P(Y=y_j) = p_i\, q_j$$ ここで $p_i=P(X=x_i)$、$q_j=P(Y=y_j)$ は、それぞれの周辺確率です。

導出:独立なら $E[XY]=E[X]E[Y]$

独立性 $p_{ij}=p_i q_j$ を使うと、積の期待値 $E[XY]$ が分解できます。同時分布で $x_i y_j$ を $p_{ij}$ で重み付けして足すところからスタートします。

DERIVATION

$$ \begin{aligned} E[XY] &= \sum_{i}\sum_{j} x_i y_j\, p_{ij} &&\text{(同時分布で定義)}\\[2pt] &= \sum_{i}\sum_{j} x_i y_j\, p_i q_j &&\text{(独立性 } p_{ij}=p_i q_j \text{ を代入)}\\[2pt] &= \Big(\sum_{i} x_i p_i\Big)\Big(\sum_{j} y_j q_j\Big) &&\text{(} i \text{ と } j \text{ の和を分離)}\\[2pt] &= E[X]\,E[Y] &&\text{(それぞれ期待値の定義)} \end{aligned} $$

3行目の「和の分離」がカギです。$x_i p_i$ は $i$ だけ、$y_j q_j$ は $j$ だけに依存するので、二重和を $2$つの和の積に切り離せます。ここで初めて独立性が本質的に効いています。この結果を共分散の式に入れると、

FORMULA

$X,Y$ が独立なら $E[XY]=E[X]E[Y]$ なので、 $$\mathrm{Cov}(X,Y) = E[XY] - E[X]E[Y] = 0$$ 共分散がゼロになります。すると和・差の分散の交差項が消えて、 $$V[X+Y] = V[X-Y] = V[X] + V[Y]$$ 和でも差でも、分散はただの足し算になります。

POINT

「差なのに分散は足す」──ここが最大の注意点です。直感では「引いたら分散も引く?」と思いがちですが、ばらつきは符号に関係なく積み重なるもの。$Y$ を引こうが足そうが、$Y$ 自身の散らばりは $X$ の散らばりに上乗せされます。$V[-Y]=V[Y]$ だったことを思い出せば納得です。なお、独立なら共分散は $0$ ですが、逆は必ずしも成り立ちません(共分散 $0$ でも独立とは限らない)。これも2級の頻出ポイントです。

さえちゃん
さえ

2-5aで言った「期待値の和は無条件、分散の和は独立が必要」、これでハッキリしたね! $E[X+Y]$ はいつでもバラせるけど、$V[X+Y]$ は独立じゃないと共分散の項が残る。しかも独立でも差で+。試験ではここを突かれるから、セットで暗記しちゃおう!

6. 数値例で確かめる

具体例で式が合うことを確かめます。$2$個のサイコロ $X,Y$ を独立に振ったとき、出目の和 $X+Y$ の分散を見てみましょう。各サイコロの分散は 2-5b で $V[X]=V[Y]=\tfrac{35}{12}$ でした。

EXAMPLE 1(独立な和:Cov=0)

$2$個のサイコロは独立なので $\mathrm{Cov}(X,Y)=0$。よって

$$V[X+Y] = V[X] + V[Y] = \frac{35}{12} + \frac{35}{12} = \frac{70}{12} = \frac{35}{6} \approx 5.833$$

差 $X-Y$ の分散も、独立なので同じく $V[X-Y]=V[X]+V[Y]=\tfrac{35}{6}$。引いても足し算、という典型例です。

EXAMPLE 2(連動する場合:Cov≠0)

では「$2$個の出目が必ず同じになる細工サイコロ」、つまり $Y=X$ の場合は? このとき $X+Y=2X$ なので、2-5b の $V[aX]=a^2V[X]$ から

$$V[X+Y] = V[2X] = 2^2\,V[X] = 4 \times \frac{35}{12} = \frac{35}{3} \approx 11.667$$

公式でも確かめます。$Y=X$ なら $\mathrm{Cov}(X,Y)=\mathrm{Cov}(X,X)=V[X]=\tfrac{35}{12}$ なので、

$$V[X+Y] = V[X]+V[Y]+2\,\mathrm{Cov}(X,Y) = \frac{35}{12}+\frac{35}{12}+2\cdot\frac{35}{12} = 4\cdot\frac{35}{12} = \frac{35}{3}$$

ぴったり一致しました。独立のとき($\tfrac{35}{6}\approx5.83$)より、完全連動のとき($\tfrac{35}{3}\approx11.67$)のほうがばらつきが大きい──共分散の $2$倍がまるごと上乗せされているのがわかります。

まとめ

第2章 2-5c、ポイントを整理します。

次回 2-6 モーメント では、期待値・分散をより一般化した「モーメント」という見方を導入します。$E[X]$ が1次モーメント、$V[X]$ が中心まわりの2次モーメント──今日までの道具が、より大きな枠組みの中に位置づけられます。

さえちゃん
さえ

お疲れさま! $V[X+Y]=V[X]+V[Y]+2\mathrm{Cov}$ の導出、「偏差の和を2乗して展開、線形性で分ける」っていう流れは分散のときと同じだったね。独立なら $\mathrm{Cov}=0$ で、和も差も足し算──この「差でも+」だけは絶対に忘れないでね! 期待値・分散の山場、これで完走だよ!