第2章 2-9 / 確率と確率分布

連続分布① 一様分布・指数分布

このページで学ぶこと

ここからは連続型の確率分布に入ります。離散分布では確率を $\sum$ で足しましたが、連続分布では確率密度関数 $f(x)$ を $\int$ で積分するのが基本です。まずはいちばんシンプルな2つ、一様分布 $U(a,b)$ と指数分布 $\mathrm{Exp}(\lambda)$ を取り上げます。

一様分布は「どこも同じ確率」というまっ平らな分布、指数分布は「次のバスが来るまで」「機械が壊れるまで」といった待ち時間を表す分布です。期待値 $E[X]$ と分散 $V[X]$ を積分で簡潔に導きつつ、指数分布だけが持つ不思議な性質「無記憶性」まで一緒に確かめましょう。

さえちゃん
さえ

連続分布デビューだね! コツは1つだけ──「離散の $\sum$ を $\int$ に置きかえる」こと。一様分布はまっ平ら、指数分布は右肩下がりのすべり台。形をイメージできれば、積分もこわくないよ!

1. 連続分布のおさらい(密度と積分)

連続型の確率変数 $X$ では、「ちょうど $X=x$ になる確率」は $0$ です。長さのない1点に確率は乗りません。そこで主役になるのが確率密度関数(pdf) $f(x)$ で、確率は面積として、つまり積分で受け取ります。

FORMULA

密度 $f(x)$ がみたすべき2条件と、確率・期待値・分散の定義: $$f(x)\ge 0,\qquad \int_{-\infty}^{\infty} f(x)\,dx = 1$$ $$P(a\le X\le b) = \int_{a}^{b} f(x)\,dx$$ $$E[X] = \int_{-\infty}^{\infty} x\,f(x)\,dx,\qquad V[X] = E[X^2] - \big(E[X]\big)^2$$

離散分布の「確率を全部足すと $1$」が、連続では「密度を全区間で積分すると $1$(曲線の下の総面積が $1$)」に変わっただけです。分散は前章(2-5b)と同じ $V[X]=E[X^2]-(E[X])^2$ を使うのがいちばんラクなので、本ページでもこの形で計算していきます。

2. 一様分布 $U(a,b)$

一様分布は、区間 $[a,b]$ の中ならどこも等しく起こりやすいという分布です。「$0$ 以上 $1$ 未満の乱数」「ある時刻にランダムに到着する人の到着時刻」などが典型例。密度は区間内で一定の高さをとり、その外ではゼロです。

FORMULA

区間 $[a,b]$ 上の一様分布 $U(a,b)$ の確率密度関数: $$f(x) = \begin{cases} \dfrac{1}{b-a} & (a \le x \le b)\\[6pt] 0 & (\text{それ以外}) \end{cases}$$ 高さが $\dfrac{1}{b-a}$ なのは、幅 $b-a$ × 高さ $=$ 面積 $1$ をみたすためです。

a (a+b)/2 b 1/(b-a) 面積 = 1 一様分布 U(a, b) x

一様分布 U(a,b):区間 [a,b] で高さ 1/(b−a) の長方形。重心は中央 (a+b)/2

期待値の導出

まっ平らな分布の重心は、見るからに区間のど真ん中にありそうです。それを積分で確かめます。

DERIVATION

$$ \begin{aligned} E[X] &= \int_{a}^{b} x\cdot \frac{1}{b-a}\,dx &&\text{(定義に密度を代入)}\\[2pt] &= \frac{1}{b-a}\left[\frac{x^2}{2}\right]_{a}^{b} &&\text{(} x \text{ を積分)}\\[2pt] &= \frac{1}{b-a}\cdot \frac{b^2-a^2}{2} &&\text{(上端} - \text{下端)}\\[2pt] &= \frac{(b-a)(b+a)}{2(b-a)} = \frac{a+b}{2} &&\text{(} b^2-a^2=(b-a)(b+a) \text{ で約分)} \end{aligned} $$

予想どおり、期待値は区間の中点 $\dfrac{a+b}{2}$ になりました。左右対称なまっ平らの山なら、重心が真ん中に来るのは自然ですね。

分散の導出

分散は $V[X]=E[X^2]-(E[X])^2$ で求めます。まず $E[X^2]$ を計算しましょう。

DERIVATION

$$ \begin{aligned} E[X^2] &= \int_{a}^{b} x^2\cdot \frac{1}{b-a}\,dx = \frac{1}{b-a}\left[\frac{x^3}{3}\right]_{a}^{b} = \frac{b^3-a^3}{3(b-a)}\\[2pt] &= \frac{(b-a)(b^2+ab+a^2)}{3(b-a)} = \frac{a^2+ab+b^2}{3} &&\text{(} b^3-a^3 \text{ を因数分解)}\\[6pt] V[X] &= E[X^2]-\big(E[X]\big)^2 = \frac{a^2+ab+b^2}{3} - \left(\frac{a+b}{2}\right)^2\\[2pt] &= \frac{4(a^2+ab+b^2) - 3(a+b)^2}{12} = \frac{a^2-2ab+b^2}{12} = \frac{(b-a)^2}{12} \end{aligned} $$

FORMULA

一様分布 $U(a,b)$ のまとめ: $$E[X] = \frac{a+b}{2},\qquad V[X] = \frac{(b-a)^2}{12}$$ 分散は区間の幅 $b-a$ だけで決まり、位置 $a,b$ そのものにはよりません。幅が広いほどばらつくのは直感どおりです。

EXAMPLE(一様分布)

ある路線のバスは正確に $6$ 分間隔で来ます。時刻表を見ずにバス停に着いたとき、待ち時間 $X$ は $U(0,6)$ とみなせます。

  • 平均待ち時間:$E[X]=\dfrac{0+6}{2}=3$ 分
  • 分散:$V[X]=\dfrac{(6-0)^2}{12}=\dfrac{36}{12}=3$、標準偏差 $\sqrt{3}\approx 1.73$ 分
  • $2$ 分以内に来る確率:$P(X\le 2)=\displaystyle\int_0^2 \frac{1}{6}\,dx = \frac{2}{6}=\frac{1}{3}$

間隔のちょうど半分が平均待ち時間。一様分布では確率が「幅の比」で出せるのも便利な点です。

3. 指数分布 $\mathrm{Exp}(\lambda)$

指数分布は、「あるできごとが起こるまでの待ち時間」を表す分布です。次の電話がかかってくるまで、部品が故障するまで、放射性原子が崩壊するまで──こうした「いつ起こるかわからないが、一定のペースで起こる」現象の間隔は、指数分布でよく近似できます。$\lambda$(ラムダ)は単位時間あたりに起こる回数(発生率)を表すパラメータです。

FORMULA

発生率 $\lambda>0$ の指数分布 $\mathrm{Exp}(\lambda)$ の確率密度関数: $$f(x) = \begin{cases} \lambda e^{-\lambda x} & (x \ge 0)\\[4pt] 0 & (x<0) \end{cases}$$ $x=0$ で高さ $\lambda$ から始まり、右へ向かって指数的に減衰していきます。

0 λ 指数分布 Exp(λ) x(待ち時間) f(x) = λe^(−λx)

指数分布 Exp(λ):x=0 で高さ λ、右へ指数的に減衰する「すべり台」型。短い待ち時間ほど起こりやすい

累積分布関数(CDF)

指数分布は累積分布関数 $F(x)=P(X\le x)$ がきれいな形になるのが大きな魅力です。「$x$ 以下で起こる確率」をそのまま式で書けます。

DERIVATION

$$ \begin{aligned} F(x) = P(X\le x) &= \int_{0}^{x} \lambda e^{-\lambda t}\,dt &&(x\ge 0)\\[2pt] &= \lambda\left[-\frac{1}{\lambda}e^{-\lambda t}\right]_{0}^{x} &&\text{(} e^{-\lambda t} \text{ を積分)}\\[2pt] &= \Big[-e^{-\lambda t}\Big]_{0}^{x} = -e^{-\lambda x}-(-1) = 1 - e^{-\lambda x} \end{aligned} $$

FORMULA

$$F(x) = P(X\le x) = 1 - e^{-\lambda x}\quad(x\ge 0)$$ したがって「$x$ より長く待つ確率」は $P(X>x)=e^{-\lambda x}$。待ち時間が長くなるほど指数的に起こりにくくなることを表しています。

期待値と分散

$E[X]$ と $E[X^2]$ の積分は部分積分が要りますが、結果は驚くほどシンプルです。途中は要点だけ示します。

DERIVATION

$$ \begin{aligned} E[X] &= \int_{0}^{\infty} x\,\lambda e^{-\lambda x}\,dx = \Big[-x e^{-\lambda x}\Big]_{0}^{\infty} + \int_{0}^{\infty} e^{-\lambda x}\,dx &&\text{(部分積分)}\\[2pt] &= 0 + \left[-\frac{1}{\lambda}e^{-\lambda x}\right]_{0}^{\infty} = \frac{1}{\lambda} &&\text{(第1項は} 0 \text{に収束)} \end{aligned} $$ 同様に部分積分をもう一度使うと $E[X^2]=\dfrac{2}{\lambda^2}$ となり、 $$V[X] = E[X^2]-\big(E[X]\big)^2 = \frac{2}{\lambda^2} - \frac{1}{\lambda^2} = \frac{1}{\lambda^2}$$

FORMULA

指数分布 $\mathrm{Exp}(\lambda)$ のまとめ: $$E[X] = \frac{1}{\lambda},\qquad V[X] = \frac{1}{\lambda^2},\qquad \sigma = \frac{1}{\lambda}$$ 発生率 $\lambda$ が大きい(よく起こる)ほど、待ち時間の平均 $1/\lambda$ は短くなります。平均と標準偏差が等しい(どちらも $1/\lambda$)のも指数分布の特徴です。

EXAMPLE(指数分布)

あるコールセンターでは、電話が平均 $5$ 分に $1$ 本のペースでかかってきます。次の電話までの待ち時間 $X$ を $\mathrm{Exp}(\lambda)$ とすると、平均が $5$ 分なので $\dfrac{1}{\lambda}=5$、すなわち $\lambda=\dfrac{1}{5}$ です。

  • 期待値:$E[X]=\dfrac{1}{\lambda}=5$ 分、分散:$V[X]=\dfrac{1}{\lambda^2}=25$
  • $5$ 分以内に次の電話が来る確率:$P(X\le 5)=1-e^{-\lambda\cdot 5}=1-e^{-1}\approx 0.632$
  • $10$ 分より長く来ない確率:$P(X>10)=e^{-\lambda\cdot 10}=e^{-2}\approx 0.135$

平均が $5$ 分でも、$5$ 分以内に来るのは $63\%$ ほど。指数分布は「短い間隔が多く、たまに長い間隔がある」という非対称な分布なので、平均より短く来ることが多いのです。

4. 指数分布の無記憶性

指数分布だけが持つ、ちょっと不思議な性質が無記憶性(memorylessness)です。「すでに $s$ だけ待った」という事実が、その後さらに待つ時間の分布にまったく影響しないという性質です。

FORMULA

任意の $s,t\ge 0$ について、 $$P(X>s+t \mid X>s) = P(X>t)$$ 「あと $t$ 以上待つ確率」は、すでにどれだけ待ったか($s$)に関係なく、最初から $t$ 待つ確率と同じ、という意味です。

導出

DERIVATION

条件付き確率の定義に $P(X>x)=e^{-\lambda x}$ を代入します。 $$ \begin{aligned} P(X>s+t \mid X>s) &= \frac{P(X>s+t \text{ かつ } X>s)}{P(X>s)} &&\text{(条件付き確率の定義)}\\[2pt] &= \frac{P(X>s+t)}{P(X>s)} &&\text{(} s+t>s \text{ なので分子は} X>s+t \text{)}\\[2pt] &= \frac{e^{-\lambda(s+t)}}{e^{-\lambda s}} = e^{-\lambda t} = P(X>t) &&\text{(指数法則で約分)} \end{aligned} $$

POINT

無記憶性が意味するのは、「過去の経過が未来を予測する手がかりにならない」ということ。たとえば「もう $10$ 分待ったんだから、そろそろ来るはず」という期待は、指数分布の世界では成り立ちません。$10$ 分待った後にさらに $5$ 分待つ確率は、待ち始めの瞬間に $5$ 分待つ確率とまったく同じです。これは離散版の幾何分布(2-8)と同じ性質で、指数分布は「幾何分布の連続版」とも言えます。

さえちゃん
さえ

無記憶性、ふしぎだよね! 「もうこんなに待ったのに…」って気持ち、指数分布には通じないの。バスや故障の待ち時間がリセットされ続けるイメージ。試験では「無記憶性を持つ連続分布=指数分布」とセットで覚えておこう!

5. 結論と使いどころ

2つの分布を並べて整理しておきます。一様分布は「区間内で等確率」、指数分布は「待ち時間」。pdf の形・期待値・分散をセットで思い出せるようにしましょう。

分布 密度 $f(x)$ $E[X]$ $V[X]$
一様 $U(a,b)$ $\dfrac{1}{b-a}\ (a\le x\le b)$ $\dfrac{a+b}{2}$ $\dfrac{(b-a)^2}{12}$ まっ平らな長方形
指数 $\mathrm{Exp}(\lambda)$ $\lambda e^{-\lambda x}\ (x\ge 0)$ $\dfrac{1}{\lambda}$ $\dfrac{1}{\lambda^2}$ 右肩下がりの減衰
POINT

試験では「密度から確率を積分で求める」「$E[X]$・$V[X]$ の公式を使う」「指数分布の $P(X>x)=e^{-\lambda x}$ を使う」の3パターンが頻出です。とくに指数分布は$\lambda$ が発生率($1$ あたりの回数)で、平均は逆数 $1/\lambda$ という関係を取り違えないこと。「平均 $5$ 分なら $\lambda=1/5$」とすぐ変換できるようにしておきましょう。

まとめ

第2章 2-9、ポイントを整理します。

次回 2-10 連続分布②(正規分布・標準正規分布) では、統計学の主役・正規分布を扱います。密度の形、$E[X]=\mu$・$V[X]=\sigma^2$、標準化 $Z=\dfrac{X-\mu}{\sigma}$、そして 68-95-99.7 則と分布表の引き方まで、いよいよ推定・検定の土台が登場します。

さえちゃん
さえ

連続分布デビュー、おつかれさま! 一様は「幅で確率」、指数は「$e^{-\lambda x}$ で減衰」。$E[X]$ と $V[X]$ の公式は、一度自分の手で積分して導いてみると忘れないよ。次はいよいよ正規分布、統計の主役だよ!