事象と確率 — 標本空間・確率の3公理・加法定理
いよいよ第2章「確率と確率分布」に入ります。第1章では手元のデータを要約してきましたが、ここからは「まだ起きていないことを数で扱う」確率の世界です。3級でも確率には触れましたが、2級では標本空間 $\Omega$ という土台をきちんと置き、確率が満たすべき3つの公理から出発して、加法定理や余事象の公式を「公理から導く」形でつかみ直します。
暗記していた公式が「なぜそうなるのか」に変わると、応用問題で迷わなくなります。ベン図を眺めつつ、サイコロやトランプの数値例で確かめながら、ゆっくり進めていきましょう。ここで整えた言葉づかいが、次の条件付き確率やベイズの定理の土台になります。
第2章のスタート! 3級で習った和事象や余事象が、2級では「公理から導かれる性質」として見えてくるよ。新しい記号 $\Omega$(オメガ)も出てくるけど、ベン図と一緒ならこわくない。ゆっくりいこう!
1. 標本空間と事象 — 確率を考える舞台
確率を語るには、まず「何を考えているのか」をはっきり決める必要があります。その舞台が標本空間です。
試行・標本点・標本空間
結果がいくつか考えられて、やってみるまでどれが起こるか分からない行為を試行(しこう、trial)と呼びます。サイコロを1回振る、コインを投げる、トランプを1枚引く、などです。試行の結果としてこれ以上分けられない一つひとつを標本点(ひょうほんてん、根本事象ともいう)、その標本点をすべて集めたものを標本空間(ひょうほんくうかん、sample space)といい、記号 $\Omega$(オメガ)で表します。
サイコロを1回振る試行なら、標本空間は $$\Omega = \{1,\,2,\,3,\,4,\,5,\,6\}$$ 標本点は $1,2,\dots,6$ の6個。$\Omega$ は確率計算の分母を支える、いちばん大事な集合です。
事象
事象(じしょう、event)とは、標本空間 $\Omega$ の部分集合のことです。たとえばサイコロで「偶数が出る」は $\{2,4,6\}$、「5以上が出る」は $\{5,6\}$ という、$\Omega$ の一部分。事象は「起こりうる事柄のまとまり」を集合として表したもの、と覚えておきましょう。$\Omega$ 全体も一つの事象(必ず起こる事象=全事象)、何も含まない空集合 $\varnothing$ も一つの事象(絶対に起こらない事象=空事象)です。
2. 事象の演算 — ベン図で整理する
事象は集合なので、集合の演算(和・積・補集合)がそのまま使えます。ベン図──四角形 $\Omega$ の中に円で事象を描く図──で見ると、関係が一目でつかめます。
和事象 $A \cup B$
和事象(union)$A \cup B$ は、「$A$ または $B$ の少なくとも一方が起こる」事象です。「AカップB」とも「AユニオンB」とも読みます。サイコロで $A=\{2,4,6\}$(偶数)、$B=\{5,6\}$(5以上)なら、$A\cup B=\{2,4,5,6\}$ です。
和事象 A∪B:AとBのどちらか(または両方)に含まれる領域
積事象 $A \cap B$
積事象(intersection)$A \cap B$ は、「$A$ と $B$ が同時に起こる」事象です。「Aキャップ B」と読みます。先の例なら、偶数かつ5以上なので $A\cap B=\{6\}$ となります。
積事象 A∩B:AとBの両方に同時に含まれる領域(重なり部分)
余事象 $A^c$
余事象(complement)$A^c$ は、「$A$ が起こらない」事象、つまり $\Omega$ から $A$ を取り除いた残り全部です。$\bar{A}$ とも書きます。$A=\{2,4,6\}$(偶数)なら、$A^c=\{1,3,5\}$(奇数)です。
余事象 Aᶜ:Aの外側、つまり「Aではない」領域すべて
排反(互いに素)
2つの事象 $A,\,B$ が排反(はいはん、mutually exclusive)であるとは、「同時には起こらない」こと、すなわち $$A \cap B = \varnothing$$ が成り立つことをいいます。集合の言葉では互いに素とも呼びます。ベン図では2つの円が重ならない状態です。「偶数が出る」と「奇数が出る」は排反、というのが典型例です。
排反な事象 A と B:重なる領域がない(同時には起こらない)
用語まとめ表
| 用語 | 記号 | 意味 | サイコロでの例 |
|---|---|---|---|
| 標本空間 | $\Omega$ | 標本点すべての集まり | {1,2,3,4,5,6} |
| 事象 | $A,\,B,\dots$ | $\Omega$ の部分集合 | 偶数 = {2,4,6} |
| 和事象 | $A\cup B$ | AまたはB(片方or両方) | 偶数または5以上 = {2,4,5,6} |
| 積事象 | $A\cap B$ | AとBが同時に起こる | 偶数かつ5以上 = {6} |
| 余事象 | $A^c$ | Aが起こらない | 偶数の余事象 = {1,3,5} |
| 排反 | $A\cap B=\varnothing$ | 同時には起こらない関係 | 偶数と奇数 |
| 空事象 | $\varnothing$ | 絶対に起こらない | 「7が出る」 |
3. 確率の3つの定義
用語が整ったので、確率そのものに入ります。「確率とは何か」には、歴史的に3つの答えが積み重なってきました。3級でも触れた内容ですが、2級では3つ目の公理的確率を起点に据えるので、ここで改めて並べておきます。
古典的確率
古典的確率(classical probability)は、すべての標本点が「同様に確からしい」(等しい可能性で起こる)ときに使える、いちばん素朴な定義です。$n(\cdot)$ で集合の要素数(場合の数)を表すと、
$$P(A) = \frac{n(A)}{n(\Omega)} = \frac{\text{事象 } A \text{ の場合の数}}{\text{標本空間 } \Omega \text{ の場合の数}}$$ 前提:すべての標本点が同様に確からしいこと。
歪みのないサイコロで「偶数が出る」確率なら $P(A)=n(\{2,4,6\})/n(\Omega)=3/6=1/2$。数えれば求まるのが強みですが、「明日の降水確率」のように標本点を等確率に分けられない場面では使えません。
頻度確率
頻度確率(frequency probability、統計的確率)は、試行を多数回くり返したときの相対頻度の極限として確率を定める考え方です。試行を $N$ 回行って $A$ が $r$ 回起きたなら、$P(A)$ を $r/N$ の $N\to\infty$ での極限とみなします。打率・不良品率・事故率など、データから確率を推定する現代統計の中心的な発想で、背景には「くり返すほど相対頻度が真の確率に近づく」という大数の法則があります(詳しくは第2章後半で扱います)。
公理的確率
古典的・頻度のどちらも、適用できない場面がありました。これらをまとめて包む現代的な定義が公理的確率(axiomatic probability)です。1933年にコルモゴロフが確立しました。発想が斬新で、「確率とは何か」を直接定義せず、確率が満たすべきルール(公理)だけを決めるのです。次の節で、その3公理を見ていきます。
4. 確率の3公理
標本空間 $\Omega$ の各事象 $A$ に実数 $P(A)$ を対応させる関数 $P$ が、次の3つを満たすとき、$P$ を確率と呼びます。
公理1(非負性):任意の事象 $A$ について $P(A)\ge 0$
公理2(全確率):$P(\Omega)=1$
公理3(加法性):$A\cap B=\varnothing$(排反)ならば $P(A\cup B)=P(A)+P(B)$
意味はどれも素朴です。確率はマイナスにならない(公理1)、「何かが必ず起こる」確率は1(公理2)、重ならない事象の確率は足してよい(公理3)。すごいのは、この3つだけから確率の性質がすべて導けること。以下、その代表として余事象の公式と加法定理を、公理から導いてみます。
ここからが2級っぽいところ! 3級では「公式」として覚えた余事象や加法定理を、3つの公理から組み立ててみるよ。一度自分で導けると、もう忘れないし、応用問題でも迷わなくなるんだ。
5. 余事象の公式 $P(A^c)=1-P(A)$(導出)
まずは使う頻度の高い余事象の公式から。「$A$ が起こる確率」より「$A$ が起こらない確率」のほうが数えやすい場面は多く、これは強力な近道になります。
$$ \begin{aligned} A \cup A^c &= \Omega &&\text{($A$ とその外側を合わせると全体)}\\[2pt] A \cap A^c &= \varnothing &&\text{($A$ とその外側は同時に起きない=排反)}\\[2pt] P(A) + P(A^c) &= P(A \cup A^c) &&\text{(排反なので公理3を適用)}\\[2pt] &= P(\Omega) = 1 &&\text{(公理2)}\\[2pt] \therefore\quad P(A^c) &= 1 - P(A) \end{aligned} $$
使ったのは「排反なら足せる(公理3)」と「全体は1(公理2)」だけ。たったこれだけで、暗記していた $P(A^c)=1-P(A)$ がきちんと出てきました。ついでに、$A=\Omega$ とすれば $A^c=\varnothing$ なので $P(\varnothing)=1-P(\Omega)=0$、つまり空事象の確率は0もわかります。
サイコロを2回振るとき、「少なくとも1回は6が出る」確率は? まともに数えると場合分けが面倒ですが、余事象「1回も6が出ない」を使うと一発です。
1回で6が出ない確率は $5/6$ なので、2回とも出ない確率は $\left(\dfrac{5}{6}\right)^2=\dfrac{25}{36}$。よって $$P(\text{少なくとも1回は6}) = 1 - \frac{25}{36} = \frac{11}{36} \approx 0.306$$
6. 加法定理 $P(A\cup B)=P(A)+P(B)-P(A\cap B)$(導出)
公理3は「排反なら足せる」でしたが、重なりがあるときはどうなるのか。ここを埋めるのが加法定理です。直感的には、$P(A)+P(B)$ と単純に足すと重なり $A\cap B$ を2回数えてしまうので、最後に1回引いて帳尻を合わせる、という話。これを公理から確かめます。
準備:3つの排反なかたまりに分ける
下のベン図のように、$A\cup B$ は互いに排反な3つの部分に分かれます。「$A$ だけ」($A\cap B^c$)、「重なり」($A\cap B$)、「$B$ だけ」($A^c\cap B$)の3つです。
重なりを1回だけ数えるために、A∪Bを排反な3領域に分解する
導出
$A\cup B$ を排反な3部分に、$A$ と $B$ を排反な2部分に分けて、それぞれ公理3で足します。 $$ \begin{aligned} P(A\cup B) &= P(A\cap B^c) + P(A\cap B) + P(A^c\cap B) &&\text{(排反な3領域の和)}\\[2pt] P(A) &= P(A\cap B^c) + P(A\cap B) &&\text{($A$ を「だけ」と「重なり」に分割)}\\[2pt] P(B) &= P(A^c\cap B) + P(A\cap B) &&\text{($B$ を「だけ」と「重なり」に分割)} \end{aligned} $$ 下の2式を足すと $$ \begin{aligned} P(A)+P(B) &= P(A\cap B^c) + P(A^c\cap B) + 2\,P(A\cap B)\\[2pt] &= \underbrace{\big[P(A\cap B^c)+P(A\cap B)+P(A^c\cap B)\big]}_{=\,P(A\cup B)} + P(A\cap B)\\[2pt] &= P(A\cup B) + P(A\cap B) \end{aligned} $$ 移項して $$P(A\cup B) = P(A) + P(B) - P(A\cap B)$$
$P(A)+P(B)$ には重なり $P(A\cap B)$ が2回含まれているのに対し、$P(A\cup B)$ には1回しか入っていない。その差を最後に引く──これが「$-P(A\cap B)$」の正体です。なお $A,\,B$ が排反なら $A\cap B=\varnothing$ で $P(A\cap B)=0$ となり、$P(A\cup B)=P(A)+P(B)$。これはまさに公理3そのものです。加法定理は公理3を一般化した式だ、と言えます。
$$P(A\cup B) = P(A) + P(B) - P(A\cap B)$$ 排反のとき($A\cap B=\varnothing$)は $\;P(A\cup B)=P(A)+P(B)$。
7. 数値例で確かめる
サイコロを1回振る。$A=$「偶数」$=\{2,4,6\}$、$B=$「5以上」$=\{5,6\}$ のとき $P(A\cup B)$ は?
$P(A)=\dfrac{3}{6}=\dfrac{1}{2}$、$P(B)=\dfrac{2}{6}=\dfrac{1}{3}$、共通は $\{6\}$ なので $P(A\cap B)=\dfrac{1}{6}$。加法定理より $$P(A\cup B) = \frac{1}{2} + \frac{1}{3} - \frac{1}{6} = \frac{3+2-1}{6} = \frac{4}{6} = \frac{2}{3}$$ 実際 $A\cup B=\{2,4,5,6\}$ は4個なので $4/6=2/3$。ぴったり一致します。
ジョーカーを除く52枚から1枚引く。$A=$「ハート」(13枚)、$B=$「絵札 J,Q,K」(各スート3枚 × 4スート=12枚)のとき、「ハートまたは絵札」の確率は?
$P(A)=\dfrac{13}{52}$、$P(B)=\dfrac{12}{52}$。重なり「ハートの絵札」は J,Q,K の3枚なので $P(A\cap B)=\dfrac{3}{52}$。よって $$P(A\cup B) = \frac{13}{52} + \frac{12}{52} - \frac{3}{52} = \frac{22}{52} = \frac{11}{26} \approx 0.423$$ 重なり(ハートの絵札3枚)を引かないと、その3枚を二重に数えてしまいます。ここが加法定理の勘どころです。
サイコロ1回で $A=$「1か2」、$B=$「3か4」は排反(共通なし)。$P(A\cup B)=P(A)+P(B)=\dfrac{2}{6}+\dfrac{2}{6}=\dfrac{4}{6}=\dfrac{2}{3}$。 また「5でも6でもない」確率は、余事象「5か6」を使って $1-\dfrac{2}{6}=\dfrac{4}{6}=\dfrac{2}{3}$ とすぐ出ます。
8. まとめ
第2章 2-1、ポイントを整理します。
- 標本空間 $\Omega$:標本点すべての集合。事象はその部分集合
- 事象の演算:和 $A\cup B$、積 $A\cap B$、余 $A^c$、排反 $A\cap B=\varnothing$、空事象 $\varnothing$
- 確率の3定義:古典的(場合の数)・頻度(相対頻度の極限)・公理的(ルールから定義)
- 3公理:① $P(A)\ge 0$、② $P(\Omega)=1$、③ 排反なら $P(A\cup B)=P(A)+P(B)$
- 余事象:$P(A^c)=1-P(A)$(公理2・3から導出。$P(\varnothing)=0$ も同様)
- 加法定理:$P(A\cup B)=P(A)+P(B)-P(A\cap B)$(重なりの二重計上を1回引く)
次回 2-2 条件付き確率と乗法定理 では、「ある情報が分かったあとの確率」を扱います。$P(A\cap B)$ をどう計算するか、という今日の積事象の話が、そこで主役になります。
おつかれさま! 今日の主役は「3公理から余事象と加法定理を導く」ところ。式の暗記じゃなくて、$P(A^c)=1-P(A)$ と $P(A\cup B)=P(A)+P(B)-P(A\cap B)$ を一度自分の手で導いてみてね。次は条件付き確率だよ!