第6章 6-4 / 確率

条件付確率

このページで学ぶこと

確率の世界をぐっと深いところへ進めます。条件付確率は、「ある情報が分かったあとで、別の事象が起こる確率」を扱う考え方。「世界が縮む」という感覚さえつかめれば、それまで難しく感じていた問題が、一気にクリアに見えてきます。

本ページでは、まず身近な場面からイメージを作り、ベン図で「世界が縮む」様子を可視化し、それから式の定義へ進みます。さらに、6-3で学んだ独立性が条件付確率の特殊なケースであることも見えてきます。

後半では、典型問題3問を用意しています。条件付確率は手を動かさないと身につきにくい概念。問題を通じてしっかり定着させていきましょう。

さえちゃん
さえ

条件付確率は、「式を覚える」より「イメージをつかむ」のが大事な概念! ベン図を眺めながら、ゆっくり読んでね。一度ピンとくれば、その瞬間から条件付確率は得意分野に変わるよ!

1. 条件付確率とは ─ 身近な例から

条件付確率の考え方を、まずは式抜きで、身近な場面から見ていきます。

クラスのアンケート

30人のクラスで、こんなアンケートがありました。

ここで2つの質問を考えてみます。

質問A:このクラスから無作為に1人を選んだとき、その人が「数学が好き」である確率は?

これは普通の確率の問題ですね。クラス30人のうち数学好きは合計 12 + 6 = 18人なので、18/30 = 3/5 です。

質問B:このクラスから無作為に1人を選んだら男子だった。その人が「数学が好き」である確率は?

この質問では、すでに「男子である」という情報がわかっています。男子は18人で、そのうち数学好きは12人。男子の中だけで考えれば12/18 = 2/3 となります。

「世界が縮む」

質問Aと質問Bを比べると、答えが違いますね。3/5 と 2/3。同じ「数学が好き」の確率なのに、なぜ違うのでしょうか?

理由はシンプル。質問Bでは「男子である」という情報が先に与えられたために、考える対象がクラス全体(30人)から男子だけ(18人)に縮んだからです。分母が変わったから、確率の値も変わった──これが条件付確率の本質です。

条件なし(全体) 男子18人 数学好 12人 女子12人 6人 P(数学好) = 18/30 = 3/5 男子と わかる 条件「男子」のもとで 男子18人(これが新しい全体) 数学好 12人 P(数学好|男子) = 12/18 = 2/3

「男子だとわかった」瞬間に、考える世界がクラス全体から男子18人に縮む

これが条件付確率の正体です。「ある情報がわかった瞬間に、考える世界が縮んで、その縮んだ世界の中での確率を計算する」──これさえつかめれば、難しい計算式も自然に理解できるようになります。

2. 条件付確率の式

イメージがつかめたところで、条件付確率を式できちんと定義しましょう。

記号と読み方

事象Aが起こったという条件のもとで、事象Bが起こる確率を、P(B|A) と書きます。縦棒の右側が条件、左側が知りたい事象です。「Pi、ビー、ギブン、エー」と読みます。「Aが与えられた条件下でのBの確率」という意味です。

定義の式

FORMULA

P(B|A) = P(A∩B) ÷ P(A) (ただし P(A) > 0)

この式は、先ほどのクラスの例にぴったり当てはまります。事象A=「男子である」、事象B=「数学が好き」とすると:

先ほど直感的に求めた答えと、ぴったり一致しました。式は、私たちの直感を正確に表現するための道具なんです。

式の意味をベン図で

P(B|A) = P(A∩B) ÷ P(A) という式は、ベン図を使うと「新しい全体(A)の中で、A∩Bがどのくらいの割合か」を計算していることがわかります。

U(全事象) A B A∩B 条件Aは「新しい全体」、A∩B が「Aの中でBも起きた部分」

P(B|A) = (A∩Bの広さ) ÷ (Aの広さ)。Aを新しい全体として考える

3. 一般の乗法定理

条件付確率の式を移項すると、確率の乗法定理という重要な公式が出てきます。

式の変形

P(B|A) = P(A∩B) ÷ P(A) の両辺に P(A) を掛けると、

FORMULA

P(A∩B) = P(A) × P(B|A)

これが一般の乗法定理です。「AかつBの確率は、Aの確率Aの条件下でのBの確率を掛けたもの」と読めます。

独立性との関係

ここで前回学んだ独立性を思い出してください。AとBが独立なら、P(A∩B) = P(A) × P(B) でした。

一般の乗法定理 P(A∩B) = P(A) × P(B|A) と独立な場合の式 P(A∩B) = P(A) × P(B) を比べると、独立な場合は P(B|A) = P(B) が成り立つことがわかります。

RULE

AとBが独立 ⇔ P(B|A) = P(B)
つまり「Aが起きたという条件で考えても、Bの確率は変わらない」ということ

これは独立性のもうひとつの定義とも言えます。「Aの情報がBの確率に影響しない」──6-3で学んだ独立の直感そのものですね。条件付確率を学ぶことで、独立性の意味がさらに深く理解できるようになります。

非復元抽出の例で確認

6-3の問題4で扱った非復元抽出を、条件付確率の言葉で書き直してみましょう。

EXAMPLE

袋に赤玉4個、白玉6個(合計10個)。戻さずに2回引いて両方赤の確率:

  • 事象A = 1回目に赤、事象B = 2回目に赤
  • P(A) = 4/10 = 2/5
  • P(B|A) = 3/9 = 1/3(1回目で赤を引いた条件下での2回目の確率)
  • 乗法定理:P(A∩B) = P(A) × P(B|A) = 2/5 × 1/3 = 2/15

非復元抽出で確率を「掛け算」できるのは、まさに乗法定理を使っているからです。2回目の確率は1回目の結果に依存しているので、独立な場合のように単純な掛け算ではなく、条件付確率の掛け算になっているわけですね。

POINT

独立なら P(A∩B) = P(A) × P(B)、独立でなくても P(A∩B) = P(A) × P(B|A)独立かどうかにかかわらず使える、より一般的な公式です。

4. 条件付確率を計算する流れ

条件付確率の問題を解くときは、次の流れで考えると迷いません。

  1. 条件Aと知りたい事象Bを区別する。「○○である人のうち、△△の確率」なら、○○がA、△△がB
  2. 「条件Aの世界」をイメージする。クラスから男子だけに絞る、袋から赤玉を1つ取り除いた状態にする、など
  3. その縮んだ世界の中で、Bが起こる割合を計算する

式 P(B|A) = P(A∩B) ÷ P(A) を覚えるのも大事ですが、「世界を縮める」発想のほうが大事です。式は、その発想を正確に表現する道具にすぎません。

5. 練習問題

ここからは練習問題3問。条件付確率の典型問題を解いていきましょう。問題ごとに、どのアプローチで解くかも考えながら進めてください。

問題 1 ─ クロス集計表から条件付確率

ある会社の40人を対象に、性別と通勤手段を調べたところ、次のクロス集計表が得られました。

電車 合計
男性15924
女性10616
合計251540

この会社から1人を無作為に選んだとき、次の条件付確率を求めてください。

解答を見る

(1) 男性とわかったときの電車通勤の確率

条件は「男性」、知りたい事象は「電車通勤」です。男性に絞った世界で考えます。男性は24人、そのうち電車通勤は15人なので、

P(電車|男性) = 15/24 = 5/8 = 0.625

式で書くなら、P(電車|男性) = P(男性∩電車) ÷ P(男性) = (15/40) ÷ (24/40) = 15/24。同じ結果です。

(2) 電車通勤とわかったときの女性の確率

今度は条件が「電車通勤」、知りたい事象は「女性」。電車通勤に絞った世界で考えます。電車通勤は25人、そのうち女性は10人なので、

P(女性|電車) = 10/25 = 2/5 = 0.4

条件と事象の役割を入れ替えると、答えも変わります(それぞれ別の値になる)。これも条件付確率の重要な性質です。

問題 2 ─ 袋からの非復元抽出

袋に赤玉5個、青玉3個、黄玉2個(合計10個)が入っています。袋から戻さずに2回連続で玉を取り出すとき、次の確率を求めてください。

解答を見る

(1) 1回目が赤だったときの2回目が青の条件付確率

1回目で赤を取り出した後、袋には赤4個・青3個・黄2個(合計9個)が残っています。この縮んだ世界で2回目に青を引く確率は:

P(2回目青|1回目赤) = 3/9 = 1/3

(2) 1回目赤、2回目青の確率

これは「1回目赤」という事象と「1回目赤の条件下での2回目青」を掛け合わせたものです。乗法定理を使います。

  • P(1回目赤) = 5/10 = 1/2
  • P(2回目青|1回目赤) = 1/3((1)で求めた値)

P(1回目赤∩2回目青) = 1/2 × 1/3 = 1/6 ≒ 0.167

条件付確率と乗法定理を組み合わせて使うパターンです。「○○のとき△△の確率」は条件付確率、「○○かつ△△の確率」は乗法定理、と区別してください。

問題 3 ─ 病気の検査

ある病気に関する検査について、次のことがわかっています。

検査を受けた人の中で、「病気にかかっている、かつ検査が陽性となる」確率を求めてください。

解答を見る

事象A = 病気にかかっている、事象B = 検査が陽性、とします。

  • P(A) = 0.01(病気の確率)
  • P(B|A) = 0.90(病気の人が陽性になる確率:これが条件付確率です)

求めるのは「病気かつ陽性」の確率、つまり P(A∩B)。乗法定理を使います。

P(A∩B) = P(A) × P(B|A) = 0.01 × 0.90 = 0.009 = 0.9%

全体の0.9%が「病気かつ陽性」となるわけです。

この問題には実は続きがあります。「検査で陽性となった人のうち、本当に病気である確率は?」──これを求めるのは、次回学ぶベイズの定理の出番です。検査が陽性でも、必ずしも病気とは限らない。その仕組みを次回じっくり見ていきます。

まとめ

第6章4回目の本ページ、ポイントを整理しておきましょう。

次回はいよいよベイズの定理。条件付確率を発展させた、現代のデータサイエンスでも欠かせない重要な定理です。問題3の検査の話、その続きを一緒に見ていきましょう。

さえちゃん
さえ

条件付確率、イメージはつかめたかな? 「世界が縮む」──この感覚さえ忘れなければ、もう怖くありません! 次回はベイズの定理、検査が陽性でも病気じゃないかも?という不思議な世界に入っていきます。