「サイコロの出目が偶数だった」と聞いた瞬間、6が出ている確率はどう変わるでしょうか?
情報が加わることで確率が変化する -- この現象を数学的に扱うのが条件付き確率です。
医療検査の精度から犯罪捜査のDNA鑑定まで、現代社会に不可欠な概念を学びましょう。
ある試行で、2つの事象 $A$, $B$ を考えます。 事象 $A$ が起こったことがわかっているとき、事象 $B$ が起こる確率を 「$A$ が起こったときの $B$ の条件付き確率」と呼び、$P_A(B)$ で表します。
$P(A) \neq 0$ のとき
$$P_A(B) = \frac{P(A \cap B)}{P(A)}$$サイコロを1回振ります。出目が偶数(事象 $A$)であったことがわかったとき、 出目が6(事象 $B$)である確率を求めましょう。
$A = \{2, 4, 6\}$、$B = \{6\}$ なので $A \cap B = \{6\}$。
$$P_A(B) = \frac{P(A \cap B)}{P(A)} = \frac{\frac{1}{6}}{\frac{3}{6}} = \frac{1}{3}$$何の情報もなければ6が出る確率は $\frac{1}{6}$ ですが、「偶数だった」と聞いた瞬間、 確率は $\frac{1}{3}$ に上がりました。候補が $\{1, 2, 3, 4, 5, 6\}$ から $\{2, 4, 6\}$ の3つに絞られたからです。
条件付き確率の本質は、全事象(標本空間)を $A$ に置き換えることです。
通常の確率では全事象 $U$ が「舞台」ですが、「$A$ が起こった」とわかった瞬間、考えるべき世界は $U$ 全体ではなく $A$ だけに縮小します。
その縮小された世界 $A$ の中で、$B$ が占める割合が $P_A(B)$ です。だから
$$P_A(B) = \frac{A \text{の中の}B\text{の割合}}{A\text{全体}} = \frac{P(A \cap B)}{P(A)}$$
この「標本空間の縮小」こそが、条件付き確率の核心です。
これは条件付き確率で最も多い間違いです。
✕ 誤:「$A$ かつ $B$」の確率と「$A$ のもとでの $B$」の確率は同じ
○ 正:$P(A \cap B)$ は全体に対する割合、$P_A(B)$ は $A$ に対する割合。全く異なる。
上のサイコロの例で確認しましょう:
・$P(A \cap B) = P(\{6\}) = \frac{1}{6}$(全6通り中、偶数かつ6は1通り)
・$P_A(B) = \frac{1}{3}$(偶数3通り中、6は1通り)
分母が違います。$P(A \cap B)$ の分母は全事象、$P_A(B)$ の分母は事象 $A$。
問題文に「出目が偶数であるとき」「合格品であることがわかったとき」のような表現があれば、それは条件付き確率を求めよという指示です。
✕ 誤:「偶数であるとき、6が出る確率」を $P(B) = \frac{1}{6}$ と答える
○ 正:「であるとき」は条件付き確率の合図。$P_A(B) = \frac{P(A \cap B)}{P(A)} = \frac{1}{3}$
大学の確率論では、条件付き確率 $P_A(\cdot)$ が通常の確率と同じ公理(非負性、正規化、加法性)を満たすことを証明します。つまり、$P_A(\cdot)$ は $A$ を全事象とした新しい確率測度です。
$P_A(A) = 1$($A$ の中で $A$ は確実に起こる)、$P_A(\emptyset) = 0$、排反な事象に対する加法性もすべて成り立ちます。条件付き確率は「世界を縮小した上で、通常の確率を考え直す」ことに他ならないのです。
条件付き確率を直感的に理解するために、表を使った例で考えてみましょう。
ある学校の生徒90人が、定員45人のバスX, Yに分かれて乗ります。 男子・女子の人数は以下の通りです。
| 男子 | 女子 | 計 | |
|---|---|---|---|
| バスX | 23 | 22 | 45 |
| バスY | 27 | 18 | 45 |
| 計 | 50 | 40 | 90 |
90人から無作為に1人を選ぶとき、以下を比較してみましょう。
問1:「選ばれた生徒が女子である確率」
→ $P(B) = \frac{40}{90} = \frac{4}{9}$(全体90人中、女子は40人)
問2:「選ばれた生徒がバスXに乗っていたとき、女子である確率」
→ $P_A(B) = \frac{22}{45}$(バスXの45人中、女子は22人)
問2では「バスXに乗っていた」という情報で、考える範囲が90人 → 45人に縮小しています。 $\frac{4}{9} \approx 0.444$ と $\frac{22}{45} \approx 0.489$ で、値が変わっています。
条件付き確率の計算は、次の2つの方法のどちらでもできます。
方法1(定義式):$P_A(B) = \dfrac{P(A \cap B)}{P(A)}$
方法2(場合の数):各根元事象が同様に確からしいとき、$P_A(B) = \dfrac{n(A \cap B)}{n(A)}$
方法2のほうが直感的です。$A$ の中にいくつの場合があり、そのうち $B$ に該当するのはいくつか。これが条件付き確率です。
条件付き確率 $P_A(B)$ で、$A$ が $B$ より先に起きる必要はありません。
たとえば「不良品であった(事象 $B$)ことがわかったとき、それがA工場の製品である(事象 $A$)確率」では、 製造($A$)は検査($B$)より先に起きていますが、確率を求めるのは $P_B(A)$ です。
条件付き確率は「情報の順序」であって、「時間の順序」ではありません。 「何がわかっているか」=「何を全事象にするか」で考えましょう。
「不良品だったとき、A工場の製品である確率」→ $P_{\text{不良}}(A)$ です。
✕ 誤:$P_A(\text{不良})$(A工場の製品のうち不良品の確率)と取り違える
○ 正:$P_{\text{不良}}(A)$(不良品のうちA工場の製品の確率)
「〜であるとき」の部分が条件(分母)、「〜である確率」の部分が求めるもの(分子の一部)です。 日本語の文章構造を正確に読み取りましょう。
条件付き確率の定義式を変形すると、非常に重要な等式が得られます。
条件付き確率の定義式 $P_A(B) = \dfrac{P(A \cap B)}{P(A)}$ の両辺に $P(A)$ を掛けると
$$P(A) \cdot P_A(B) = P(A \cap B)$$
すなわち $P(A \cap B) = P(A) \cdot P_A(B)$
これが乗法定理です。定義式そのものの変形なので、新しい定理というよりは「条件付き確率の定義を言い換えたもの」です。
乗法定理 $P(A \cap B) = P(A) \cdot P_A(B)$ は、複雑な事象の確率を2段階に分解して計算するための道具です。
第1段階:まず $A$ が起こる(確率 $P(A)$)
第2段階:$A$ が起きたもとで $B$ が起こる(確率 $P_A(B)$)
この2段階の確率の積が「$A$ かつ $B$」の確率です。非復元抽出のように「前の結果で後の確率が変わる」場合に威力を発揮します。
10本のくじの中に当たり3本が入っています。a, b の2人がこの順に1本ずつ引きます(引いたくじは戻さない)。
問1:a が当たり、b も当たりを引く確率は?
a が当たりを引く事象を $A$、b が当たりを引く事象を $B$ とすると、乗法定理より
$$P(A \cap B) = P(A) \cdot P_A(B) = \frac{3}{10} \times \frac{2}{9} = \frac{6}{90} = \frac{1}{15}$$$P_A(B) = \frac{2}{9}$ の理由:a が当たりを引いた後は、残り9本中2本が当たり。
問2:b が当たりを引く確率は?(a の結果に関係なく)
$B = (A \cap B) \cup (\bar{A} \cap B)$ と分解すると
$$P(B) = P(A) \cdot P_A(B) + P(\bar{A}) \cdot P_{\bar{A}}(B) = \frac{3}{10} \times \frac{2}{9} + \frac{7}{10} \times \frac{3}{9} = \frac{6}{90} + \frac{21}{90} = \frac{27}{90} = \frac{3}{10}$$驚くべきことに、b が当たりを引く確率は a と同じ $\frac{3}{10}$ です。 くじ引きは引く順番に関係なく公平 -- これは乗法定理から証明できる重要な事実です。
✕ 誤:「a が当たり、b も当たり」の確率を $\frac{3}{10} \times \frac{3}{10}$ と計算する
○ 正:くじを戻さないので、b が引くときの条件は a の結果に依存する。$\frac{3}{10} \times \frac{2}{9}$
独立な試行なら $P(A \cap B) = P(A) \cdot P(B)$ ですが、非復元抽出は独立ではないため、乗法定理 $P(A \cap B) = P(A) \cdot P_A(B)$ を使う必要があります。
大学の確率論では、2つの事象 $A, B$ が独立であることを $P(A \cap B) = P(A) \cdot P(B)$ と定義します(高校では「互いに影響しない」という直感的な説明)。
独立のとき $P_A(B) = P(B)$($A$ の情報は $B$ の確率を変えない)であり、乗法定理は $P(A \cap B) = P(A) \cdot P(B)$ に簡略化されます。
逆に言えば、$P_A(B) \neq P(B)$ のとき $A$ と $B$ は独立ではなく、$A$ の情報が $B$ の確率を変えている。条件付き確率は「独立からのずれ」を測る道具でもあるのです。
「不良品が見つかった。それはどの工場で作られたものか?」
「検査で陽性反応が出た。本当に感染しているのか?」
このように、結果から原因を推定する問題に使うのがベイズの定理です。
事象 $B$ が起きたもとで、その「原因」が $A$ であった確率 $P_B(A)$ を求めたいとします。
$P(A \cap B)$ は2通りに分解できます。
これらが等しいので $P(B) \cdot P_B(A) = P(A) \cdot P_A(B)$。両辺を $P(B)$ で割ると
「原因」が $A$ か $\bar{A}$ のいずれかであるとき、$B$ が起こる確率は
$$P(B) = P(A) \cdot P_A(B) + P(\bar{A}) \cdot P_{\bar{A}}(B)$$
これを全確率の公式と呼びます。原因が $A_1, A_2, \ldots, A_m$ の $m$ 個に分かれる場合は
$$P(B) = \sum_{i=1}^{m} P(A_i) \cdot P_{A_i}(B)$$
この公式は「$B$ が起こる経路をすべて足し上げる」ものです。
A工場の製品には2%、B工場の製品には6%の不良品が出ます。 A工場から50個、B工場から100個を混ぜて、1個を取り出したところ不良品でした。 それがA工場の製品である確率を求めましょう。
$A$:A工場の製品、$D$:不良品 とします。
$P(A) = \frac{50}{150} = \frac{1}{3}$、$P(\bar{A}) = \frac{100}{150} = \frac{2}{3}$
$P_A(D) = 0.02$(A工場の不良率)、$P_{\bar{A}}(D) = 0.06$(B工場の不良率)
全確率の公式で $P(D)$ を求めると
$$P(D) = \frac{1}{3} \times 0.02 + \frac{2}{3} \times 0.06 = \frac{0.02}{3} + \frac{0.12}{3} = \frac{0.14}{3}$$ベイズの定理より
$$P_D(A) = \frac{P(A) \cdot P_A(D)}{P(D)} = \frac{\frac{1}{3} \times 0.02}{\frac{0.14}{3}} = \frac{0.02}{0.14} = \frac{1}{7}$$A工場は全体の $\frac{1}{3}$ を占めていますが、不良率が低い(2%)ため、 不良品がA工場から来た確率は $\frac{1}{7} \approx 14.3\%$ と、元の $\frac{1}{3} \approx 33.3\%$ よりも低くなります。 「不良品だった」という情報が、A工場の可能性を下げたのです。
ベイズの定理の本質は、新しい情報を得たときに、確率を更新する仕組みです。
事前確率 $P(A) = \frac{1}{3}$(情報なしでの確率)
↓ 「不良品だった」という情報
事後確率 $P_D(A) = \frac{1}{7}$(情報を得た後の確率)
情報によって確率が変わる。これがベイズの定理の力です。
「A工場の製品が不良品である確率 $P_A(D) = 0.02$」と「不良品がA工場の製品である確率 $P_D(A) = \frac{1}{7}$」は全く異なる値です。
✕ 誤:$P_A(D) = P_D(A)$ と思ってしまう
○ 正:一般に $P_A(B) \neq P_B(A)$。条件と結論を入れ替えると値が変わる
これを混同する誤りは「基準率の無視」とも呼ばれ、日常でも頻繁に起こります。医療検査で「検査の精度99%」と「陽性反応者が本当に感染している確率」は全くの別物です。
ベイズの定理を基礎としたベイズ統計学は、現代の人工知能(AI)や機械学習の重要な柱です。スパムメールの判定、音声認識、自動翻訳など、多くの技術がベイズの定理に基づいています。
ベイズ統計学では、データ(観測結果)が得られるたびに確率を更新し続けます。高校で学ぶ「原因の確率」は、この壮大な理論の入口に過ぎません。
なお、ベイズの定理はトーマス・ベイズ(1702-1761)というイギリスの牧師が発見したもので、彼の死後にラプラスが一般化しました。確率論の歴史の中でも最も影響力のある定理の1つです。
条件付き確率に関する問題パターンを整理しましょう。
| パターン | 問題の特徴 | 解法のポイント |
|---|---|---|
| A:定義の直接適用 | $P_A(B)$ を直接求める | $P_A(B) = \frac{P(A \cap B)}{P(A)}$ または $\frac{n(A \cap B)}{n(A)}$ |
| B:乗法定理 | $P(A \cap B)$ を求める | $P(A \cap B) = P(A) \cdot P_A(B)$ で段階的に計算 |
| C:非復元抽出 | くじを戻さない抽出 | 乗法定理で段階的に確率を掛ける |
| D:原因の確率 | 結果から原因を推定 | ベイズの定理。全確率の公式で分母を計算 |
| E:検査の精度 | 陽性反応の信頼性 | パターンDの応用。基準率に注意 |
Q1. 条件付き確率 $P_A(B)$ を、$P(A)$ と $P(A \cap B)$ を用いた式で書いてください。また、この式の「本質的な意味」を一言で述べてください。
Q2. $P(A \cap B)$ と $P_A(B)$ の違いを、サイコロの例を用いて説明してください。
Q3. 確率の乗法定理を書き、独立な試行の場合にどう簡略化されるか述べてください。
Q4. ベイズの定理の式を書いてください。「事前確率」と「事後確率」はそれぞれどの部分ですか?
Q5. 10本中3本が当たりのくじを、a, b がこの順に1本ずつ引く(戻さない)。b が当たりを引く確率はいくらですか?
条件付き確率に関する入試形式の問題で実力を確認しましょう。
2個のサイコロを同時に振る。出る目の和が8であったとき、少なくとも一方が2である条件付き確率を求めよ。
$\dfrac{2}{5}$
方針:条件付き確率の定義を適用する。場合の数で直接求めるのが簡単。
$A$:出目の和が8、$B$:少なくとも一方が2 とする。
$A = \{(2,6), (3,5), (4,4), (5,3), (6,2)\}$ より $n(A) = 5$
$A \cap B = \{(2,6), (6,2)\}$ より $n(A \cap B) = 2$
$P_A(B) = \frac{n(A \cap B)}{n(A)} = \frac{2}{5}$
袋Aには白球5個・黒球4個、袋Bには白球5個・黒球3個が入っている。袋Aから2個の球を同時に取り出して袋Bに入れた後、袋Bから2個の球を同時に取り出すとき、2個とも白球である確率を求めよ。
$\dfrac{43}{180}$
方針:袋Aから取り出す白球の個数で場合分けし、各場合について乗法定理を使う。
袋Aから取り出す2個のうち白球の個数を $k$($k = 0, 1, 2$)とする。
$k = 0$(白0個・黒2個)のとき:
・袋Aから黒2個を取る確率:$\frac{{}_4C_2}{{}_9C_2} = \frac{6}{36} = \frac{1}{6}$
・袋B(白5・黒5の計10個)から白2個を取る確率:$\frac{{}_5C_2}{{_{10}C_2}} = \frac{10}{45} = \frac{2}{9}$
・この場合の確率:$\frac{1}{6} \times \frac{2}{9} = \frac{2}{54}$
$k = 1$(白1個・黒1個)のとき:
・確率:$\frac{{}_5C_1 \cdot {}_4C_1}{{}_9C_2} = \frac{20}{36} = \frac{5}{9}$
・袋B(白6・黒4の計10個)から白2個:$\frac{{}_6C_2}{{_{10}C_2}} = \frac{15}{45} = \frac{1}{3}$
・この場合の確率:$\frac{5}{9} \times \frac{1}{3} = \frac{5}{27}$
$k = 2$(白2個・黒0個)のとき:
・確率:$\frac{{}_5C_2}{{}_9C_2} = \frac{10}{36} = \frac{5}{18}$
・袋B(白7・黒3の計10個)から白2個:$\frac{{}_7C_2}{{_{10}C_2}} = \frac{21}{45} = \frac{7}{15}$
・この場合の確率:$\frac{5}{18} \times \frac{7}{15} = \frac{35}{270} = \frac{7}{54}$
合計:$\frac{2}{54} + \frac{5}{27} + \frac{7}{54} = \frac{2}{54} + \frac{10}{54} + \frac{7}{54} = \frac{19}{54}$
検算:通分して $\frac{2 + 10 + 7}{54} = \frac{19}{54}$
修正計算:$\frac{1}{6} \times \frac{2}{9} = \frac{2}{54}$、$\frac{5}{9} \times \frac{1}{3} = \frac{5}{27} = \frac{10}{54}$、$\frac{5}{18} \times \frac{7}{15} = \frac{7}{54}$
合計 $\frac{19}{54}$
3つの袋A, B, Cがある。袋Aには白球3個・赤球2個、袋Bには白球2個・赤球3個、袋Cには白球4個・赤球1個が入っている。3つの袋から無作為に1つの袋を選び、その袋から1個の球を取り出したところ白球であった。それが袋Aから取り出された確率を求めよ。
$\dfrac{1}{3}$
方針:ベイズの定理(原因の確率)。白球を取り出す経路を全確率の公式で求める。
$A, B, C$:それぞれの袋を選ぶ事象、$W$:白球を取り出す事象
$P(A) = P(B) = P(C) = \frac{1}{3}$
$P_A(W) = \frac{3}{5}$, $P_B(W) = \frac{2}{5}$, $P_C(W) = \frac{4}{5}$
全確率の公式より
$P(W) = \frac{1}{3} \times \frac{3}{5} + \frac{1}{3} \times \frac{2}{5} + \frac{1}{3} \times \frac{4}{5} = \frac{1}{3} \times \frac{9}{5} = \frac{3}{5}$
ベイズの定理より
$P_W(A) = \frac{P(A) \cdot P_A(W)}{P(W)} = \frac{\frac{1}{3} \times \frac{3}{5}}{\frac{3}{5}} = \frac{\frac{1}{5}}{\frac{3}{5}} = \frac{1}{3}$
ある地域の住民のうち、ウイルスXに感染している人の割合は0.1%である。ウイルスXの検査について、次のことがわかっている。
この地域の住民から無作為に1人を選んで検査したところ、陽性と判定された。この人が実際に感染している確率を求めよ。
$\dfrac{99}{2097} \approx 0.0472$(約4.7%)
方針:ベイズの定理で事後確率を求める。
$I$:感染している事象、$T$:陽性と判定される事象
$P(I) = 0.001$, $P(\bar{I}) = 0.999$
$P_I(T) = 0.99$(感度), $P_{\bar{I}}(T) = 0.02$(偽陽性率)
全確率の公式より
$P(T) = P(I) \cdot P_I(T) + P(\bar{I}) \cdot P_{\bar{I}}(T)$
$= 0.001 \times 0.99 + 0.999 \times 0.02$
$= 0.00099 + 0.01998 = 0.02097$
ベイズの定理より
$P_T(I) = \frac{P(I) \cdot P_I(T)}{P(T)} = \frac{0.00099}{0.02097} = \frac{99}{2097} = \frac{33}{699} = \frac{11}{233}$
$\approx 0.0472$(約4.7%)
検査の精度(感度99%)にもかかわらず、陽性と判定された人が実際に感染している確率はわずか約4.7%です。これは感染率(基準率)が0.1%と非常に低いため、非感染者の偽陽性の人数が感染者の真陽性の人数を圧倒的に上回るからです。