M-12-1 確率の公理的定義 ─ コルモゴロフの3つの公理

1高校での扱い ─ 場合の数の比としての確率

高校数学Aでは、確率を次のように定義します。ある試行において、起こりうるすべての結果が $n$ 通りあり、それらが同様に確からしいとき、事象 $A$ の起こる場合の数が $a$ 通りならば、

$$P(A) = \frac{a}{n}$$

と定めます。この定義を使って、高校では次のような公式を学びます。

加法定理：$A$ と $B$ が互いに排反のとき、$P(A \cup B) = P(A) + P(B)$
余事象の確率：$P(\overline{A}) = 1 - P(A)$
一般の加法定理：$P(A \cup B) = P(A) + P(B) - P(A \cap B)$
条件付き確率：$P_A(B) = \dfrac{P(A \cap B)}{P(A)}$

これらの公式は、場合の数を数えれば自然に導けます。たとえば加法定理は、$A$ と $B$ が排反（共通部分がない）なら場合の数を足せばよいという事実そのものです。

この枠組みは、サイコロ、コイン、カード、くじ引きなど、有限個の結果が同様に確からしい場面では問題なく機能します。しかし、次のような場面ではどうでしょうか。

「$0$ 以上 $1$ 以下の実数を一つ無作為に選ぶ」とき、$0.5$ が選ばれる確率はどう定義するか（場合の数は無限にある）
ゆがんだサイコロのように、各目の出やすさが異なる場合の確率はどう定義するか（「同様に確からしい」が成り立たない）

これらの問いに答えるには、確率の定義を「場合の数の比」から解き放ち、より一般的な枠組みで捉え直す必要があります。次のセクションでは、大学数学がこの問題にどう対処するかを見ていきます。

2大学の視点 ─ 公理から確率論を建てる

大学数学では、確率を「場合の数の比」という特定の計算方法ではなく、確率が満たすべき性質から定義します。 1933年にロシアの数学者コルモゴロフ（A. N. Kolmogorov）は、確率が従うべき最小限のルールを3つの公理として定式化しました。この公理的アプローチにより、高校で学ぶ公式はすべて「公理からの帰結」として統一的に導出できます。

高校 vs 大学：確率をどう定義するか

高校：場合の数の比で定義する
$P(A) = \dfrac{a}{n}$（同様に確からしい有限個の結果が前提）
結果が無限個の場合や、同様に確からしくない場合には適用できない。

大学：3つの公理を満たす関数として定義する
「確率」とは、事象に対して実数を割り当てる関数 $P$ であって、3つの公理を満たすもの。
有限・無限、等確率・非等確率を問わず適用できる。

高校：加法定理、余事象の確率は「公式」
それぞれ独立に覚える必要がある。

大学：すべて公理からの「定理」
加法定理、余事象の確率などは、3つの公理から論理的に導出される。

高校：確率の値は計算で求めるもの
場合の数を数えて比をとる。

大学：確率の値は公理を満たすように割り当てるもの
公理を満たす限り、どのような値の割り当て方も「確率」として正当。

3つの公理が確率論の全体を支える

この記事を読み終えると、以下のことができるようになります。

1. 標本空間・事象・確率測度の3つ組 $(\Omega, \mathcal{F}, P)$ の意味を説明できる

2. コルモゴロフの3つの公理を述べ、各公理の直感的な意味を説明できる

3. 3つの公理から、余事象の確率、加法定理、単調性などの基本性質を導出できる

4. 「同様に確からしい」場合の高校の定義が、公理的定義の特殊ケースであることを理解できる

5. 連続的な確率（区間 $[0,1]$ 上の一様分布など）を公理的に定義できる

まず確率の公理を述べるために必要な「標本空間」と「事象」の概念を整理し、その上で3つの公理を導入します。そして公理から高校で学んだ公式を一つずつ導出し、最後に公理的定義の威力を具体例で確認します。

3準備 ─ 標本空間と事象の集合演算

確率の公理を述べる前に、確率論で使う基本的な概念を整理します。これらは高校でも部分的に学んでいますが、大学では集合の言葉でより明確に定義します。

標本空間と標本点

ある試行（実験や観察）において、起こりうるすべての結果を集めた集合を標本空間（sample space）と呼び、$\Omega$（オメガ）で表します。 $\Omega$ の各要素を標本点（sample point）と呼びます。

標本空間の定義

試行において起こりうる結果全体の集合を標本空間と呼び、$\Omega$ で表す。

$\Omega$ の各要素 $\omega$ を標本点と呼ぶ。

いくつか具体例を挙げます。

試行	標本空間 $\Omega$	標本点の数
コインを1回投げる	$\{H, T\}$（$H$: 表、$T$: 裏）	$2$（有限）
サイコロを1回振る	$\{1, 2, 3, 4, 5, 6\}$	$6$（有限）
コインを表が出るまで投げ続ける	$\{H, TH, TTH, TTTH, \ldots\}$	可算無限
$[0, 1]$ から実数を1つ選ぶ	$[0, 1]$	非可算無限

高校では最初の2例のような有限の標本空間だけを扱いますが、3番目や4番目のように無限の標本空間も自然に現れます。コルモゴロフの公理は、有限・無限を問わずすべての標本空間に対して適用できるように設計されています。

事象と集合演算

事象（event）とは、標本空間 $\Omega$ の部分集合のことです。高校でも「事象 $A$」という言い方をしますが、大学では明確に「$\Omega$ の部分集合」として定義します。

事象に対する集合演算は、確率の計算と直接対応します。

集合演算	確率論の言葉	記号	意味
和集合	$A$ または $B$ が起こる	$A \cup B$	$A$、$B$ のうち少なくとも一方が起こる事象
共通部分	$A$ かつ $B$ が起こる	$A \cap B$	$A$、$B$ の両方が起こる事象
補集合	$A$ が起こらない（余事象）	$A^c$ または $\overline{A}$	$A$ に属さないすべての結果からなる事象
空集合	空事象（決して起こらない）	$\emptyset$	どの結果も属さない事象
全体集合	全事象（必ず起こる）	$\Omega$	すべての結果からなる事象

2つの事象 $A$ と $B$ が $A \cap B = \emptyset$ を満たすとき、$A$ と $B$ は互いに排反（mutually exclusive）であるといいます。これは高校でも同じ用語を使います。

ここまでで、確率の「舞台」を整えました。標本空間 $\Omega$ という土台の上に、事象という部分集合が配置されている状況です。次のセクションでは、これらの事象に対して「確率」という数値を割り当てるルール、すなわちコルモゴロフの公理を導入します。

4コルモゴロフの3つの公理

いよいよ、確率の公理的定義を導入します。コルモゴロフは、「確率」とは事象（$\Omega$ の部分集合）に対して実数を割り当てる関数 $P$ であって、次の3つの条件を満たすものだと定めました。

なぜこのような定義をするのでしょうか。確率が「場合の数の比」ではうまくいかない場面があることは前に見ました。そこで発想を転換します。確率に必要なのは「計算方法」ではなく、確率が満たすべき「性質」を決めることです。確率として自然に成り立つべき最小限のルールだけを公理として定め、あとはそこから論理的に導く。これが公理的アプローチです。

コルモゴロフの確率の公理（1933年）

標本空間 $\Omega$ 上の事象の集まり $\mathcal{F}$ に対し、関数 $P \colon \mathcal{F} \to \mathbb{R}$ が次の3つの条件を満たすとき、$P$ を確率測度（probability measure）と呼ぶ。

公理1（非負性）：任意の事象 $A \in \mathcal{F}$ に対して、

$$P(A) \geq 0$$

公理2（全体の正規化）：

$$P(\Omega) = 1$$

公理3（可算加法性）：$A_1, A_2, A_3, \ldots$ が互いに排反な事象の列（すなわち $i \neq j$ のとき $A_i \cap A_j = \emptyset$）であるとき、

$$P\!\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i)$$

3つ組 $(\Omega, \mathcal{F}, P)$ を確率空間（probability space）と呼ぶ。

各公理の意味を確認します。

公理1（非負性）は、確率が負の値をとらないことを要求します。「事象が起こる可能性」を表す量として、負の値は意味を持ちません。これは自然な要請です。

公理2（全体の正規化）は、「何かは必ず起こる」ことを意味します。標本空間 $\Omega$ は「起こりうるすべての結果」の集合なので、試行を行えば必ず $\Omega$ のどれかの結果が実現します。その確率が $1$ であるという要請です。

公理3（可算加法性）は、互いに排反な事象が同時に起こることはないので、それらの「どれかが起こる確率」は各々の確率の和に等しいという要請です。高校の加法定理（$P(A \cup B) = P(A) + P(B)$、ただし $A \cap B = \emptyset$）を、有限個ではなく可算無限個の事象にまで拡張したものです。

有限加法性と可算加法性の違い

高校で学ぶ加法定理は「有限加法性」です。すなわち、有限個の排反事象 $A_1, \ldots, A_n$ に対して $P(A_1 \cup \cdots \cup A_n) = P(A_1) + \cdots + P(A_n)$ という性質です。

コルモゴロフの公理3は、これを無限個の事象にまで拡張した「可算加法性」です。有限加法性だけでは、無限の標本空間を扱うときに不都合が生じます（たとえば確率の極限操作が保証されない）。

公理3は有限加法性よりも強い条件です。可算加法性が成り立てば、有限加法性は自動的に成り立ちます（残りの事象を $A_{n+1} = A_{n+2} = \cdots = \emptyset$ とおけばよい）。逆は一般には成り立ちません。

事象の集まり $\mathcal{F}$ について

公理の定義に登場した $\mathcal{F}$ について補足します。有限の標本空間の場合は、$\Omega$ のすべての部分集合の集まり（べき集合）を $\mathcal{F}$ とすれば問題ありません。たとえば $\Omega = \{1, 2, 3\}$ ならば、$\mathcal{F} = \{\emptyset, \{1\}, \{2\}, \{3\}, \{1,2\}, \{1,3\}, \{2,3\}, \{1,2,3\}\}$ です。

しかし、$\Omega$ が非可算無限集合（たとえば $[0, 1]$）の場合、すべての部分集合に対して公理を矛盾なく満たす確率を割り当てることが不可能であることが知られています。そのため、$\mathcal{F}$ としては $\Omega$ の部分集合のうち「確率を割り当てても矛盾しない」ものだけを集めた、ある条件を満たす集合族を使います。この条件を満たす集合族を $\sigma$-加法族（シグマ加法族）と呼びますが、本記事ではこの技術的な詳細には立ち入りません。有限の標本空間を扱う限りは、$\mathcal{F}$ を $\Omega$ のすべての部分集合の集まりと考えて差し支えありません。

ここまでで、コルモゴロフの3つの公理を導入しました。公理は驚くほどシンプルですが、ここから高校で学んだ確率の公式が次々と導かれます。次のセクションでは、実際にその導出を行います。

5公理から導かれる基本定理

コルモゴロフの3つの公理だけから、高校で「公式」として学んだ確率の性質がすべて定理として導出できることを示します。以下の各性質は、公理1〜3のみを使って証明します。

定理1：空事象の確率

空事象の確率

$$P(\emptyset) = 0$$

決して起こらない事象（空事象）の確率は $0$ です。

証明

目標：$P(\emptyset) = 0$ を示す。

$\Omega$ と $\emptyset$ は排反です（$\Omega \cap \emptyset = \emptyset$）。さらに $\Omega \cup \emptyset = \Omega$ です。

公理3（ここでは有限個の場合を使用）を適用すると、$A_1 = \Omega$、$A_2 = \emptyset$、$A_3 = A_4 = \cdots = \emptyset$ とおいて、

$$P(\Omega) = P(\Omega \cup \emptyset \cup \emptyset \cup \cdots) = P(\Omega) + P(\emptyset) + P(\emptyset) + \cdots$$

ここで左辺は公理2より $P(\Omega) = 1$ です。右辺の無限和が有限の値 $1$ に等しいためには、$P(\emptyset) = 0$ でなければなりません。

（別の証明）よりシンプルに示すこともできます。$\Omega$ と $\emptyset$ は排反で $\Omega \cup \emptyset = \Omega$ なので、公理3より $P(\Omega) = P(\Omega) + P(\emptyset)$ です。両辺から $P(\Omega)$ を引いて $P(\emptyset) = 0$ を得ます。

定理2：余事象の確率

余事象の確率

任意の事象 $A$ に対して、

$$P(A^c) = 1 - P(A)$$

ここで $A^c = \Omega \setminus A$ は $A$ の余事象です。

証明

目標：$P(A^c) = 1 - P(A)$ を示す。

方針：$A$ と $A^c$ が排反で、合わせると $\Omega$ になることを使います。

$A \cap A^c = \emptyset$ かつ $A \cup A^c = \Omega$ です。公理3（有限の場合）より、

$$P(\Omega) = P(A \cup A^c) = P(A) + P(A^c)$$

公理2より $P(\Omega) = 1$ なので、

$$1 = P(A) + P(A^c)$$

したがって $P(A^c) = 1 - P(A)$ です。

高校で「余事象の確率の公式」として暗記していたものが、公理1〜3から自然に導けました。

定理3：確率の上限

確率の上限

任意の事象 $A$ に対して、

$$0 \leq P(A) \leq 1$$

証明

$P(A) \geq 0$ は公理1そのものです。

定理2より $P(A^c) = 1 - P(A)$ であり、公理1より $P(A^c) \geq 0$ です。したがって $1 - P(A) \geq 0$、すなわち $P(A) \leq 1$ です。

「確率は $0$ 以上 $1$ 以下」は高校では当たり前の事実として扱いますが、これは公理から証明できる定理です。公理には「$P(A) \leq 1$」とは明記されていませんが、公理1（非負性）と公理2（正規化）から論理的に従います。

定理4：単調性

確率の単調性

$A \subset B$ ならば、

$$P(A) \leq P(B)$$

さらに、$P(B \setminus A) = P(B) - P(A)$ が成り立つ。

証明

$A \subset B$ のとき、$B = A \cup (B \setminus A)$ と分解でき、$A$ と $B \setminus A$ は排反です。

公理3より、

$$P(B) = P(A) + P(B \setminus A)$$

公理1より $P(B \setminus A) \geq 0$ なので、$P(B) \geq P(A)$ です。

また、$P(B \setminus A) = P(B) - P(A)$ も得られます。

定理5：一般の加法定理（包除原理）

一般の加法定理

任意の事象 $A$, $B$ に対して、

$$P(A \cup B) = P(A) + P(B) - P(A \cap B)$$

証明

方針：$A \cup B$ を3つの排反な部分に分解します。

$$A \cup B = (A \setminus B) \cup (A \cap B) \cup (B \setminus A)$$

この3つは互いに排反なので、公理3より、

$$P(A \cup B) = P(A \setminus B) + P(A \cap B) + P(B \setminus A)$$

一方、$A = (A \setminus B) \cup (A \cap B)$ は排反な分解なので、

$$P(A) = P(A \setminus B) + P(A \cap B) \quad \Longrightarrow \quad P(A \setminus B) = P(A) - P(A \cap B)$$

同様に、$P(B \setminus A) = P(B) - P(A \cap B)$ です。

これらを代入すると、

$$P(A \cup B) = \bigl(P(A) - P(A \cap B)\bigr) + P(A \cap B) + \bigl(P(B) - P(A \cap B)\bigr) = P(A) + P(B) - P(A \cap B)$$

公理から公式へ ─ 暗記から理解へ

高校で別々の「公式」として覚えていた確率の性質が、コルモゴロフの3つの公理だけから導出できることを見ました。

公理1（非負性）+ 公理2（正規化） $\Longrightarrow$ $0 \leq P(A) \leq 1$、$P(\emptyset) = 0$

公理2 + 公理3（可算加法性） $\Longrightarrow$ 余事象の確率 $P(A^c) = 1 - P(A)$

公理3 $\Longrightarrow$ 加法定理、一般の加法定理（包除原理）、単調性

公理的アプローチの利点は、覚えるべきルールが3つだけで済み、残りはすべて論理的に導けることです。

ここまでで、3つの公理から高校の確率公式を導出しました。次のセクションでは、この公理的定義を具体的な場面に適用し、高校では扱えなかった例にも確率を定義できることを確認します。

6応用 ─ 公理的確率の具体例

例1：公正なサイコロ（高校の確率の再解釈）

サイコロを1回振る試行を考えます。標本空間は $\Omega = \{1, 2, 3, 4, 5, 6\}$ です。各目が同様に確からしいので、各標本点に等しい確率を割り当てます。

$$P(\{1\}) = P(\{2\}) = P(\{3\}) = P(\{4\}) = P(\{5\}) = P(\{6\}) = \frac{1}{6}$$

この割り当てが公理を満たすことを確認します。

公理1：各 $P(\{k\}) = \frac{1}{6} \geq 0$。任意の事象 $A$ に対して $P(A) \geq 0$ です。
公理2：$P(\Omega) = P(\{1\}) + P(\{2\}) + \cdots + P(\{6\}) = 6 \times \frac{1}{6} = 1$。
公理3：排反な事象の確率は加法的です。たとえば「偶数が出る」事象 $A = \{2, 4, 6\}$ の確率は $P(A) = P(\{2\}) + P(\{4\}) + P(\{6\}) = \frac{3}{6} = \frac{1}{2}$ です。

高校の「場合の数の比 $P(A) = \frac{a}{n}$」は、各標本点に等しい確率 $\frac{1}{n}$ を割り当てた場合の確率空間にほかなりません。つまり、高校の確率はコルモゴロフの公理を満たす確率空間の特殊ケースです。

例2：ゆがんだサイコロ（非等確率の場合）

次に、各目の出やすさが異なるサイコロを考えます。同じ標本空間 $\Omega = \{1, 2, 3, 4, 5, 6\}$ に対して、次のように確率を割り当てます。

$$P(\{1\}) = 0.1, \quad P(\{2\}) = 0.1, \quad P(\{3\}) = 0.1, \quad P(\{4\}) = 0.2, \quad P(\{5\}) = 0.2, \quad P(\{6\}) = 0.3$$

公理を確認します。

公理1：すべて $\geq 0$。
公理2：$0.1 + 0.1 + 0.1 + 0.2 + 0.2 + 0.3 = 1.0$。
公理3：有限の標本空間なので自動的に満たされます。

この確率空間の下で、「偶数が出る」事象 $A = \{2, 4, 6\}$ の確率を計算すると、

$$P(A) = P(\{2\}) + P(\{4\}) + P(\{6\}) = 0.1 + 0.2 + 0.3 = 0.6$$

となります。高校の「場合の数の比」による計算では $P(A) = \frac{3}{6} = 0.5$ でしたが、ゆがんだサイコロでは $0.6$ になります。公理的定義では、各標本点への確率の割り当て方を変えるだけで、非等確率の場合も自然に扱えます。

例3：区間 $[0, 1]$ 上の一様分布（連続的な確率）

標本空間を $\Omega = [0, 1]$ とし、「$[0, 1]$ の中から一様にランダムに実数を1つ選ぶ」という試行を考えます。高校の定義では場合の数が無限にあるため確率を定義できませんが、公理的定義なら可能です。

区間 $[a, b] \subset [0, 1]$ に対して、

$$P([a, b]) = b - a$$

と定めます。これは「区間の長さ」を確率とする自然な定義です。

公理を確認します。

公理1：$b \geq a$ なので $P([a, b]) = b - a \geq 0$。
公理2：$P([0, 1]) = 1 - 0 = 1$。
公理3：互いに重ならない区間の和集合の確率は、各区間の長さの和に等しくなります。たとえば、$P([0, 0.3] \cup [0.5, 0.8]) = 0.3 + 0.3 = 0.6$ です。

この確率空間では、1点 $\{a\}$ の確率はどうなるでしょうか。$\{a\} = [a, a]$ と考えると、$P(\{a\}) = a - a = 0$ です。

「確率 $0$」は「起こらない」ではない

区間 $[0, 1]$ 上の一様分布で、$P(\{0.5\}) = 0$ です。しかし、$0.5$ は標本空間 $\Omega = [0, 1]$ の要素なので、「起こりうる結果」です。

誤り：確率が $0$ なら絶対に起こらない。

正しい：確率 $0$ の事象は「ほとんど起こらない」が「不可能ではない」。$P(A) = 0$ は $A = \emptyset$ を意味しません。

これは高校の有限の確率空間では起こらない現象です。有限の場合、$P(\{a\}) = 0$ ならば事象 $\{a\}$ はそもそも標本空間に含まれないはずです。しかし連続的な確率空間では、個々の点の確率が $0$ であっても、それらの集まり（区間）に対しては正の確率が割り当てられるのです。

例4：導出した定理を使った計算

セクション5で導出した定理を、具体的な計算に適用してみます。

公正なサイコロにおいて、事象 $A = \{1, 2, 3\}$（3以下の目が出る）、$B = \{2, 4, 6\}$（偶数の目が出る）とします。

$A \cap B = \{2\}$、$A \cup B = \{1, 2, 3, 4, 6\}$ です。

余事象の確率（定理2）：

$$P(A^c) = 1 - P(A) = 1 - \frac{3}{6} = \frac{1}{2}$$

実際、$A^c = \{4, 5, 6\}$ で、$P(A^c) = \frac{3}{6} = \frac{1}{2}$ と一致します。

一般の加法定理（定理5）：

$$P(A \cup B) = P(A) + P(B) - P(A \cap B) = \frac{3}{6} + \frac{3}{6} - \frac{1}{6} = \frac{5}{6}$$

実際、$A \cup B = \{1, 2, 3, 4, 6\}$ で、$P(A \cup B) = \frac{5}{6}$ と一致します。

単調性（定理4）：$\{2\} \subset A$ なので、$P(\{2\}) \leq P(A)$、すなわち $\frac{1}{6} \leq \frac{1}{2}$ が成り立ちます。

コルモゴロフの業績と確率論の歴史

確率論の歴史は17世紀のパスカルとフェルマーにさかのぼりますが、確率の厳密な数学的基盤が確立されたのは1933年、コルモゴロフの著書「確率論の基礎概念」（Grundbegriffe der Wahrscheinlichkeitsrechnung）においてです。

コルモゴロフは、当時発展しつつあったルベーグの測度論を土台にして確率論を構築しました。確率測度は測度論における測度の特殊ケース（全体の測度が $1$）にあたります。この公理化により、確率論は解析学と同じ厳密さを持つ数学の一分野として確立されました。

7つながりマップ

前提知識：高校数学A「確率の基本性質、独立試行、条件付き確率」
高校で学ぶ確率の計算方法と基本公式が、この記事の出発点です。
前提知識：高校数学I「集合と命題」
和集合・共通部分・補集合などの集合演算を使います。
発展：📖 M-12-2 条件付き確率とベイズの定理
本記事の公理的定義の上に条件付き確率を厳密に定義し、ベイズの定理を導出します。
発展：📖 M-12-3 確率変数と期待値・分散の理論
確率空間の上に確率変数を定義し、期待値・分散を公理的に展開します。
関連：📖 M-11-1 数え上げの原理 ─ 包除原理と母関数
本記事の定理5（一般の加法定理）は包除原理の2集合の場合にあたります。

Sまとめ

確率は「場合の数の比」ではなく、事象に対して実数を割り当てる関数 $P$ であり、3つの公理（非負性・正規化・可算加法性）を満たすものとして定義される。
高校で学ぶ確率の公式（余事象の確率、加法定理、$0 \leq P(A) \leq 1$ など）は、すべてこの3つの公理から論理的に導出できる定理である。
高校の「場合の数の比」による定義は、各標本点に等しい確率を割り当てた場合の特殊ケースとして、公理的定義に包含される。
公理的定義により、ゆがんだサイコロ（非等確率）や区間上の一様分布（連続的な確率）など、高校の定義では扱えなかった確率も統一的に扱える。
連続的な確率空間では、個々の標本点の確率が $0$ であっても事象全体の確率は正になりうる。「確率 $0$」は「不可能」を意味しない。

9確認テスト

理解を確認しましょう

Q1. コルモゴロフの確率の公理は3つあります。公理1（非負性）と公理2（正規化）の内容をそれぞれ述べてください。

クリックして解答を表示 公理1（非負性）：任意の事象 $A$ に対して $P(A) \geq 0$。
公理2（正規化）：$P(\Omega) = 1$。

Q2. 公理3（可算加法性）と高校の加法定理の違いを一言で説明してください。

クリックして解答を表示高校の加法定理は有限個の排反事象に対する性質（有限加法性）ですが、公理3は可算無限個の排反事象に対しても成り立つことを要求する性質（可算加法性）です。

Q3. $P(A) \leq 1$ は公理に直接書かれていません。これはどの公理から導かれますか。

クリックして解答を表示公理1（非負性）と公理2（正規化）から導かれます。余事象の確率 $P(A^c) = 1 - P(A) \geq 0$ より $P(A) \leq 1$ です。ここで余事象の確率自体は公理2と公理3から導かれるので、結局3つの公理すべてを使っています。

Q4. 区間 $[0, 1]$ 上の一様分布で、$P(\{0.7\}) = 0$ です。これは「$0.7$ が選ばれることは不可能」を意味しますか。

クリックして解答を表示いいえ。$0.7 \in \Omega = [0, 1]$ なので起こりうる結果ですが、確率は $0$ です。連続的な確率空間では、個々の点の確率が $0$ でも不可能ではありません。$P(A) = 0$ は $A = \emptyset$ を意味しません。

10演習問題

問題1 A 公理の確認

コイン投げの標本空間 $\Omega = \{H, T\}$ に対して、$P(\{H\}) = 0.6$, $P(\{T\}) = 0.4$ と定めます。この割り当てがコルモゴロフの3つの公理を満たすことを確認してください。

クリックして解答を表示

解答

公理1（非負性）：$P(\{H\}) = 0.6 \geq 0$、$P(\{T\}) = 0.4 \geq 0$。すべての事象 $A$ に対して $P(A) \geq 0$ です。

公理2（正規化）：$P(\Omega) = P(\{H\}) + P(\{T\}) = 0.6 + 0.4 = 1$。

公理3（可算加法性）：$\{H\}$ と $\{T\}$ は排反で、$P(\{H\} \cup \{T\}) = P(\{H\}) + P(\{T\}) = 1 = P(\Omega)$。有限の標本空間なので、これですべての排反事象の組み合わせについて可算加法性が満たされています。

問題2 B 定理の導出

コルモゴロフの公理のみを使って、次の性質を証明してください。

3つの事象 $A$, $B$, $C$ が互いに排反（どの2つも共通部分が空集合）であるとき、

$$P(A \cup B \cup C) = P(A) + P(B) + P(C)$$

クリックして解答を表示

解答

公理3（可算加法性）を適用します。$A_1 = A$, $A_2 = B$, $A_3 = C$, $A_4 = A_5 = \cdots = \emptyset$ とおきます。

仮定より $A$, $B$, $C$ は互いに排反であり、$\emptyset$ はどの事象とも排反です。したがって公理3より、

$$P(A \cup B \cup C \cup \emptyset \cup \emptyset \cup \cdots) = P(A) + P(B) + P(C) + P(\emptyset) + P(\emptyset) + \cdots$$

左辺は $P(A \cup B \cup C)$（空集合を加えても変わらない）、右辺は $P(\emptyset) = 0$ なので、

$$P(A \cup B \cup C) = P(A) + P(B) + P(C)$$

問題3 B 公理の応用

$\Omega = \{1, 2, 3, 4, 5, 6\}$ に対して、$P(\{k\}) = \dfrac{k}{21}$（$k = 1, 2, \ldots, 6$）と定めます。

(1) この割り当てが確率の公理を満たすことを確認してください。

(2) 事象 $A = \{1, 2, 3\}$, $B = \{3, 4, 5\}$ に対して、$P(A \cup B)$ を一般の加法定理を使って求めてください。

クリックして解答を表示

解答

(1) 公理1：各 $P(\{k\}) = \frac{k}{21} > 0$。公理2：$P(\Omega) = \frac{1+2+3+4+5+6}{21} = \frac{21}{21} = 1$。公理3：有限の標本空間なので自動的に満たされます。

(2) $P(A) = \frac{1+2+3}{21} = \frac{6}{21} = \frac{2}{7}$、$P(B) = \frac{3+4+5}{21} = \frac{12}{21} = \frac{4}{7}$。

$A \cap B = \{3\}$ なので、$P(A \cap B) = \frac{3}{21} = \frac{1}{7}$。

一般の加法定理より、

$$P(A \cup B) = P(A) + P(B) - P(A \cap B) = \frac{2}{7} + \frac{4}{7} - \frac{1}{7} = \frac{5}{7}$$

解説

検算：$A \cup B = \{1, 2, 3, 4, 5\}$ なので、$P(A \cup B) = \frac{1+2+3+4+5}{21} = \frac{15}{21} = \frac{5}{7}$。一致しています。

この確率空間では各目の出やすさが $k$ に比例しています。高校の「場合の数の比」では扱えませんが、公理的定義なら問題なく扱えます。

問題4 C 論証

コルモゴロフの公理のみを使って、次のブールの不等式（union bound）を証明してください。

任意の事象 $A_1, A_2, \ldots, A_n$（排反とは限らない）に対して、

$$P(A_1 \cup A_2 \cup \cdots \cup A_n) \leq P(A_1) + P(A_2) + \cdots + P(A_n)$$

（ヒント：$A_1 \cup \cdots \cup A_n$ を排反な事象の和に分解し、単調性を利用してください。）

クリックして解答を表示

解答

$B_1 = A_1$、$k \geq 2$ に対して $B_k = A_k \setminus (A_1 \cup \cdots \cup A_{k-1})$ と定めます。

すると、$B_1, B_2, \ldots, B_n$ は互いに排反であり、$B_1 \cup B_2 \cup \cdots \cup B_n = A_1 \cup A_2 \cup \cdots \cup A_n$ です。

公理3（有限の場合）より、

$$P(A_1 \cup \cdots \cup A_n) = P(B_1 \cup \cdots \cup B_n) = \sum_{k=1}^{n} P(B_k)$$

各 $k$ について $B_k \subset A_k$ なので、単調性（定理4）より $P(B_k) \leq P(A_k)$ です。

したがって、

$$P(A_1 \cup \cdots \cup A_n) = \sum_{k=1}^{n} P(B_k) \leq \sum_{k=1}^{n} P(A_k)$$

解説

ブールの不等式は「複数の事象のどれかが起こる確率は、各事象の確率の和以下である」という直感的に明らかな事実ですが、公理から厳密に証明できます。一般の加法定理 $P(A \cup B) = P(A) + P(B) - P(A \cap B) \leq P(A) + P(B)$ の一般化にあたります。

この不等式は確率論の中で非常によく使われる基本的な道具です。