統計的な推測を学ぶ第一歩として、試行の結果に数値を対応させる「確率変数」と、その値と確率の対応関係を表す「確率分布」を理解します。サイコロやコインなどの身近な例を通じて、確率分布表の作り方と基本的な性質を身につけましょう。
数学Aで学んだ確率では「事象の確率」を扱いました。統計的な推測では、試行の結果を数値で表し、その数値の振る舞いを分析します。このとき登場するのが確率変数です。
確率変数とは、試行の結果によって値が定まる変数のことです。確率変数は通常、大文字の $X$, $Y$, $Z$ などで表します。
確率変数 $X$ がある値 $a$ をとる確率を $P(X = a)$ と書きます。
サイコロを1回投げる試行を考えましょう。出る目の数を $X$ とすると、$X$ は $1, 2, 3, 4, 5, 6$ のいずれかの値をとります。このとき $X$ は確率変数です。
例えば $P(X = 3) = \dfrac{1}{6}$ は「サイコロの目が3になる確率は $\dfrac{1}{6}$」を意味します。
方程式や関数で使う変数 $x$ は任意の値を自由に代入できます。一方、確率変数 $X$ はとりうる各値に確率が定まっています。この「確率付きの変数」という点が普通の変数との根本的な違いです。
確率変数には離散型と連続型の2種類があります。離散型はとりうる値が飛び飛びのもの(サイコロの目、コインの表の回数など)、連続型はとりうる値がある範囲を連続的に動くもの(身長、温度など)です。この記事ではまず離散型確率変数を学びます。
確率変数 $X$ がとりうるすべての値と、それぞれの値をとる確率の対応関係を確率分布といいます。確率分布を表にまとめたものが確率分布表です。
確率変数 $X$ のとりうる値が $x_1, x_2, \ldots, x_n$ であるとき:
| $X$ | $x_1$ | $x_2$ | $\cdots$ | $x_n$ | 計 |
|---|---|---|---|---|---|
| $P$ | $p_1$ | $p_2$ | $\cdots$ | $p_n$ | $1$ |
ここで $p_i = P(X = x_i)$ であり、$p_i \geq 0$(各確率は0以上)です。
問題:1個のサイコロを投げるとき、出る目の数 $X$ の確率分布表を作れ。
解:$X$ は $1, 2, 3, 4, 5, 6$ の値をとり、各値をとる確率はすべて $\dfrac{1}{6}$ です。
| $X$ | $1$ | $2$ | $3$ | $4$ | $5$ | $6$ | 計 |
|---|---|---|---|---|---|---|---|
| $P$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $1$ |
問題:2枚のコインを同時に投げるとき、表が出る枚数 $X$ の確率分布表を作れ。
解:$X$ は $0, 1, 2$ の値をとります。
$P(X = 0) = \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{1}{4}$(2枚とも裏)
$P(X = 1) = {}_2C_1 \times \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{2}{4} = \dfrac{1}{2}$(1枚が表、1枚が裏)
$P(X = 2) = \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{1}{4}$(2枚とも表)
| $X$ | $0$ | $1$ | $2$ | 計 |
|---|---|---|---|---|
| $P$ | $\frac{1}{4}$ | $\frac{1}{2}$ | $\frac{1}{4}$ | $1$ |
確率分布には必ず満たさなければならない基本的な性質があります。
確率変数 $X$ の確率分布 $P(X = x_i) = p_i$ について:
性質1:$0 \leq p_i \leq 1$(各確率は0以上1以下)
性質2:$\displaystyle\sum_{i=1}^{n} p_i = p_1 + p_2 + \cdots + p_n = 1$(確率の総和は1)
※ 性質2は「起こりうるすべての場合を合わせると全体になる」ことを意味します。
確率分布表では、確率の合計が必ず $1$ になります。この性質は以下の場面で活用できます:
1. 未知の確率を求める:他の確率がわかっていれば、残りは $1$ から引く
2. 確率分布の検算:合計が $1$ にならなければ計算ミスがある
3. 文字を含む確率の決定:$\sum p_i = 1$ から未知数を求める
問題:確率変数 $X$ の確率分布が次の表で与えられるとき、$a$ の値を求めよ。
| $X$ | $0$ | $1$ | $2$ | $3$ |
|---|---|---|---|---|
| $P$ | $a$ | $3a$ | $3a$ | $a$ |
解:確率の総和が $1$ なので:
$$a + 3a + 3a + a = 1$$
$$8a = 1 \quad \therefore \; a = \frac{1}{8}$$
確認:各確率は $\dfrac{1}{8}, \dfrac{3}{8}, \dfrac{3}{8}, \dfrac{1}{8}$ で、すべて $0$ 以上 $1$ 以下。条件を満たす。
✗ $\sum p_i = 1$ だけで $a$ を求めて終わりにする
✓ $\sum p_i = 1$ に加えて、すべての $p_i \geq 0$ も確認する
$a$ の値を求めた後、すべての確率が $0$ 以上 $1$ 以下であることを必ずチェックしましょう。
確率変数と確率分布の概念を、さまざまな具体例で練習しましょう。
問題:2個のサイコロを同時に投げるとき、出た目の和 $X$ について $P(X = 7)$ を求めよ。
解:2個のサイコロの目の組合せは全部で $6 \times 6 = 36$ 通りです。
和が $7$ になる組合せ:$(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)$ の $6$ 通り。
$$P(X = 7) = \frac{6}{36} = \frac{1}{6}$$
問題:1等(1000円)が1本、2等(500円)が2本、はずれ(0円)が7本の計10本のくじがある。1本引いたときの賞金額 $X$ の確率分布表を作れ。
解:$X$ は $0, 500, 1000$ の値をとります。
| $X$(円) | $0$ | $500$ | $1000$ | 計 |
|---|---|---|---|---|
| $P$ | $\frac{7}{10}$ | $\frac{2}{10}$ | $\frac{1}{10}$ | $1$ |
確認:$\dfrac{7}{10} + \dfrac{2}{10} + \dfrac{1}{10} = \dfrac{10}{10} = 1$ ✓
確率変数 $X$ の確率分布がわかれば、$P(X \leq a)$ や $P(a \leq X \leq b)$ なども求められます。
問題:上のサイコロの例で $P(X \leq 3)$ と $P(2 \leq X \leq 5)$ を求めよ。
解:
$P(X \leq 3) = P(X=1) + P(X=2) + P(X=3) = \dfrac{1}{6} + \dfrac{1}{6} + \dfrac{1}{6} = \dfrac{1}{2}$
$P(2 \leq X \leq 5) = P(X=2) + P(X=3) + P(X=4) + P(X=5) = \dfrac{4}{6} = \dfrac{2}{3}$
$P(X \geq 4)$ を求めるとき、直接計算する代わりに余事象を使えます。
$$P(X \geq 4) = 1 - P(X \leq 3) = 1 - \frac{1}{2} = \frac{1}{2}$$
値の個数が多い方を直接数えるよりも、少ない方を計算して $1$ から引く方が効率的です。
確率分布は統計的推測の土台です。確率分布を用いると、データの傾向を数学的に分析し、予測に役立てることができます。
問題:確率変数 $X$ の確率分布が次の表で与えられるとき、$P(X^2 \leq 4)$ を求めよ。
| $X$ | $-2$ | $-1$ | $0$ | $1$ | $3$ |
|---|---|---|---|---|---|
| $P$ | $0.1$ | $0.2$ | $0.3$ | $0.3$ | $0.1$ |
解:$X^2 \leq 4$ より $-2 \leq X \leq 2$ です。
$X$ が $-2, -1, 0, 1$ のとき $X^2 \leq 4$ を満たします($X = 3$ のとき $X^2 = 9 > 4$)。
$$P(X^2 \leq 4) = P(X=-2) + P(X=-1) + P(X=0) + P(X=1)$$
$$= 0.1 + 0.2 + 0.3 + 0.3 = 0.9$$
確率変数と確率分布は、これから学ぶ期待値・分散・標準偏差・二項分布・正規分布のすべての基礎になります。
確率分布表を正しく作成し、確率の性質($\sum p_i = 1$, $p_i \geq 0$)を自在に使えるようにしましょう。
確率分布がわかると、確率変数の「平均値」を計算できます。これが次の記事で学ぶ期待値 $E(X)$ です。
$$E(X) = \sum_{i=1}^{n} x_i p_i = x_1 p_1 + x_2 p_2 + \cdots + x_n p_n$$
※ 期待値の詳しい定義と計算方法は次の記事で扱います。
Q1. 確率変数とはどのようなものか、簡潔に説明せよ。
Q2. 確率分布表において、確率の総和はいくつになるか。
Q3. 確率変数 $X$ の確率分布が $P(X=1)=0.2$, $P(X=2)=0.5$, $P(X=3)=a$ のとき、$a$ の値を求めよ。
Q4. 1個のサイコロを投げるとき、出る目 $X$ について $P(X \geq 5)$ を求めよ。
Q5. 3枚のコインを同時に投げるとき、表が出る枚数 $X$ の確率分布表を作れ。
袋の中に赤玉3個、白玉2個が入っている。同時に2個の玉を取り出すとき、赤玉の個数 $X$ の確率分布表を作れ。
$X$ は $0, 1, 2$ の値をとる。
全体の取り出し方:${}_5C_2 = 10$ 通り
$P(X=0) = \dfrac{{}_2C_2}{{}_5C_2} = \dfrac{1}{10}$(白玉2個)
$P(X=1) = \dfrac{{}_3C_1 \cdot {}_2C_1}{{}_5C_2} = \dfrac{6}{10} = \dfrac{3}{5}$(赤1個・白1個)
$P(X=2) = \dfrac{{}_3C_2}{{}_5C_2} = \dfrac{3}{10}$(赤玉2個)
確認:$\dfrac{1}{10} + \dfrac{6}{10} + \dfrac{3}{10} = 1$ ✓
確率変数 $X$ の確率分布が次の表で与えられるとき、定数 $a$ の値を求めよ。また $P(X \geq 2)$ を求めよ。
| $X$ | $0$ | $1$ | $2$ | $3$ |
|---|---|---|---|---|
| $P$ | $a^2$ | $2a$ | $a$ | $a^2$ |
確率の総和が $1$ なので:$a^2 + 2a + a + a^2 = 1$
$2a^2 + 3a - 1 = 0$
解の公式より $a = \dfrac{-3 \pm \sqrt{9 + 8}}{4} = \dfrac{-3 \pm \sqrt{17}}{4}$
$a > 0$(確率は非負)なので $a = \dfrac{-3 + \sqrt{17}}{4}$
$P(X \geq 2) = a + a^2 = a(1+a)$。$a = \dfrac{-3+\sqrt{17}}{4}$ を代入して計算する。
$1+a = \dfrac{1+\sqrt{17}}{4}$ より $P(X \geq 2) = \dfrac{(-3+\sqrt{17})(1+\sqrt{17})}{16} = \dfrac{-3+3\sqrt{17}-\sqrt{17}+17-3}{16}$
$\phantom{P(X \geq 2)} = \dfrac{14 - 2\sqrt{17}}{16} = \dfrac{7-\sqrt{17}}{8}$
$a$ が2次方程式の解になるケースでは、$p_i \geq 0$ の条件から不適な解を除外する作業が必須です。本問では $a > 0$ かつ $a^2 \leq 1$ を確認します。
1個のサイコロを投げるとき、出た目の数を $X$ とする。$Y = |X - 3|$ とおくとき、$Y$ の確率分布表を作れ。
$X = 1$ のとき $Y = |1-3| = 2$
$X = 2$ のとき $Y = |2-3| = 1$
$X = 3$ のとき $Y = |3-3| = 0$
$X = 4$ のとき $Y = |4-3| = 1$
$X = 5$ のとき $Y = |5-3| = 2$
$X = 6$ のとき $Y = |6-3| = 3$
$Y$ のとりうる値は $0, 1, 2, 3$ です。
$P(Y=0) = P(X=3) = \dfrac{1}{6}$
$P(Y=1) = P(X=2) + P(X=4) = \dfrac{2}{6} = \dfrac{1}{3}$
$P(Y=2) = P(X=1) + P(X=5) = \dfrac{2}{6} = \dfrac{1}{3}$
$P(Y=3) = P(X=6) = \dfrac{1}{6}$
確認:$\dfrac{1}{6} + \dfrac{1}{3} + \dfrac{1}{3} + \dfrac{1}{6} = 1$ ✓
箱の中に $1$ から $5$ までの番号が書かれたカードが1枚ずつ、計5枚入っている。この箱から同時に2枚のカードを取り出し、大きい方の番号を $X$ とする。
(1) $X$ の確率分布表を作れ。
(2) $P(X \leq 3)$ を求めよ。
全体の取り出し方:${}_5C_2 = 10$ 通り
(1) $X$ は $2, 3, 4, 5$ の値をとる(2枚引くので最小は $2$)。
$X = k$ となるのは、$k$ と $1, 2, \ldots, k-1$ のいずれか1枚を選ぶとき。よって $k-1$ 通り。
$P(X=2) = \dfrac{1}{10}$, $P(X=3) = \dfrac{2}{10}$, $P(X=4) = \dfrac{3}{10}$, $P(X=5) = \dfrac{4}{10}$
確認:$\dfrac{1+2+3+4}{10} = 1$ ✓
(2) $P(X \leq 3) = P(X=2) + P(X=3) = \dfrac{1}{10} + \dfrac{2}{10} = \dfrac{3}{10}$
「大きい方の番号が $k$」ということは、もう1枚は $1$ から $k-1$ のいずれかです。この数え方を理解すると、$P(X=k) = \dfrac{k-1}{{}_5C_2}$ と一般的に書けます。確率変数の設定と場合の数の数え上げを組み合わせた典型問題です。