第9章 統計的な推測

確率変数と確率分布
─ 統計の基礎となる概念

統計的な推測を学ぶ第一歩として、試行の結果に数値を対応させる「確率変数」と、その値と確率の対応関係を表す「確率分布」を理解します。サイコロやコインなどの身近な例を通じて、確率分布表の作り方と基本的な性質を身につけましょう。

1確率変数とは何か

数学Aで学んだ確率では「事象の確率」を扱いました。統計的な推測では、試行の結果を数値で表し、その数値の振る舞いを分析します。このとき登場するのが確率変数です。

📌 確率変数の定義

確率変数とは、試行の結果によって値が定まる変数のことです。確率変数は通常、大文字の $X$, $Y$, $Z$ などで表します。

確率変数 $X$ がある値 $a$ をとる確率を $P(X = a)$ と書きます。

具体例で理解する

サイコロを1回投げる試行を考えましょう。出る目の数を $X$ とすると、$X$ は $1, 2, 3, 4, 5, 6$ のいずれかの値をとります。このとき $X$ は確率変数です。

例えば $P(X = 3) = \dfrac{1}{6}$ は「サイコロの目が3になる確率は $\dfrac{1}{6}$」を意味します。

💡 「変数」との違い

方程式や関数で使う変数 $x$ は任意の値を自由に代入できます。一方、確率変数 $X$ はとりうる各値に確率が定まっています。この「確率付きの変数」という点が普通の変数との根本的な違いです。

確率変数には離散型連続型の2種類があります。離散型はとりうる値が飛び飛びのもの(サイコロの目、コインの表の回数など)、連続型はとりうる値がある範囲を連続的に動くもの(身長、温度など)です。この記事ではまず離散型確率変数を学びます。

2確率分布と確率分布表

確率変数 $X$ がとりうるすべての値と、それぞれの値をとる確率の対応関係を確率分布といいます。確率分布を表にまとめたものが確率分布表です。

📐 確率分布表の形

確率変数 $X$ のとりうる値が $x_1, x_2, \ldots, x_n$ であるとき:

$X$ $x_1$ $x_2$ $\cdots$ $x_n$
$P$ $p_1$ $p_2$ $\cdots$ $p_n$ $1$

ここで $p_i = P(X = x_i)$ であり、$p_i \geq 0$(各確率は0以上)です。

📝 例題:サイコロの確率分布表

問題:1個のサイコロを投げるとき、出る目の数 $X$ の確率分布表を作れ。

解:$X$ は $1, 2, 3, 4, 5, 6$ の値をとり、各値をとる確率はすべて $\dfrac{1}{6}$ です。

$X$ $1$ $2$ $3$ $4$ $5$ $6$
$P$ $\frac{1}{6}$ $\frac{1}{6}$ $\frac{1}{6}$ $\frac{1}{6}$ $\frac{1}{6}$ $\frac{1}{6}$ $1$
📝 例題:コイン2枚の確率分布表

問題:2枚のコインを同時に投げるとき、表が出る枚数 $X$ の確率分布表を作れ。

解:$X$ は $0, 1, 2$ の値をとります。

$P(X = 0) = \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{1}{4}$(2枚とも裏)

$P(X = 1) = {}_2C_1 \times \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{2}{4} = \dfrac{1}{2}$(1枚が表、1枚が裏)

$P(X = 2) = \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{1}{4}$(2枚とも表)

$X$ $0$ $1$ $2$
$P$ $\frac{1}{4}$ $\frac{1}{2}$ $\frac{1}{4}$ $1$

3確率分布の性質

確率分布には必ず満たさなければならない基本的な性質があります。

📐 確率分布の基本性質

確率変数 $X$ の確率分布 $P(X = x_i) = p_i$ について:

性質1:$0 \leq p_i \leq 1$(各確率は0以上1以下)

性質2:$\displaystyle\sum_{i=1}^{n} p_i = p_1 + p_2 + \cdots + p_n = 1$(確率の総和は1)

※ 性質2は「起こりうるすべての場合を合わせると全体になる」ことを意味します。

📌 確率の総和 = 1 の重要性

確率分布表では、確率の合計が必ず $1$ になります。この性質は以下の場面で活用できます:

1. 未知の確率を求める:他の確率がわかっていれば、残りは $1$ から引く

2. 確率分布の検算:合計が $1$ にならなければ計算ミスがある

3. 文字を含む確率の決定:$\sum p_i = 1$ から未知数を求める

📝 例題:未知の確率を求める

問題:確率変数 $X$ の確率分布が次の表で与えられるとき、$a$ の値を求めよ。

$X$ $0$ $1$ $2$ $3$
$P$ $a$ $3a$ $3a$ $a$

解:確率の総和が $1$ なので:

$$a + 3a + 3a + a = 1$$

$$8a = 1 \quad \therefore \; a = \frac{1}{8}$$

確認:各確率は $\dfrac{1}{8}, \dfrac{3}{8}, \dfrac{3}{8}, \dfrac{1}{8}$ で、すべて $0$ 以上 $1$ 以下。条件を満たす。

⚠️ 確率の条件を忘れない

✗ $\sum p_i = 1$ だけで $a$ を求めて終わりにする

✓ $\sum p_i = 1$ に加えて、すべての $p_i \geq 0$ も確認する

$a$ の値を求めた後、すべての確率が $0$ 以上 $1$ 以下であることを必ずチェックしましょう。

4確率変数の具体例

確率変数と確率分布の概念を、さまざまな具体例で練習しましょう。

📝 例題:サイコロ2個の和

問題:2個のサイコロを同時に投げるとき、出た目の和 $X$ について $P(X = 7)$ を求めよ。

解:2個のサイコロの目の組合せは全部で $6 \times 6 = 36$ 通りです。

和が $7$ になる組合せ:$(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)$ の $6$ 通り。

$$P(X = 7) = \frac{6}{36} = \frac{1}{6}$$

📝 例題:くじ引きの確率変数

問題:1等(1000円)が1本、2等(500円)が2本、はずれ(0円)が7本の計10本のくじがある。1本引いたときの賞金額 $X$ の確率分布表を作れ。

解:$X$ は $0, 500, 1000$ の値をとります。

$X$(円) $0$ $500$ $1000$
$P$ $\frac{7}{10}$ $\frac{2}{10}$ $\frac{1}{10}$ $1$

確認:$\dfrac{7}{10} + \dfrac{2}{10} + \dfrac{1}{10} = \dfrac{10}{10} = 1$ ✓

確率変数の不等式の確率

確率変数 $X$ の確率分布がわかれば、$P(X \leq a)$ や $P(a \leq X \leq b)$ なども求められます。

📝 例題:不等式の確率

問題:上のサイコロの例で $P(X \leq 3)$ と $P(2 \leq X \leq 5)$ を求めよ。

解:

$P(X \leq 3) = P(X=1) + P(X=2) + P(X=3) = \dfrac{1}{6} + \dfrac{1}{6} + \dfrac{1}{6} = \dfrac{1}{2}$

$P(2 \leq X \leq 5) = P(X=2) + P(X=3) + P(X=4) + P(X=5) = \dfrac{4}{6} = \dfrac{2}{3}$

💡 余事象の活用

$P(X \geq 4)$ を求めるとき、直接計算する代わりに余事象を使えます。

$$P(X \geq 4) = 1 - P(X \leq 3) = 1 - \frac{1}{2} = \frac{1}{2}$$

値の個数が多い方を直接数えるよりも、少ない方を計算して $1$ から引く方が効率的です。

5確率分布の活用

確率分布は統計的推測の土台です。確率分布を用いると、データの傾向を数学的に分析し、予測に役立てることができます。

📝 例題:確率分布表を利用した問題

問題:確率変数 $X$ の確率分布が次の表で与えられるとき、$P(X^2 \leq 4)$ を求めよ。

$X$ $-2$ $-1$ $0$ $1$ $3$
$P$ $0.1$ $0.2$ $0.3$ $0.3$ $0.1$

解:$X^2 \leq 4$ より $-2 \leq X \leq 2$ です。

$X$ が $-2, -1, 0, 1$ のとき $X^2 \leq 4$ を満たします($X = 3$ のとき $X^2 = 9 > 4$)。

$$P(X^2 \leq 4) = P(X=-2) + P(X=-1) + P(X=0) + P(X=1)$$

$$= 0.1 + 0.2 + 0.3 + 0.3 = 0.9$$

📌 確率変数と確率分布のまとめ

確率変数と確率分布は、これから学ぶ期待値分散標準偏差二項分布正規分布のすべての基礎になります。

確率分布表を正しく作成し、確率の性質($\sum p_i = 1$, $p_i \geq 0$)を自在に使えるようにしましょう。

📐 次の記事への橋渡し

確率分布がわかると、確率変数の「平均値」を計算できます。これが次の記事で学ぶ期待値 $E(X)$ です。

$$E(X) = \sum_{i=1}^{n} x_i p_i = x_1 p_1 + x_2 p_2 + \cdots + x_n p_n$$

※ 期待値の詳しい定義と計算方法は次の記事で扱います。

まとめ

  • 確率変数 ─ 試行の結果によって値が定まる変数。大文字 $X$, $Y$ で表す。離散型と連続型がある
  • 確率分布 ─ 確率変数のとりうる値と確率の対応関係。確率分布表にまとめる
  • 基本性質 ─ $p_i \geq 0$ かつ $\sum p_i = 1$。この2条件は確率分布の必須条件
  • 活用法 ─ 確率分布表から $P(X \leq a)$ や $P(a \leq X \leq b)$ を計算。余事象も有効
  • 次への接続 ─ 確率分布は期待値・分散・標準偏差など統計量の計算の基礎となる

確認テスト

Q1. 確率変数とはどのようなものか、簡潔に説明せよ。

▶ クリックして解答を表示 試行の結果によって値が定まる変数のこと。とりうる各値に確率が対応している。

Q2. 確率分布表において、確率の総和はいくつになるか。

▶ クリックして解答を表示 $1$。すべての確率の和 $\sum p_i = 1$ が確率分布の基本性質である。

Q3. 確率変数 $X$ の確率分布が $P(X=1)=0.2$, $P(X=2)=0.5$, $P(X=3)=a$ のとき、$a$ の値を求めよ。

▶ クリックして解答を表示 $0.2 + 0.5 + a = 1$ より $a = 0.3$。

Q4. 1個のサイコロを投げるとき、出る目 $X$ について $P(X \geq 5)$ を求めよ。

▶ クリックして解答を表示 $P(X \geq 5) = P(X=5) + P(X=6) = \dfrac{1}{6} + \dfrac{1}{6} = \dfrac{1}{3}$。

Q5. 3枚のコインを同時に投げるとき、表が出る枚数 $X$ の確率分布表を作れ。

▶ クリックして解答を表示 $X = 0, 1, 2, 3$。$P(X=0) = \frac{1}{8}$, $P(X=1) = \frac{3}{8}$, $P(X=2) = \frac{3}{8}$, $P(X=3) = \frac{1}{8}$。確認:$\frac{1+3+3+1}{8} = 1$ ✓

入試問題演習

問題 1 A 基礎 確率分布表

袋の中に赤玉3個、白玉2個が入っている。同時に2個の玉を取り出すとき、赤玉の個数 $X$ の確率分布表を作れ。

解答

$X$ は $0, 1, 2$ の値をとる。

全体の取り出し方:${}_5C_2 = 10$ 通り

$P(X=0) = \dfrac{{}_2C_2}{{}_5C_2} = \dfrac{1}{10}$(白玉2個)

$P(X=1) = \dfrac{{}_3C_1 \cdot {}_2C_1}{{}_5C_2} = \dfrac{6}{10} = \dfrac{3}{5}$(赤1個・白1個)

$P(X=2) = \dfrac{{}_3C_2}{{}_5C_2} = \dfrac{3}{10}$(赤玉2個)

確認:$\dfrac{1}{10} + \dfrac{6}{10} + \dfrac{3}{10} = 1$ ✓

▶ 解答を見る
問題 2 B 標準 確率の条件

確率変数 $X$ の確率分布が次の表で与えられるとき、定数 $a$ の値を求めよ。また $P(X \geq 2)$ を求めよ。

$X$ $0$ $1$ $2$ $3$
$P$ $a^2$ $2a$ $a$ $a^2$
解答

確率の総和が $1$ なので:$a^2 + 2a + a + a^2 = 1$

$2a^2 + 3a - 1 = 0$

解の公式より $a = \dfrac{-3 \pm \sqrt{9 + 8}}{4} = \dfrac{-3 \pm \sqrt{17}}{4}$

$a > 0$(確率は非負)なので $a = \dfrac{-3 + \sqrt{17}}{4}$

$P(X \geq 2) = a + a^2 = a(1+a)$。$a = \dfrac{-3+\sqrt{17}}{4}$ を代入して計算する。

$1+a = \dfrac{1+\sqrt{17}}{4}$ より $P(X \geq 2) = \dfrac{(-3+\sqrt{17})(1+\sqrt{17})}{16} = \dfrac{-3+3\sqrt{17}-\sqrt{17}+17-3}{16}$

$\phantom{P(X \geq 2)} = \dfrac{14 - 2\sqrt{17}}{16} = \dfrac{7-\sqrt{17}}{8}$

解説

$a$ が2次方程式の解になるケースでは、$p_i \geq 0$ の条件から不適な解を除外する作業が必須です。本問では $a > 0$ かつ $a^2 \leq 1$ を確認します。

▶ 解答を見る
問題 3 B 標準 確率変数の変換

1個のサイコロを投げるとき、出た目の数を $X$ とする。$Y = |X - 3|$ とおくとき、$Y$ の確率分布表を作れ。

解答

$X = 1$ のとき $Y = |1-3| = 2$

$X = 2$ のとき $Y = |2-3| = 1$

$X = 3$ のとき $Y = |3-3| = 0$

$X = 4$ のとき $Y = |4-3| = 1$

$X = 5$ のとき $Y = |5-3| = 2$

$X = 6$ のとき $Y = |6-3| = 3$

$Y$ のとりうる値は $0, 1, 2, 3$ です。

$P(Y=0) = P(X=3) = \dfrac{1}{6}$

$P(Y=1) = P(X=2) + P(X=4) = \dfrac{2}{6} = \dfrac{1}{3}$

$P(Y=2) = P(X=1) + P(X=5) = \dfrac{2}{6} = \dfrac{1}{3}$

$P(Y=3) = P(X=6) = \dfrac{1}{6}$

確認:$\dfrac{1}{6} + \dfrac{1}{3} + \dfrac{1}{3} + \dfrac{1}{6} = 1$ ✓

▶ 解答を見る
問題 4 C 発展 確率分布の応用

箱の中に $1$ から $5$ までの番号が書かれたカードが1枚ずつ、計5枚入っている。この箱から同時に2枚のカードを取り出し、大きい方の番号を $X$ とする。

(1) $X$ の確率分布表を作れ。

(2) $P(X \leq 3)$ を求めよ。

解答

全体の取り出し方:${}_5C_2 = 10$ 通り

(1) $X$ は $2, 3, 4, 5$ の値をとる(2枚引くので最小は $2$)。

$X = k$ となるのは、$k$ と $1, 2, \ldots, k-1$ のいずれか1枚を選ぶとき。よって $k-1$ 通り。

$P(X=2) = \dfrac{1}{10}$, $P(X=3) = \dfrac{2}{10}$, $P(X=4) = \dfrac{3}{10}$, $P(X=5) = \dfrac{4}{10}$

確認:$\dfrac{1+2+3+4}{10} = 1$ ✓

(2) $P(X \leq 3) = P(X=2) + P(X=3) = \dfrac{1}{10} + \dfrac{2}{10} = \dfrac{3}{10}$

解説

「大きい方の番号が $k$」ということは、もう1枚は $1$ から $k-1$ のいずれかです。この数え方を理解すると、$P(X=k) = \dfrac{k-1}{{}_5C_2}$ と一般的に書けます。確率変数の設定と場合の数の数え上げを組み合わせた典型問題です。

▶ 解答を見る