第9章 統計的な推測

確率変数の分散と標準偏差
─ 散らばりを数値化する

期待値は確率変数の「中心」を表す量でしたが、中心だけではデータの全体像はわかりません。値がどれくらいばらつくかを示す指標が「分散」と「標準偏差」です。定義・計算公式・性質を一つずつ丁寧に学びましょう。

1分散とは何か

期待値が同じでも、値の散らばり方は大きく異なる場合があります。例えば次の2つの確率変数を比べてみましょう。

$X$ $3$ $4$ $5$
$P$ $\frac{1}{4}$ $\frac{1}{2}$ $\frac{1}{4}$
$Y$ $0$ $4$ $8$
$P$ $\frac{1}{4}$ $\frac{1}{2}$ $\frac{1}{4}$

どちらも $E(X) = E(Y) = 4$ ですが、$X$ は $3, 4, 5$ と中心の近くに集まっているのに対し、$Y$ は $0, 4, 8$ と大きく散らばっています。この「散らばりの度合い」を数値化するのが分散です。

📐 分散の定義

確率変数 $X$ の期待値を $\mu = E(X)$ とするとき、$X$ の分散 $V(X)$ は:

$$V(X) = E\!\left[(X - \mu)^2\right] = \sum_{i=1}^{n} (x_i - \mu)^2 \, p_i$$

※ 分散は「各値と平均との差の2乗」の期待値です。散らばりが大きいほど分散は大きくなります。

📌 分散の意味

分散 $V(X)$ は、確率変数の値が期待値(平均)からどれだけ離れているかの平均的な度合いを表します。

偏差:$x_i - \mu$(各値と平均の差)

偏差の2乗の期待値:偏差をそのまま平均すると正負が打ち消し合うため、2乗してから平均をとります

分散が $0$ ならば、$X$ は常に $\mu$ の値をとる(散らばりなし)ことを意味します。

📝 例題:定義に従った分散の計算

問題:上の $X$($3, 4, 5$)と $Y$($0, 4, 8$)の分散をそれぞれ求めよ。

解:$E(X) = E(Y) = 4$ です。

$V(X) = (3-4)^2 \cdot \dfrac{1}{4} + (4-4)^2 \cdot \dfrac{1}{2} + (5-4)^2 \cdot \dfrac{1}{4} = \dfrac{1}{4} + 0 + \dfrac{1}{4} = \dfrac{1}{2}$

$V(Y) = (0-4)^2 \cdot \dfrac{1}{4} + (4-4)^2 \cdot \dfrac{1}{2} + (8-4)^2 \cdot \dfrac{1}{4} = 4 + 0 + 4 = 8$

$V(Y) = 8 > V(X) = \dfrac{1}{2}$ なので、$Y$ の方が散らばりが大きいことが数値で確認できます。

2分散の計算公式

定義式 $V(X) = E[(X-\mu)^2]$ を展開すると、計算に便利な公式が得られます。

📐 分散の計算公式

$$V(X) = E(X^2) - \{E(X)\}^2$$

すなわち:分散 = 「2乗の期待値」 - 「期待値の2乗」

※ この公式は実際の計算で最もよく使います。定義式よりも計算が楽です。

📝 公式の導出

$\mu = E(X)$ とおくと:

$$V(X) = E[(X - \mu)^2] = E[X^2 - 2\mu X + \mu^2]$$

期待値の線形性より:

$$= E(X^2) - 2\mu E(X) + \mu^2 = E(X^2) - 2\mu \cdot \mu + \mu^2$$

$$= E(X^2) - 2\mu^2 + \mu^2 = E(X^2) - \mu^2 = E(X^2) - \{E(X)\}^2 \quad \square$$

📝 例題:公式を使った分散の計算

問題:1個のサイコロを投げるとき、出る目 $X$ の分散を求めよ。

解:

$E(X) = \dfrac{1+2+3+4+5+6}{6} = \dfrac{7}{2}$

$E(X^2) = \dfrac{1^2+2^2+3^2+4^2+5^2+6^2}{6} = \dfrac{1+4+9+16+25+36}{6} = \dfrac{91}{6}$

$$V(X) = E(X^2) - \{E(X)\}^2 = \frac{91}{6} - \left(\frac{7}{2}\right)^2 = \frac{91}{6} - \frac{49}{4} = \frac{182 - 147}{12} = \frac{35}{12}$$

⚠️ 公式の適用ミス

✗ $V(X) = \{E(X)\}^2 - E(X^2)$(引く順番を逆にする)

✓ $V(X) = E(X^2) - \{E(X)\}^2$(「2乗の期待値」が先)

分散は常に $V(X) \geq 0$ です。計算結果が負になったら、引く順番が逆です。

💡 計算手順のまとめ

ステップ1:$E(X) = \sum x_i p_i$ を計算する

ステップ2:$E(X^2) = \sum x_i^2 p_i$ を計算する

ステップ3:$V(X) = E(X^2) - \{E(X)\}^2$ に代入する

この3ステップを確実にこなせるようにしましょう。

3標準偏差

分散は偏差を「2乗」して求めるため、単位が元の値の2乗になってしまいます。そこで、分散の正の平方根をとったものを標準偏差といいます。

📐 標準偏差の定義

$$\sigma(X) = \sqrt{V(X)}$$

標準偏差は $\sigma(X)$ または $\sigma$ と表記します。単位が元の確率変数と同じなので、散らばりの大きさを直感的に理解しやすい量です。

📝 例題:標準偏差の計算

問題:サイコロの目 $X$ の標準偏差を求めよ。

解:$V(X) = \dfrac{35}{12}$ なので:

$$\sigma(X) = \sqrt{\frac{35}{12}} = \frac{\sqrt{35}}{\sqrt{12}} = \frac{\sqrt{35}}{2\sqrt{3}} = \frac{\sqrt{105}}{6} \approx 1.71$$

サイコロの目は期待値 $3.5$ を中心に、おおよそ $\pm 1.71$ の範囲に散らばっていると解釈できます。

📌 分散と標準偏差の使い分け

分散 $V(X)$:計算上の扱いやすさに優れる。公式や性質の証明では分散を使う

標準偏差 $\sigma(X)$:元の単位と同じなので解釈しやすい。実際のデータ分析では標準偏差を使う

例:テストの点数(満点100点)の場合、分散は「点$^2$」の単位を持ちますが、標準偏差は「点」の単位を持ちます。

4分散・標準偏差の性質

確率変数に定数倍や加算を行ったとき、分散と標準偏差がどう変化するかを学びます。

📐 $aX + b$ の分散と標準偏差

確率変数 $X$ と定数 $a, b$ について:

$$V(aX + b) = a^2 V(X)$$

$$\sigma(aX + b) = |a| \, \sigma(X)$$

※ 定数 $b$ の加算は分散に影響しません(全体をずらしても散らばりは変わらない)。定数 $a$ の倍率は2乗で効きます。

📝 $V(aX + b) = a^2 V(X)$ の証明

$E(aX + b) = aE(X) + b = a\mu + b$ です。

$$V(aX + b) = E\!\left[(aX + b - (a\mu + b))^2\right] = E\!\left[(a(X - \mu))^2\right]$$

$$= E\!\left[a^2(X - \mu)^2\right] = a^2 E\!\left[(X - \mu)^2\right] = a^2 V(X) \quad \square$$

📝 例題:性質の利用

問題:$E(X) = 5$, $V(X) = 4$ のとき、$Y = 3X - 2$ の期待値と分散を求めよ。

解:

$E(Y) = E(3X - 2) = 3E(X) - 2 = 3 \times 5 - 2 = 13$

$V(Y) = V(3X - 2) = 3^2 V(X) = 9 \times 4 = 36$

$\sigma(Y) = 3\sigma(X) = 3 \times 2 = 6$

⚠️ 分散の定数倍に注意

✗ $V(aX + b) = aV(X) + b$(期待値と同じルールを適用する)

✓ $V(aX + b) = a^2 V(X)$($a$ は2乗、$b$ は消える)

期待値では $E(aX + b) = aE(X) + b$ ですが、分散は全く異なります。$a$ が2乗になること、$b$ が消えることの2点を確実に覚えましょう。

特別な場合

📐 分散に関する特別な性質

(1) $V(X) \geq 0$(分散は常に非負)

(2) $V(X) = 0 \iff X$ は定数(散らばりなし)

(3) $V(c) = 0$(定数 $c$ の分散は $0$)

(4) $V(X + b) = V(X)$(定数の加減は分散を変えない)

💡 データの標準化との関係

$Z = \dfrac{X - \mu}{\sigma}$ とおくと、$E(Z) = 0$, $V(Z) = 1$ となります。

これは標準化と呼ばれ、正規分布の学習で非常に重要になります。

確認:$E(Z) = \dfrac{1}{\sigma}(E(X) - \mu) = 0$、$V(Z) = \dfrac{1}{\sigma^2} V(X) = \dfrac{\sigma^2}{\sigma^2} = 1$

5分散・標準偏差の活用

分散と標準偏差の総合的な計算問題に取り組みましょう。

📝 例題:確率分布表からの一括計算

問題:確率変数 $X$ の確率分布が次の表のとき、$E(X)$, $V(X)$, $\sigma(X)$ を求めよ。

$X$ $1$ $2$ $3$ $4$
$P$ $\frac{1}{10}$ $\frac{3}{10}$ $\frac{4}{10}$ $\frac{2}{10}$

解:

$E(X) = 1 \cdot \dfrac{1}{10} + 2 \cdot \dfrac{3}{10} + 3 \cdot \dfrac{4}{10} + 4 \cdot \dfrac{2}{10} = \dfrac{1+6+12+8}{10} = \dfrac{27}{10} = 2.7$

$E(X^2) = 1 \cdot \dfrac{1}{10} + 4 \cdot \dfrac{3}{10} + 9 \cdot \dfrac{4}{10} + 16 \cdot \dfrac{2}{10} = \dfrac{1+12+36+32}{10} = \dfrac{81}{10} = 8.1$

$V(X) = E(X^2) - \{E(X)\}^2 = 8.1 - 2.7^2 = 8.1 - 7.29 = 0.81$

$\sigma(X) = \sqrt{0.81} = 0.9$

📝 例題:分散の条件から確率を求める

問題:確率変数 $X$ のとりうる値が $-1, 0, 1$ で、確率分布が対称($P(X=-1) = P(X=1) = p$)であるとき、$V(X) = \dfrac{1}{2}$ となる $p$ の値を求めよ。

解:確率の総和:$p + P(X=0) + p = 1$ より $P(X=0) = 1 - 2p$

対称性より $E(X) = (-1) \cdot p + 0 \cdot (1-2p) + 1 \cdot p = 0$

$E(X^2) = (-1)^2 \cdot p + 0^2 \cdot (1-2p) + 1^2 \cdot p = 2p$

$V(X) = E(X^2) - \{E(X)\}^2 = 2p - 0 = 2p$

$V(X) = \dfrac{1}{2}$ より $2p = \dfrac{1}{2}$、$p = \dfrac{1}{4}$

確認:$P(X=0) = 1 - 2 \cdot \dfrac{1}{4} = \dfrac{1}{2} \geq 0$ ✓

📌 分散・標準偏差の公式まとめ

定義:$V(X) = E[(X - \mu)^2]$

計算公式:$V(X) = E(X^2) - \{E(X)\}^2$

標準偏差:$\sigma(X) = \sqrt{V(X)}$

線形変換:$V(aX + b) = a^2 V(X)$, $\sigma(aX + b) = |a|\sigma(X)$

📐 次の記事への橋渡し

期待値・分散・標準偏差の3つが揃い、確率変数の基本的な特徴を捉える道具が揃いました。次の記事では、確率変数の線形変換 $Y = aX + b$ についてさらに詳しく学びます。

※ 線形変換の詳細な性質と独立な確率変数の和の分散は次の記事で扱います。

まとめ

  • 分散の定義 ─ $V(X) = E[(X-\mu)^2]$。期待値からの偏差の2乗の平均。散らばりの指標
  • 計算公式 ─ $V(X) = E(X^2) - \{E(X)\}^2$。「2乗の期待値」から「期待値の2乗」を引く
  • 標準偏差 ─ $\sigma(X) = \sqrt{V(X)}$。元の単位と同じで解釈しやすい
  • 線形変換 ─ $V(aX+b) = a^2 V(X)$。期待値と違い、$a$ は2乗、$b$ は消える
  • 次への接続 ─ 期待値・分散・標準偏差は二項分布・正規分布・統計的推測の基礎となる

確認テスト

Q1. 分散 $V(X)$ の計算公式を述べよ。

▶ クリックして解答を表示 $V(X) = E(X^2) - \{E(X)\}^2$(2乗の期待値 - 期待値の2乗)。

Q2. $V(X) = 9$ のとき、標準偏差 $\sigma(X)$ はいくつか。

▶ クリックして解答を表示 $\sigma(X) = \sqrt{V(X)} = \sqrt{9} = 3$。

Q3. $V(X) = 4$ のとき、$V(3X + 5)$ はいくつか。

▶ クリックして解答を表示 $V(3X + 5) = 3^2 \cdot V(X) = 9 \times 4 = 36$。定数 $+5$ は分散に影響しない。

Q4. $E(X) = 3$, $E(X^2) = 11$ のとき、$V(X)$ を求めよ。

▶ クリックして解答を表示 $V(X) = E(X^2) - \{E(X)\}^2 = 11 - 9 = 2$。

Q5. 定数 $c$ の分散 $V(c)$ はいくつか。理由も述べよ。

▶ クリックして解答を表示 $V(c) = 0$。定数は常に同じ値をとるので散らばりがない。$E(c^2) - \{E(c)\}^2 = c^2 - c^2 = 0$ からも確認できる。

入試問題演習

問題 1 A 基礎 分散の計算

確率変数 $X$ の確率分布が次の表で与えられるとき、$V(X)$ と $\sigma(X)$ を求めよ。

$X$ $1$ $2$ $3$
$P$ $\frac{1}{6}$ $\frac{1}{2}$ $\frac{1}{3}$
解答

$E(X) = 1 \cdot \dfrac{1}{6} + 2 \cdot \dfrac{1}{2} + 3 \cdot \dfrac{1}{3} = \dfrac{1}{6} + 1 + 1 = \dfrac{13}{6}$

$E(X^2) = 1 \cdot \dfrac{1}{6} + 4 \cdot \dfrac{1}{2} + 9 \cdot \dfrac{1}{3} = \dfrac{1}{6} + 2 + 3 = \dfrac{31}{6}$

$V(X) = \dfrac{31}{6} - \left(\dfrac{13}{6}\right)^2 = \dfrac{31}{6} - \dfrac{169}{36} = \dfrac{186 - 169}{36} = \dfrac{17}{36}$

$\sigma(X) = \sqrt{\dfrac{17}{36}} = \dfrac{\sqrt{17}}{6}$

▶ 解答を見る
問題 2 B 標準 線形変換と分散

確率変数 $X$ について $E(X) = 10$, $\sigma(X) = 3$ が成り立つ。$Y = 2X - 5$ とするとき:

(1) $E(Y)$, $V(Y)$, $\sigma(Y)$ を求めよ。

(2) $Z = \dfrac{X - 10}{3}$ とするとき、$E(Z)$, $V(Z)$ を求めよ。

解答

$V(X) = \sigma(X)^2 = 9$

(1) $E(Y) = 2 \times 10 - 5 = 15$

$V(Y) = 2^2 \times 9 = 36$

$\sigma(Y) = |2| \times 3 = 6$

(2) $Z = \dfrac{1}{3}X - \dfrac{10}{3}$ より $a = \dfrac{1}{3}$, $b = -\dfrac{10}{3}$

$E(Z) = \dfrac{1}{3} \times 10 - \dfrac{10}{3} = \dfrac{10}{3} - \dfrac{10}{3} = 0$

$V(Z) = \left(\dfrac{1}{3}\right)^2 \times 9 = \dfrac{9}{9} = 1$

解説

(2) の $Z = \dfrac{X - \mu}{\sigma}$ は標準化変換で、$E(Z) = 0$, $V(Z) = 1$ が常に成り立ちます。正規分布を標準正規分布に変換する際に使う重要な操作です。

▶ 解答を見る
問題 3 B 標準 分散の条件

確率変数 $X$ の確率分布が次のとき、$V(X)$ が最大となる $a$ の値を求めよ。ただし $0 \leq a \leq \dfrac{1}{2}$ とする。

$X$ $0$ $1$ $2$
$P$ $a$ $1-2a$ $a$
解答

$E(X) = 0 \cdot a + 1 \cdot (1-2a) + 2 \cdot a = 1-2a+2a = 1$

$E(X^2) = 0 \cdot a + 1 \cdot (1-2a) + 4 \cdot a = 1-2a+4a = 1+2a$

$V(X) = E(X^2) - \{E(X)\}^2 = (1+2a) - 1 = 2a$

$V(X) = 2a$ は $a$ の増加関数なので、$0 \leq a \leq \dfrac{1}{2}$ の範囲で $a = \dfrac{1}{2}$ のとき最大。

$$a = \frac{1}{2} \quad \text{(最大の分散は } V(X) = 1\text{)}$$

このとき $P(X=0) = P(X=2) = \dfrac{1}{2}$, $P(X=1) = 0$ で、値が両端に集中します。

解説

対称な確率分布では、中央の確率が減って両端に集中するほど分散が大きくなります。$a = \dfrac{1}{2}$ のときが最も散らばった状態($X$ は $0$ か $2$ のみで、確率はそれぞれ $\dfrac{1}{2}$)です。

▶ 解答を見る
問題 4 C 発展 分散の総合

1個のサイコロを2回投げる。1回目に出た目を $X_1$、2回目に出た目を $X_2$ とし、$Y = X_1 + X_2$ とする。

(1) $E(Y)$ を求めよ。

(2) $E(Y^2)$ を求めよ。(ヒント:$Y^2 = X_1^2 + 2X_1 X_2 + X_2^2$ を利用せよ)

(3) $V(Y)$ を求めよ。

解答

(1) $E(Y) = E(X_1 + X_2) = E(X_1) + E(X_2) = \dfrac{7}{2} + \dfrac{7}{2} = 7$

(2) $Y^2 = X_1^2 + 2X_1 X_2 + X_2^2$ より

$E(Y^2) = E(X_1^2) + 2E(X_1 X_2) + E(X_2^2)$

$X_1$ と $X_2$ は独立なので $E(X_1 X_2) = E(X_1) \cdot E(X_2) = \dfrac{7}{2} \cdot \dfrac{7}{2} = \dfrac{49}{4}$

$E(X_1^2) = E(X_2^2) = \dfrac{91}{6}$

$E(Y^2) = \dfrac{91}{6} + 2 \cdot \dfrac{49}{4} + \dfrac{91}{6} = \dfrac{91}{6} + \dfrac{49}{2} + \dfrac{91}{6} = \dfrac{182}{6} + \dfrac{49}{2} = \dfrac{182}{6} + \dfrac{147}{6} = \dfrac{329}{6}$

(3) $V(Y) = E(Y^2) - \{E(Y)\}^2 = \dfrac{329}{6} - 49 = \dfrac{329 - 294}{6} = \dfrac{35}{6}$

解説

$X_1$ と $X_2$ が独立のとき、$V(X_1 + X_2) = V(X_1) + V(X_2)$ が成り立ちます(独立な確率変数の和の分散は分散の和)。実際、$V(X_1) = V(X_2) = \dfrac{35}{12}$ なので $V(Y) = \dfrac{35}{12} + \dfrac{35}{12} = \dfrac{35}{6}$ と一致します。この性質は今後の学習で非常に重要になります。

▶ 解答を見る