期待値は確率変数の「中心」を表す量でしたが、中心だけではデータの全体像はわかりません。値がどれくらいばらつくかを示す指標が「分散」と「標準偏差」です。定義・計算公式・性質を一つずつ丁寧に学びましょう。
期待値が同じでも、値の散らばり方は大きく異なる場合があります。例えば次の2つの確率変数を比べてみましょう。
| $X$ | $3$ | $4$ | $5$ |
|---|---|---|---|
| $P$ | $\frac{1}{4}$ | $\frac{1}{2}$ | $\frac{1}{4}$ |
| $Y$ | $0$ | $4$ | $8$ |
|---|---|---|---|
| $P$ | $\frac{1}{4}$ | $\frac{1}{2}$ | $\frac{1}{4}$ |
どちらも $E(X) = E(Y) = 4$ ですが、$X$ は $3, 4, 5$ と中心の近くに集まっているのに対し、$Y$ は $0, 4, 8$ と大きく散らばっています。この「散らばりの度合い」を数値化するのが分散です。
確率変数 $X$ の期待値を $\mu = E(X)$ とするとき、$X$ の分散 $V(X)$ は:
$$V(X) = E\!\left[(X - \mu)^2\right] = \sum_{i=1}^{n} (x_i - \mu)^2 \, p_i$$
※ 分散は「各値と平均との差の2乗」の期待値です。散らばりが大きいほど分散は大きくなります。
分散 $V(X)$ は、確率変数の値が期待値(平均)からどれだけ離れているかの平均的な度合いを表します。
偏差:$x_i - \mu$(各値と平均の差)
偏差の2乗の期待値:偏差をそのまま平均すると正負が打ち消し合うため、2乗してから平均をとります
分散が $0$ ならば、$X$ は常に $\mu$ の値をとる(散らばりなし)ことを意味します。
問題:上の $X$($3, 4, 5$)と $Y$($0, 4, 8$)の分散をそれぞれ求めよ。
解:$E(X) = E(Y) = 4$ です。
$V(X) = (3-4)^2 \cdot \dfrac{1}{4} + (4-4)^2 \cdot \dfrac{1}{2} + (5-4)^2 \cdot \dfrac{1}{4} = \dfrac{1}{4} + 0 + \dfrac{1}{4} = \dfrac{1}{2}$
$V(Y) = (0-4)^2 \cdot \dfrac{1}{4} + (4-4)^2 \cdot \dfrac{1}{2} + (8-4)^2 \cdot \dfrac{1}{4} = 4 + 0 + 4 = 8$
$V(Y) = 8 > V(X) = \dfrac{1}{2}$ なので、$Y$ の方が散らばりが大きいことが数値で確認できます。
定義式 $V(X) = E[(X-\mu)^2]$ を展開すると、計算に便利な公式が得られます。
$$V(X) = E(X^2) - \{E(X)\}^2$$
すなわち:分散 = 「2乗の期待値」 - 「期待値の2乗」
※ この公式は実際の計算で最もよく使います。定義式よりも計算が楽です。
$\mu = E(X)$ とおくと:
$$V(X) = E[(X - \mu)^2] = E[X^2 - 2\mu X + \mu^2]$$
期待値の線形性より:
$$= E(X^2) - 2\mu E(X) + \mu^2 = E(X^2) - 2\mu \cdot \mu + \mu^2$$
$$= E(X^2) - 2\mu^2 + \mu^2 = E(X^2) - \mu^2 = E(X^2) - \{E(X)\}^2 \quad \square$$
問題:1個のサイコロを投げるとき、出る目 $X$ の分散を求めよ。
解:
$E(X) = \dfrac{1+2+3+4+5+6}{6} = \dfrac{7}{2}$
$E(X^2) = \dfrac{1^2+2^2+3^2+4^2+5^2+6^2}{6} = \dfrac{1+4+9+16+25+36}{6} = \dfrac{91}{6}$
$$V(X) = E(X^2) - \{E(X)\}^2 = \frac{91}{6} - \left(\frac{7}{2}\right)^2 = \frac{91}{6} - \frac{49}{4} = \frac{182 - 147}{12} = \frac{35}{12}$$
✗ $V(X) = \{E(X)\}^2 - E(X^2)$(引く順番を逆にする)
✓ $V(X) = E(X^2) - \{E(X)\}^2$(「2乗の期待値」が先)
分散は常に $V(X) \geq 0$ です。計算結果が負になったら、引く順番が逆です。
ステップ1:$E(X) = \sum x_i p_i$ を計算する
ステップ2:$E(X^2) = \sum x_i^2 p_i$ を計算する
ステップ3:$V(X) = E(X^2) - \{E(X)\}^2$ に代入する
この3ステップを確実にこなせるようにしましょう。
分散は偏差を「2乗」して求めるため、単位が元の値の2乗になってしまいます。そこで、分散の正の平方根をとったものを標準偏差といいます。
$$\sigma(X) = \sqrt{V(X)}$$
標準偏差は $\sigma(X)$ または $\sigma$ と表記します。単位が元の確率変数と同じなので、散らばりの大きさを直感的に理解しやすい量です。
問題:サイコロの目 $X$ の標準偏差を求めよ。
解:$V(X) = \dfrac{35}{12}$ なので:
$$\sigma(X) = \sqrt{\frac{35}{12}} = \frac{\sqrt{35}}{\sqrt{12}} = \frac{\sqrt{35}}{2\sqrt{3}} = \frac{\sqrt{105}}{6} \approx 1.71$$
サイコロの目は期待値 $3.5$ を中心に、おおよそ $\pm 1.71$ の範囲に散らばっていると解釈できます。
分散 $V(X)$:計算上の扱いやすさに優れる。公式や性質の証明では分散を使う
標準偏差 $\sigma(X)$:元の単位と同じなので解釈しやすい。実際のデータ分析では標準偏差を使う
例:テストの点数(満点100点)の場合、分散は「点$^2$」の単位を持ちますが、標準偏差は「点」の単位を持ちます。
確率変数に定数倍や加算を行ったとき、分散と標準偏差がどう変化するかを学びます。
確率変数 $X$ と定数 $a, b$ について:
$$V(aX + b) = a^2 V(X)$$
$$\sigma(aX + b) = |a| \, \sigma(X)$$
※ 定数 $b$ の加算は分散に影響しません(全体をずらしても散らばりは変わらない)。定数 $a$ の倍率は2乗で効きます。
$E(aX + b) = aE(X) + b = a\mu + b$ です。
$$V(aX + b) = E\!\left[(aX + b - (a\mu + b))^2\right] = E\!\left[(a(X - \mu))^2\right]$$
$$= E\!\left[a^2(X - \mu)^2\right] = a^2 E\!\left[(X - \mu)^2\right] = a^2 V(X) \quad \square$$
問題:$E(X) = 5$, $V(X) = 4$ のとき、$Y = 3X - 2$ の期待値と分散を求めよ。
解:
$E(Y) = E(3X - 2) = 3E(X) - 2 = 3 \times 5 - 2 = 13$
$V(Y) = V(3X - 2) = 3^2 V(X) = 9 \times 4 = 36$
$\sigma(Y) = 3\sigma(X) = 3 \times 2 = 6$
✗ $V(aX + b) = aV(X) + b$(期待値と同じルールを適用する)
✓ $V(aX + b) = a^2 V(X)$($a$ は2乗、$b$ は消える)
期待値では $E(aX + b) = aE(X) + b$ ですが、分散は全く異なります。$a$ が2乗になること、$b$ が消えることの2点を確実に覚えましょう。
(1) $V(X) \geq 0$(分散は常に非負)
(2) $V(X) = 0 \iff X$ は定数(散らばりなし)
(3) $V(c) = 0$(定数 $c$ の分散は $0$)
(4) $V(X + b) = V(X)$(定数の加減は分散を変えない)
$Z = \dfrac{X - \mu}{\sigma}$ とおくと、$E(Z) = 0$, $V(Z) = 1$ となります。
これは標準化と呼ばれ、正規分布の学習で非常に重要になります。
確認:$E(Z) = \dfrac{1}{\sigma}(E(X) - \mu) = 0$、$V(Z) = \dfrac{1}{\sigma^2} V(X) = \dfrac{\sigma^2}{\sigma^2} = 1$
分散と標準偏差の総合的な計算問題に取り組みましょう。
問題:確率変数 $X$ の確率分布が次の表のとき、$E(X)$, $V(X)$, $\sigma(X)$ を求めよ。
| $X$ | $1$ | $2$ | $3$ | $4$ |
|---|---|---|---|---|
| $P$ | $\frac{1}{10}$ | $\frac{3}{10}$ | $\frac{4}{10}$ | $\frac{2}{10}$ |
解:
$E(X) = 1 \cdot \dfrac{1}{10} + 2 \cdot \dfrac{3}{10} + 3 \cdot \dfrac{4}{10} + 4 \cdot \dfrac{2}{10} = \dfrac{1+6+12+8}{10} = \dfrac{27}{10} = 2.7$
$E(X^2) = 1 \cdot \dfrac{1}{10} + 4 \cdot \dfrac{3}{10} + 9 \cdot \dfrac{4}{10} + 16 \cdot \dfrac{2}{10} = \dfrac{1+12+36+32}{10} = \dfrac{81}{10} = 8.1$
$V(X) = E(X^2) - \{E(X)\}^2 = 8.1 - 2.7^2 = 8.1 - 7.29 = 0.81$
$\sigma(X) = \sqrt{0.81} = 0.9$
問題:確率変数 $X$ のとりうる値が $-1, 0, 1$ で、確率分布が対称($P(X=-1) = P(X=1) = p$)であるとき、$V(X) = \dfrac{1}{2}$ となる $p$ の値を求めよ。
解:確率の総和:$p + P(X=0) + p = 1$ より $P(X=0) = 1 - 2p$
対称性より $E(X) = (-1) \cdot p + 0 \cdot (1-2p) + 1 \cdot p = 0$
$E(X^2) = (-1)^2 \cdot p + 0^2 \cdot (1-2p) + 1^2 \cdot p = 2p$
$V(X) = E(X^2) - \{E(X)\}^2 = 2p - 0 = 2p$
$V(X) = \dfrac{1}{2}$ より $2p = \dfrac{1}{2}$、$p = \dfrac{1}{4}$
確認:$P(X=0) = 1 - 2 \cdot \dfrac{1}{4} = \dfrac{1}{2} \geq 0$ ✓
定義:$V(X) = E[(X - \mu)^2]$
計算公式:$V(X) = E(X^2) - \{E(X)\}^2$
標準偏差:$\sigma(X) = \sqrt{V(X)}$
線形変換:$V(aX + b) = a^2 V(X)$, $\sigma(aX + b) = |a|\sigma(X)$
期待値・分散・標準偏差の3つが揃い、確率変数の基本的な特徴を捉える道具が揃いました。次の記事では、確率変数の線形変換 $Y = aX + b$ についてさらに詳しく学びます。
※ 線形変換の詳細な性質と独立な確率変数の和の分散は次の記事で扱います。
Q1. 分散 $V(X)$ の計算公式を述べよ。
Q2. $V(X) = 9$ のとき、標準偏差 $\sigma(X)$ はいくつか。
Q3. $V(X) = 4$ のとき、$V(3X + 5)$ はいくつか。
Q4. $E(X) = 3$, $E(X^2) = 11$ のとき、$V(X)$ を求めよ。
Q5. 定数 $c$ の分散 $V(c)$ はいくつか。理由も述べよ。
確率変数 $X$ の確率分布が次の表で与えられるとき、$V(X)$ と $\sigma(X)$ を求めよ。
| $X$ | $1$ | $2$ | $3$ |
|---|---|---|---|
| $P$ | $\frac{1}{6}$ | $\frac{1}{2}$ | $\frac{1}{3}$ |
$E(X) = 1 \cdot \dfrac{1}{6} + 2 \cdot \dfrac{1}{2} + 3 \cdot \dfrac{1}{3} = \dfrac{1}{6} + 1 + 1 = \dfrac{13}{6}$
$E(X^2) = 1 \cdot \dfrac{1}{6} + 4 \cdot \dfrac{1}{2} + 9 \cdot \dfrac{1}{3} = \dfrac{1}{6} + 2 + 3 = \dfrac{31}{6}$
$V(X) = \dfrac{31}{6} - \left(\dfrac{13}{6}\right)^2 = \dfrac{31}{6} - \dfrac{169}{36} = \dfrac{186 - 169}{36} = \dfrac{17}{36}$
$\sigma(X) = \sqrt{\dfrac{17}{36}} = \dfrac{\sqrt{17}}{6}$
確率変数 $X$ について $E(X) = 10$, $\sigma(X) = 3$ が成り立つ。$Y = 2X - 5$ とするとき:
(1) $E(Y)$, $V(Y)$, $\sigma(Y)$ を求めよ。
(2) $Z = \dfrac{X - 10}{3}$ とするとき、$E(Z)$, $V(Z)$ を求めよ。
$V(X) = \sigma(X)^2 = 9$
(1) $E(Y) = 2 \times 10 - 5 = 15$
$V(Y) = 2^2 \times 9 = 36$
$\sigma(Y) = |2| \times 3 = 6$
(2) $Z = \dfrac{1}{3}X - \dfrac{10}{3}$ より $a = \dfrac{1}{3}$, $b = -\dfrac{10}{3}$
$E(Z) = \dfrac{1}{3} \times 10 - \dfrac{10}{3} = \dfrac{10}{3} - \dfrac{10}{3} = 0$
$V(Z) = \left(\dfrac{1}{3}\right)^2 \times 9 = \dfrac{9}{9} = 1$
(2) の $Z = \dfrac{X - \mu}{\sigma}$ は標準化変換で、$E(Z) = 0$, $V(Z) = 1$ が常に成り立ちます。正規分布を標準正規分布に変換する際に使う重要な操作です。
確率変数 $X$ の確率分布が次のとき、$V(X)$ が最大となる $a$ の値を求めよ。ただし $0 \leq a \leq \dfrac{1}{2}$ とする。
| $X$ | $0$ | $1$ | $2$ |
|---|---|---|---|
| $P$ | $a$ | $1-2a$ | $a$ |
$E(X) = 0 \cdot a + 1 \cdot (1-2a) + 2 \cdot a = 1-2a+2a = 1$
$E(X^2) = 0 \cdot a + 1 \cdot (1-2a) + 4 \cdot a = 1-2a+4a = 1+2a$
$V(X) = E(X^2) - \{E(X)\}^2 = (1+2a) - 1 = 2a$
$V(X) = 2a$ は $a$ の増加関数なので、$0 \leq a \leq \dfrac{1}{2}$ の範囲で $a = \dfrac{1}{2}$ のとき最大。
$$a = \frac{1}{2} \quad \text{(最大の分散は } V(X) = 1\text{)}$$
このとき $P(X=0) = P(X=2) = \dfrac{1}{2}$, $P(X=1) = 0$ で、値が両端に集中します。
対称な確率分布では、中央の確率が減って両端に集中するほど分散が大きくなります。$a = \dfrac{1}{2}$ のときが最も散らばった状態($X$ は $0$ か $2$ のみで、確率はそれぞれ $\dfrac{1}{2}$)です。
1個のサイコロを2回投げる。1回目に出た目を $X_1$、2回目に出た目を $X_2$ とし、$Y = X_1 + X_2$ とする。
(1) $E(Y)$ を求めよ。
(2) $E(Y^2)$ を求めよ。(ヒント:$Y^2 = X_1^2 + 2X_1 X_2 + X_2^2$ を利用せよ)
(3) $V(Y)$ を求めよ。
(1) $E(Y) = E(X_1 + X_2) = E(X_1) + E(X_2) = \dfrac{7}{2} + \dfrac{7}{2} = 7$
(2) $Y^2 = X_1^2 + 2X_1 X_2 + X_2^2$ より
$E(Y^2) = E(X_1^2) + 2E(X_1 X_2) + E(X_2^2)$
$X_1$ と $X_2$ は独立なので $E(X_1 X_2) = E(X_1) \cdot E(X_2) = \dfrac{7}{2} \cdot \dfrac{7}{2} = \dfrac{49}{4}$
$E(X_1^2) = E(X_2^2) = \dfrac{91}{6}$
$E(Y^2) = \dfrac{91}{6} + 2 \cdot \dfrac{49}{4} + \dfrac{91}{6} = \dfrac{91}{6} + \dfrac{49}{2} + \dfrac{91}{6} = \dfrac{182}{6} + \dfrac{49}{2} = \dfrac{182}{6} + \dfrac{147}{6} = \dfrac{329}{6}$
(3) $V(Y) = E(Y^2) - \{E(Y)\}^2 = \dfrac{329}{6} - 49 = \dfrac{329 - 294}{6} = \dfrac{35}{6}$
$X_1$ と $X_2$ が独立のとき、$V(X_1 + X_2) = V(X_1) + V(X_2)$ が成り立ちます(独立な確率変数の和の分散は分散の和)。実際、$V(X_1) = V(X_2) = \dfrac{35}{12}$ なので $V(Y) = \dfrac{35}{12} + \dfrac{35}{12} = \dfrac{35}{6}$ と一致します。この性質は今後の学習で非常に重要になります。