確率変数 $X$ に定数 $a, b$ を用いた一次変換 $Y = aX + b$ を施すと、期待値や分散はどのように変わるでしょうか。本記事では線形変換の公式を導出し、特に重要な「標準化」への応用までを解説します。統計的な推測の土台となる考え方です。
確率変数 $X$ に対して、定数 $a, b$ を用いて新しい確率変数 $Y = aX + b$ を作ることを、$X$ の線形変換(一次変換)といいます。
たとえば、テストの得点 $X$ を偏差値に変換する操作は線形変換の代表例です。$X$ の値が決まれば $Y$ の値も一意に決まるため、$Y$ も確率変数になります。
$Y = aX + b$ は、$X$ の値を「$a$ 倍に拡大(縮小)して $b$ だけ平行移動する」操作です。
$a > 0$ なら分布の向きは変わらず、$a < 0$ なら分布が左右反転します。$|a| > 1$ なら散らばりが広がり、$|a| < 1$ なら散らばりが縮まります。
サイコロを1回振って出た目を $X$ とします。$Y = 2X + 3$ とすると、$X$ と $Y$ の対応は次のようになります。
| $X$ | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| $Y = 2X+3$ | 5 | 7 | 9 | 11 | 13 | 15 |
| 確率 | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ |
$X$ の各値にすべて同じ操作(2倍して3を足す)を施しているだけなので、確率自体は変わりません。変わるのは期待値と分散(散らばり具合)です。
$X$ の期待値を $E(X) = \mu$ とするとき、$Y = aX + b$ の期待値は次の公式で求まります。
$$E(aX + b) = aE(X) + b$$
定数 $a, b$ は期待値の外にそのまま出せる。「期待値は線形性をもつ」という重要な性質です。
$X$ の取りうる値を $x_1, x_2, \ldots, x_n$、対応する確率を $p_1, p_2, \ldots, p_n$ とすると、
$$E(aX + b) = \sum_{i=1}^{n} (ax_i + b) p_i = a\sum_{i=1}^{n} x_i p_i + b\sum_{i=1}^{n} p_i = aE(X) + b \cdot 1 = aE(X) + b$$
ここで $\sum p_i = 1$(確率の総和)を用いました。$\square$
先ほどのサイコロの例で検算します。$E(X) = \frac{1+2+3+4+5+6}{6} = \frac{7}{2}$ なので、
$$E(2X + 3) = 2 \cdot \frac{7}{2} + 3 = 7 + 3 = 10$$
実際に $Y$ の期待値を直接計算すると $E(Y) = \frac{5+7+9+11+13+15}{6} = \frac{60}{6} = 10$ で一致します。
$E(aX + b) = aE(X) + b$ は、$X$ と $Y$ が独立でなくても成り立つ、非常に強い性質です。「期待値に関しては何でも分配法則が使える」と覚えておきましょう。
分散は期待値とは異なり、定数 $b$ の影響を受けません。平行移動しても散らばり具合は変わらないからです。
$$V(aX + b) = a^2 V(X)$$
$$\sigma(aX + b) = |a| \, \sigma(X)$$
分散には $a^2$ が掛かり、$b$ は消える。標準偏差には $|a|$ が掛かる(符号は関係ない)。
$E(aX + b) = aE(X) + b = a\mu + b$ を用いると、
$$V(aX + b) = E\left[(aX + b) - (a\mu + b)\right]^2 = E\left[a(X - \mu)\right]^2 = a^2 E\left[(X - \mu)^2\right] = a^2 V(X)$$
標準偏差は $\sigma(aX + b) = \sqrt{V(aX + b)} = \sqrt{a^2 V(X)} = |a| \sigma(X)$ です。$\square$
誤:$V(aX + b) = aV(X) + b$
正:$V(aX + b) = a^2 V(X)$
分散では $b$ は消え、$a$ は2乗されます。期待値の公式と混同しないように注意しましょう。分散は「散らばり」を表す量なので、平行移動 $+b$ では変化しません。
サイコロの例の続きです。$V(X) = E(X^2) - \{E(X)\}^2$ を使って計算します。
$$E(X^2) = \frac{1^2 + 2^2 + 3^2 + 4^2 + 5^2 + 6^2}{6} = \frac{91}{6}$$
$$V(X) = \frac{91}{6} - \left(\frac{7}{2}\right)^2 = \frac{91}{6} - \frac{49}{4} = \frac{182 - 147}{12} = \frac{35}{12}$$
公式より $V(2X + 3) = 2^2 \cdot \frac{35}{12} = \frac{140}{12} = \frac{35}{3}$ です。
線形変換の最も重要な応用が標準化です。確率変数 $X$ の期待値を $\mu$、標準偏差を $\sigma$ とするとき、
$$Z = \frac{X - \mu}{\sigma}$$
と変換すると、$Z$ は期待値 $0$、標準偏差 $1$ の確率変数になります。
$Z = \frac{X - \mu}{\sigma} = \frac{1}{\sigma} X - \frac{\mu}{\sigma}$($a = \frac{1}{\sigma}$, $b = -\frac{\mu}{\sigma}$ の線形変換)とみると、
$$E(Z) = \frac{1}{\sigma} E(X) - \frac{\mu}{\sigma} = \frac{\mu}{\sigma} - \frac{\mu}{\sigma} = 0$$
$$V(Z) = \left(\frac{1}{\sigma}\right)^2 V(X) = \frac{1}{\sigma^2} \cdot \sigma^2 = 1$$
標準化により、異なるスケールのデータを同じ基準で比較できるようになります。
標準化は「平均からのずれを標準偏差何個分か」で測る操作です。例えば、$Z = 2$ は「平均より標準偏差2つ分だけ大きい」ことを意味します。
偏差値は標準化を $T = 10Z + 50$ でさらに変換したものです。これも線形変換の組み合わせにほかなりません。
標準化した $Z$ をさらに変換して偏差値 $T$ を求めます。
$$T = 10Z + 50 = 10 \cdot \frac{X - \mu}{\sigma} + 50$$
$E(T) = 10 \cdot 0 + 50 = 50$、$\sigma(T) = 10 \cdot 1 = 10$ となり、平均50・標準偏差10のスケールに変換されます。
偏差値70は $Z = 2$(平均+標準偏差2個分)、偏差値30は $Z = -2$(平均-標準偏差2個分)に対応します。偏差値の仕組みを理解すると、テスト結果の解釈がより正確になります。
確率変数 $X$ が次の確率分布に従うとします。
| $X$ | 101 | 102 | 103 |
|---|---|---|---|
| 確率 | $\frac{1}{4}$ | $\frac{1}{2}$ | $\frac{1}{4}$ |
直接計算しても求まりますが、$Y = X - 102$ と変換すれば $Y$ は $-1, 0, 1$ を取り、計算が格段に楽になります。
$E(Y) = (-1) \cdot \frac{1}{4} + 0 \cdot \frac{1}{2} + 1 \cdot \frac{1}{4} = 0$ なので、$E(X) = E(Y) + 102 = 102$ です。
$E(Y^2) = 1 \cdot \frac{1}{4} + 0 \cdot \frac{1}{2} + 1 \cdot \frac{1}{4} = \frac{1}{2}$ なので、$V(Y) = \frac{1}{2}$ です。$V(X) = V(Y) = \frac{1}{2}$ です(平行移動なので分散は不変)。
値が大きい場合や複雑な場合は、$Y = X - c$($c$ は平均に近い値)と置き換えると計算が簡単になります。$V(X) = V(Y)$ なので分散は変わらず、$E(X) = E(Y) + c$ で戻せます。
| 量 | 公式 | ポイント |
|---|---|---|
| 期待値 | $E(aX+b) = aE(X)+b$ | $a$ も $b$ もそのまま出る |
| 分散 | $V(aX+b) = a^2 V(X)$ | $a^2$ が掛かり、$b$ は消える |
| 標準偏差 | $\sigma(aX+b) = |a|\sigma(X)$ | $|a|$ が掛かり、$b$ は消える |
Q1. $E(X) = 5$ のとき、$E(3X - 2)$ を求めよ。
Q2. $V(X) = 4$ のとき、$V(3X - 2)$ を求めよ。
Q3. $\sigma(X) = 3$ のとき、$\sigma(-2X + 7)$ を求めよ。
Q4. $E(X) = 60$, $\sigma(X) = 15$ のとき、$X$ を標準化した $Z$ の式を書け。
Q5. $V(aX + b) = a^2 V(X)$ で $b$ が消える理由を簡潔に述べよ。
確率変数 $X$ の期待値が $E(X) = 4$、分散が $V(X) = 9$ であるとき、$Y = -2X + 5$ の期待値 $E(Y)$、分散 $V(Y)$、標準偏差 $\sigma(Y)$ を求めよ。
$E(Y) = E(-2X + 5) = -2 \cdot 4 + 5 = -3$
$V(Y) = V(-2X + 5) = (-2)^2 \cdot 9 = 36$
$\sigma(Y) = \sqrt{V(Y)} = \sqrt{36} = 6$
ある試験の得点 $X$ は期待値 $55$、標準偏差 $12$ である。得点 $X = 79$ の偏差値を求めよ。
標準化:$Z = \frac{X - \mu}{\sigma} = \frac{79 - 55}{12} = \frac{24}{12} = 2$
偏差値:$T = 10Z + 50 = 10 \cdot 2 + 50 = 70$
確率変数 $X$ が次の確率分布に従うとき、$E(X)$ と $V(X)$ を求めよ。
| $X$ | 198 | 199 | 200 | 201 | 202 |
|---|---|---|---|---|---|
| 確率 | $0.1$ | $0.2$ | $0.4$ | $0.2$ | $0.1$ |
$Y = X - 200$ とおくと、$Y$ は $-2, -1, 0, 1, 2$ を取り、
$E(Y) = (-2)(0.1) + (-1)(0.2) + 0(0.4) + 1(0.2) + 2(0.1) = 0$
$E(Y^2) = 4(0.1) + 1(0.2) + 0(0.4) + 1(0.2) + 4(0.1) = 1.2$
$V(Y) = E(Y^2) - \{E(Y)\}^2 = 1.2 - 0 = 1.2$
$E(X) = E(Y) + 200 = 200$、$V(X) = V(Y) = 1.2$
$Y = X - 200$ と平行移動することで計算が格段に楽になります。分散は平行移動で不変なので $V(X) = V(Y)$ です。値が大きいときの定番テクニックとして覚えておきましょう。
確率変数 $X$ が $E(X) = \mu$, $V(X) = \sigma^2$ を満たすとき、次の問いに答えよ。
(1) $Y = aX + b$($a \neq 0$)として $E(Y) = 0$, $V(Y) = 1$ となるような $a, b$ を $\mu, \sigma$ で表せ。
(2) 確率変数 $W = 10 \cdot \frac{X - \mu}{\sigma} + 50$ の期待値と標準偏差を求めよ。
(1) $E(Y) = aE(X) + b = a\mu + b = 0$ より $b = -a\mu$
$V(Y) = a^2 V(X) = a^2 \sigma^2 = 1$ より $a^2 = \frac{1}{\sigma^2}$、$a = \pm \frac{1}{\sigma}$
$a = \frac{1}{\sigma}$ のとき $b = -\frac{\mu}{\sigma}$($Z = \frac{X-\mu}{\sigma}$ に対応)
$a = -\frac{1}{\sigma}$ のとき $b = \frac{\mu}{\sigma}$
(2) $Z = \frac{X-\mu}{\sigma}$ とすると $W = 10Z + 50$。
$E(W) = 10 \cdot E(Z) + 50 = 10 \cdot 0 + 50 = 50$
$\sigma(W) = |10| \cdot \sigma(Z) = 10 \cdot 1 = 10$
(1)は標準化の一般論を問う問題です。$a$ には正と負の2つの解がありますが、通常は $a > 0$(分布の向きを保つ)を選びます。(2)はまさに偏差値の式であり、標準化と線形変換を組み合わせた応用です。