第9章 統計的な推測

確率変数の変換(aX+b)
─ 期待値・分散の線形変換

確率変数 $X$ に定数 $a, b$ を用いた一次変換 $Y = aX + b$ を施すと、期待値や分散はどのように変わるでしょうか。本記事では線形変換の公式を導出し、特に重要な「標準化」への応用までを解説します。統計的な推測の土台となる考え方です。

1確率変数の線形変換とは

確率変数 $X$ に対して、定数 $a, b$ を用いて新しい確率変数 $Y = aX + b$ を作ることを、$X$ の線形変換(一次変換)といいます。

たとえば、テストの得点 $X$ を偏差値に変換する操作は線形変換の代表例です。$X$ の値が決まれば $Y$ の値も一意に決まるため、$Y$ も確率変数になります。

本質:線形変換のイメージ

$Y = aX + b$ は、$X$ の値を「$a$ 倍に拡大(縮小)して $b$ だけ平行移動する」操作です。

$a > 0$ なら分布の向きは変わらず、$a < 0$ なら分布が左右反転します。$|a| > 1$ なら散らばりが広がり、$|a| < 1$ なら散らばりが縮まります。

具体例で確認

サイコロを1回振って出た目を $X$ とします。$Y = 2X + 3$ とすると、$X$ と $Y$ の対応は次のようになります。

$X$123456
$Y = 2X+3$579111315
確率$\frac{1}{6}$$\frac{1}{6}$$\frac{1}{6}$$\frac{1}{6}$$\frac{1}{6}$$\frac{1}{6}$

$X$ の各値にすべて同じ操作(2倍して3を足す)を施しているだけなので、確率自体は変わりません。変わるのは期待値と分散(散らばり具合)です。

2期待値の線形変換公式

$X$ の期待値を $E(X) = \mu$ とするとき、$Y = aX + b$ の期待値は次の公式で求まります。

公式:期待値の線形変換

$$E(aX + b) = aE(X) + b$$

定数 $a, b$ は期待値の外にそのまま出せる。「期待値は線形性をもつ」という重要な性質です。

証明

$X$ の取りうる値を $x_1, x_2, \ldots, x_n$、対応する確率を $p_1, p_2, \ldots, p_n$ とすると、

$$E(aX + b) = \sum_{i=1}^{n} (ax_i + b) p_i = a\sum_{i=1}^{n} x_i p_i + b\sum_{i=1}^{n} p_i = aE(X) + b \cdot 1 = aE(X) + b$$

ここで $\sum p_i = 1$(確率の総和)を用いました。$\square$

具体例で確認

先ほどのサイコロの例で検算します。$E(X) = \frac{1+2+3+4+5+6}{6} = \frac{7}{2}$ なので、

$$E(2X + 3) = 2 \cdot \frac{7}{2} + 3 = 7 + 3 = 10$$

実際に $Y$ の期待値を直接計算すると $E(Y) = \frac{5+7+9+11+13+15}{6} = \frac{60}{6} = 10$ で一致します。

豆知識:期待値の線形性

$E(aX + b) = aE(X) + b$ は、$X$ と $Y$ が独立でなくても成り立つ、非常に強い性質です。「期待値に関しては何でも分配法則が使える」と覚えておきましょう。

3分散・標準偏差の線形変換公式

分散は期待値とは異なり、定数 $b$ の影響を受けません。平行移動しても散らばり具合は変わらないからです。

公式:分散・標準偏差の線形変換

$$V(aX + b) = a^2 V(X)$$

$$\sigma(aX + b) = |a| \, \sigma(X)$$

分散には $a^2$ が掛かり、$b$ は消える。標準偏差には $|a|$ が掛かる(符号は関係ない)。

証明

$E(aX + b) = aE(X) + b = a\mu + b$ を用いると、

$$V(aX + b) = E\left[(aX + b) - (a\mu + b)\right]^2 = E\left[a(X - \mu)\right]^2 = a^2 E\left[(X - \mu)^2\right] = a^2 V(X)$$

標準偏差は $\sigma(aX + b) = \sqrt{V(aX + b)} = \sqrt{a^2 V(X)} = |a| \sigma(X)$ です。$\square$

注意:よくある間違い

誤:$V(aX + b) = aV(X) + b$

正:$V(aX + b) = a^2 V(X)$

分散では $b$ は消え、$a$ は2乗されます。期待値の公式と混同しないように注意しましょう。分散は「散らばり」を表す量なので、平行移動 $+b$ では変化しません。

具体例で確認

サイコロの例の続きです。$V(X) = E(X^2) - \{E(X)\}^2$ を使って計算します。

$$E(X^2) = \frac{1^2 + 2^2 + 3^2 + 4^2 + 5^2 + 6^2}{6} = \frac{91}{6}$$

$$V(X) = \frac{91}{6} - \left(\frac{7}{2}\right)^2 = \frac{91}{6} - \frac{49}{4} = \frac{182 - 147}{12} = \frac{35}{12}$$

公式より $V(2X + 3) = 2^2 \cdot \frac{35}{12} = \frac{140}{12} = \frac{35}{3}$ です。

4標準化 $Z = \frac{X - \mu}{\sigma}$

線形変換の最も重要な応用が標準化です。確率変数 $X$ の期待値を $\mu$、標準偏差を $\sigma$ とするとき、

$$Z = \frac{X - \mu}{\sigma}$$

と変換すると、$Z$ は期待値 $0$、標準偏差 $1$ の確率変数になります。

公式:標準化の性質

$Z = \frac{X - \mu}{\sigma} = \frac{1}{\sigma} X - \frac{\mu}{\sigma}$($a = \frac{1}{\sigma}$, $b = -\frac{\mu}{\sigma}$ の線形変換)とみると、

$$E(Z) = \frac{1}{\sigma} E(X) - \frac{\mu}{\sigma} = \frac{\mu}{\sigma} - \frac{\mu}{\sigma} = 0$$

$$V(Z) = \left(\frac{1}{\sigma}\right)^2 V(X) = \frac{1}{\sigma^2} \cdot \sigma^2 = 1$$

標準化により、異なるスケールのデータを同じ基準で比較できるようになります。

本質:標準化はなぜ重要か

標準化は「平均からのずれを標準偏差何個分か」で測る操作です。例えば、$Z = 2$ は「平均より標準偏差2つ分だけ大きい」ことを意味します。

偏差値は標準化を $T = 10Z + 50$ でさらに変換したものです。これも線形変換の組み合わせにほかなりません。

偏差値の公式

標準化した $Z$ をさらに変換して偏差値 $T$ を求めます。

$$T = 10Z + 50 = 10 \cdot \frac{X - \mu}{\sigma} + 50$$

$E(T) = 10 \cdot 0 + 50 = 50$、$\sigma(T) = 10 \cdot 1 = 10$ となり、平均50・標準偏差10のスケールに変換されます。

豆知識:偏差値と標準化の関係

偏差値70は $Z = 2$(平均+標準偏差2個分)、偏差値30は $Z = -2$(平均-標準偏差2個分)に対応します。偏差値の仕組みを理解すると、テスト結果の解釈がより正確になります。

5線形変換の活用例と応用

例題:値の大きい確率変数の期待値・分散

確率変数 $X$ が次の確率分布に従うとします。

$X$101102103
確率$\frac{1}{4}$$\frac{1}{2}$$\frac{1}{4}$

直接計算しても求まりますが、$Y = X - 102$ と変換すれば $Y$ は $-1, 0, 1$ を取り、計算が格段に楽になります。

$E(Y) = (-1) \cdot \frac{1}{4} + 0 \cdot \frac{1}{2} + 1 \cdot \frac{1}{4} = 0$ なので、$E(X) = E(Y) + 102 = 102$ です。

$E(Y^2) = 1 \cdot \frac{1}{4} + 0 \cdot \frac{1}{2} + 1 \cdot \frac{1}{4} = \frac{1}{2}$ なので、$V(Y) = \frac{1}{2}$ です。$V(X) = V(Y) = \frac{1}{2}$ です(平行移動なので分散は不変)。

テクニック:計算の工夫

値が大きい場合や複雑な場合は、$Y = X - c$($c$ は平均に近い値)と置き換えると計算が簡単になります。$V(X) = V(Y)$ なので分散は変わらず、$E(X) = E(Y) + c$ で戻せます。

線形変換公式のまとめ表

公式ポイント
期待値$E(aX+b) = aE(X)+b$$a$ も $b$ もそのまま出る
分散$V(aX+b) = a^2 V(X)$$a^2$ が掛かり、$b$ は消える
標準偏差$\sigma(aX+b) = |a|\sigma(X)$$|a|$ が掛かり、$b$ は消える

まとめ

  • 期待値の線形性:$E(aX+b) = aE(X) + b$。定数は期待値の外にそのまま出せる。
  • 分散の変換:$V(aX+b) = a^2 V(X)$。$b$(平行移動)は分散に影響しない。$a$ は2乗される。
  • 標準偏差の変換:$\sigma(aX+b) = |a|\sigma(X)$。分散の平方根を取ると絶対値 $|a|$ が掛かる。
  • 標準化:$Z = \frac{X-\mu}{\sigma}$ とすると $E(Z)=0$, $V(Z)=1$。異なるスケールを揃える基本操作。
  • 偏差値:$T = 10Z + 50$ は標準化の応用で、平均50・標準偏差10のスケールに変換する。

確認テスト

Q1. $E(X) = 5$ のとき、$E(3X - 2)$ を求めよ。

▶ クリックして解答を表示 $E(3X - 2) = 3 \cdot 5 - 2 = 13$

Q2. $V(X) = 4$ のとき、$V(3X - 2)$ を求めよ。

▶ クリックして解答を表示 $V(3X - 2) = 3^2 \cdot 4 = 36$

Q3. $\sigma(X) = 3$ のとき、$\sigma(-2X + 7)$ を求めよ。

▶ クリックして解答を表示 $\sigma(-2X + 7) = |-2| \cdot 3 = 6$

Q4. $E(X) = 60$, $\sigma(X) = 15$ のとき、$X$ を標準化した $Z$ の式を書け。

▶ クリックして解答を表示 $Z = \frac{X - 60}{15}$

Q5. $V(aX + b) = a^2 V(X)$ で $b$ が消える理由を簡潔に述べよ。

▶ クリックして解答を表示 分散は「平均からのずれの2乗の平均」を測る量であり、全体を $b$ だけ平行移動しても各値と平均の差は変わらないため。

入試問題演習

問題 1 A 基礎 線形変換

確率変数 $X$ の期待値が $E(X) = 4$、分散が $V(X) = 9$ であるとき、$Y = -2X + 5$ の期待値 $E(Y)$、分散 $V(Y)$、標準偏差 $\sigma(Y)$ を求めよ。

解答

$E(Y) = E(-2X + 5) = -2 \cdot 4 + 5 = -3$

$V(Y) = V(-2X + 5) = (-2)^2 \cdot 9 = 36$

$\sigma(Y) = \sqrt{V(Y)} = \sqrt{36} = 6$

▶ 解答を見る
問題 2 B 標準 標準化

ある試験の得点 $X$ は期待値 $55$、標準偏差 $12$ である。得点 $X = 79$ の偏差値を求めよ。

解答

標準化:$Z = \frac{X - \mu}{\sigma} = \frac{79 - 55}{12} = \frac{24}{12} = 2$

偏差値:$T = 10Z + 50 = 10 \cdot 2 + 50 = 70$

▶ 解答を見る
問題 3 B 標準 計算の工夫

確率変数 $X$ が次の確率分布に従うとき、$E(X)$ と $V(X)$ を求めよ。

$X$198199200201202
確率$0.1$$0.2$$0.4$$0.2$$0.1$
解答

$Y = X - 200$ とおくと、$Y$ は $-2, -1, 0, 1, 2$ を取り、

$E(Y) = (-2)(0.1) + (-1)(0.2) + 0(0.4) + 1(0.2) + 2(0.1) = 0$

$E(Y^2) = 4(0.1) + 1(0.2) + 0(0.4) + 1(0.2) + 4(0.1) = 1.2$

$V(Y) = E(Y^2) - \{E(Y)\}^2 = 1.2 - 0 = 1.2$

$E(X) = E(Y) + 200 = 200$、$V(X) = V(Y) = 1.2$

解説

$Y = X - 200$ と平行移動することで計算が格段に楽になります。分散は平行移動で不変なので $V(X) = V(Y)$ です。値が大きいときの定番テクニックとして覚えておきましょう。

▶ 解答を見る
問題 4 C 発展 線形変換+標準化

確率変数 $X$ が $E(X) = \mu$, $V(X) = \sigma^2$ を満たすとき、次の問いに答えよ。

(1) $Y = aX + b$($a \neq 0$)として $E(Y) = 0$, $V(Y) = 1$ となるような $a, b$ を $\mu, \sigma$ で表せ。

(2) 確率変数 $W = 10 \cdot \frac{X - \mu}{\sigma} + 50$ の期待値と標準偏差を求めよ。

解答

(1) $E(Y) = aE(X) + b = a\mu + b = 0$ より $b = -a\mu$

$V(Y) = a^2 V(X) = a^2 \sigma^2 = 1$ より $a^2 = \frac{1}{\sigma^2}$、$a = \pm \frac{1}{\sigma}$

$a = \frac{1}{\sigma}$ のとき $b = -\frac{\mu}{\sigma}$($Z = \frac{X-\mu}{\sigma}$ に対応)

$a = -\frac{1}{\sigma}$ のとき $b = \frac{\mu}{\sigma}$

(2) $Z = \frac{X-\mu}{\sigma}$ とすると $W = 10Z + 50$。

$E(W) = 10 \cdot E(Z) + 50 = 10 \cdot 0 + 50 = 50$

$\sigma(W) = |10| \cdot \sigma(Z) = 10 \cdot 1 = 10$

解説

(1)は標準化の一般論を問う問題です。$a$ には正と負の2つの解がありますが、通常は $a > 0$(分布の向きを保つ)を選びます。(2)はまさに偏差値の式であり、標準化と線形変換を組み合わせた応用です。

▶ 解答を見る