正規分布 $N(\mu, \sigma^2)$ に従う確率変数を標準化して $N(0,1)$ に変換することで、あらゆる正規分布の確率を統一的に計算できるようになります。本記事では標準正規分布の性質、Z変換の方法、正規分布表の読み方を丁寧に学びます。
前回学んだ正規分布 $N(\mu, \sigma^2)$ のうち、平均 $\mu = 0$、分散 $\sigma^2 = 1$ の特別な正規分布を標準正規分布と呼び、$N(0, 1)$ と表します。
$$f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \quad (-\infty < z < \infty)$$
※ グラフは $z = 0$ を中心に左右対称な釣鐘型をしています。
1. 平均(期待値):$E(Z) = 0$
2. 分散:$V(Z) = 1$、標準偏差:$\sigma(Z) = 1$
3. グラフは $z = 0$ に関して左右対称
4. 曲線と $z$ 軸で囲まれた面積の合計は $1$
標準正規分布が重要な理由は、あらゆる正規分布を標準正規分布に変換できるからです。平均や分散が異なる無数の正規分布を、1つの正規分布表で統一的に扱えます。
例えば「$N(50, 10^2)$ で $X \geq 65$ の確率」を求めるのと「$N(170, 5^2)$ で $X \leq 160$ の確率」を求めるのでは、分布ごとに別々の数表が必要になってしまいます。標準化すれば、$N(0,1)$ の数表だけですべて対応できます。
確率変数 $X$ が正規分布 $N(\mu, \sigma^2)$ に従うとき、次の変換で標準正規分布に従う確率変数 $Z$ を作ることができます。
$$Z = \frac{X - \mu}{\sigma}$$
$X \sim N(\mu, \sigma^2)$ のとき、$Z \sim N(0, 1)$
※ 「$X$ の値から平均を引いて、標準偏差で割る」と覚えましょう。
$Z = \frac{X - \mu}{\sigma}$ とすると、期待値と分散の性質から:
$E(Z) = E\left(\frac{X - \mu}{\sigma}\right) = \frac{1}{\sigma}\{E(X) - \mu\} = \frac{1}{\sigma}(\mu - \mu) = 0$
$V(Z) = V\left(\frac{X - \mu}{\sigma}\right) = \frac{1}{\sigma^2} V(X) = \frac{\sigma^2}{\sigma^2} = 1$
よって $Z$ は平均 $0$、分散 $1$ の正規分布 $N(0, 1)$ に従います。
$Z = \frac{X - \mu}{\sigma^2}$(分散 $\sigma^2$ で割ってしまう)
$Z = \frac{X - \mu}{\sigma}$(標準偏差 $\sigma$ で割る)
分散ではなく標準偏差で割ることに注意しましょう。$N(\mu, \sigma^2)$ の $\sigma^2$ は分散です。
問題:$X \sim N(50, 10^2)$ のとき、$P(X \geq 65)$ を標準正規分布を用いて表せ。
解:$Z = \frac{X - 50}{10}$ とおくと $Z \sim N(0, 1)$。
$X \geq 65$ を $Z$ に変換すると、$Z \geq \frac{65 - 50}{10} = 1.5$
$$P(X \geq 65) = P(Z \geq 1.5)$$
$Z = \frac{X - \mu}{\sigma}$ は「$X$ の値が平均からどれだけ離れているかを、標準偏差を単位として測った値」です。
例えば $Z = 1.5$ は「平均から標準偏差 $1.5$ 個分だけ上にある」ことを意味します。
標準正規分布の確率を求めるために正規分布表を使います。教科書や問題の巻末に付いている数表のことです。
正規分布表では次の確率 $P(0 \leq Z \leq z)$ の値が記載されています:
$$P(0 \leq Z \leq z) = \int_0^z \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} \, dt$$
※ $z = 0$ から $z$ までの面積を表す値です。この値を慣例的に $p(z)$ と書くこともあります。
| $z$ | $P(0 \leq Z \leq z)$ | 意味 |
|---|---|---|
| $1.00$ | $0.3413$ | $0$ から $1$ までの確率 |
| $1.64$ | $0.4495$ | 片側 $5\%$ 点の近く |
| $1.96$ | $0.4750$ | 両側 $5\%$ 点 |
| $2.00$ | $0.4772$ | $0$ から $2$ までの確率 |
| $2.58$ | $0.4951$ | 両側 $1\%$ 点 |
1. $P(Z \geq z) = 0.5 - P(0 \leq Z \leq z)$(右裾の確率)
2. $P(Z \leq -z) = P(Z \geq z) = 0.5 - P(0 \leq Z \leq z)$(左右対称性)
3. $P(|Z| \leq z) = 2 \cdot P(0 \leq Z \leq z)$(中心からの対称区間)
問題:$Z \sim N(0, 1)$ のとき、$P(0.5 \leq Z \leq 2.0)$ を求めよ。ただし $P(0 \leq Z \leq 0.5) = 0.1915$、$P(0 \leq Z \leq 2.0) = 0.4772$ とする。
解:$P(0.5 \leq Z \leq 2.0) = P(0 \leq Z \leq 2.0) - P(0 \leq Z \leq 0.5)$
$= 0.4772 - 0.1915 = 0.2857$
標準正規分布は $z = 0$ に関して左右対称なので:
$P(-a \leq Z \leq 0) = P(0 \leq Z \leq a)$
この性質を使えば、負の $z$ の値を含む確率も正の値の表だけで計算できます。
ここでは一般の正規分布 $N(\mu, \sigma^2)$ の確率をZ変換と正規分布表を組み合わせて求める練習をします。
問題:ある製品の重さ $X$ は $N(500, 20^2)$ に従う。$P(470 \leq X \leq 540)$ を求めよ。ただし $P(0 \leq Z \leq 1.5) = 0.4332$、$P(0 \leq Z \leq 2.0) = 0.4772$ とする。
解:$Z = \frac{X - 500}{20}$ とおく。
$X = 470$ のとき $Z = \frac{470 - 500}{20} = -1.5$
$X = 540$ のとき $Z = \frac{540 - 500}{20} = 2.0$
$P(470 \leq X \leq 540) = P(-1.5 \leq Z \leq 2.0)$
$= P(-1.5 \leq Z \leq 0) + P(0 \leq Z \leq 2.0)$
$= P(0 \leq Z \leq 1.5) + P(0 \leq Z \leq 2.0)$(対称性)
$= 0.4332 + 0.4772 = 0.9104$
問題:テストの成績 $X$ が $N(60, 15^2)$ に従うとき、$P(X \geq 84)$ を求めよ。ただし $P(0 \leq Z \leq 1.6) = 0.4452$ とする。
解:$Z = \frac{X - 60}{15}$ とおく。
$X = 84$ のとき $Z = \frac{84 - 60}{15} = 1.6$
$P(X \geq 84) = P(Z \geq 1.6) = 0.5 - P(0 \leq Z \leq 1.6) = 0.5 - 0.4452 = 0.0548$
約 $5.5\%$ の生徒が $84$ 点以上をとることがわかります。
$P(X \leq a)$ 型:$P\left(Z \leq \frac{a - \mu}{\sigma}\right)$ に変換
$P(X \geq a)$ 型:$P\left(Z \geq \frac{a - \mu}{\sigma}\right) = 0.5 - P\left(0 \leq Z \leq \frac{a - \mu}{\sigma}\right)$
$P(a \leq X \leq b)$ 型:区間を分割して正規分布表の値を足し引き
$P(-1.5 \leq Z \leq 2.0) = P(0 \leq Z \leq 2.0) - P(0 \leq Z \leq 1.5)$
$P(-1.5 \leq Z \leq 2.0) = P(0 \leq Z \leq 1.5) + P(0 \leq Z \leq 2.0)$
区間が $0$ をまたぐときは「引く」のではなく「足す」。図を描いて面積の足し引きを確認する習慣をつけましょう。
正規分布は試験の成績、製品の品質管理、身体測定など多くの場面で現れます。ここでは逆問題(確率から値を求める問題)や条件付き確率の問題を扱います。
問題:$X \sim N(170, 6^2)$ のとき、上位 $5\%$ に入る値 $a$ を求めよ。ただし $P(0 \leq Z \leq 1.64) = 0.4495$ とする。
解:$P(X \geq a) = 0.05$ を満たす $a$ を求める。
$P(Z \geq z_0) = 0.05$ のとき $P(0 \leq Z \leq z_0) = 0.5 - 0.05 = 0.45$
正規分布表から $z_0 \fallingdotseq 1.64$
$\frac{a - 170}{6} = 1.64$ より $a = 170 + 6 \times 1.64 = 179.84$
よって約 $179.8$ cm 以上が上位 $5\%$ に入ります。
$X \sim N(\mu, \sigma^2)$ のとき、おおよそ次が成り立ちます:
$P(\mu - \sigma \leq X \leq \mu + \sigma) \fallingdotseq 0.6827$(約 $68\%$)
$P(\mu - 2\sigma \leq X \leq \mu + 2\sigma) \fallingdotseq 0.9545$(約 $95\%$)
$P(\mu - 3\sigma \leq X \leq \mu + 3\sigma) \fallingdotseq 0.9973$(約 $99.7\%$)
以下の値は暗記しておくと問題を素早く解けます:
$z = 1.96$:$P(0 \leq Z \leq 1.96) = 0.4750$ → 両側 $5\%$ 点(信頼区間で多用)
$z = 2.58$:$P(0 \leq Z \leq 2.58) = 0.4951$ → 両側 $1\%$ 点
$z = 1.64$:$P(0 \leq Z \leq 1.64) = 0.4495$ → 片側 $5\%$ 点
Q1. 標準正規分布 $N(0, 1)$ の平均と分散をそれぞれ答えよ。
Q2. $X \sim N(100, 25^2)$ のとき、$X = 150$ に対応する $Z$ の値を求めよ。
Q3. $P(0 \leq Z \leq 1.96) = 0.4750$ のとき、$P(Z \geq 1.96)$ を求めよ。
Q4. $P(0 \leq Z \leq 1.0) = 0.3413$ のとき、$P(-1.0 \leq Z \leq 1.0)$ を求めよ。
Q5. Z変換の式 $Z = \frac{X - \mu}{\sigma}$ で割るのは分散 $\sigma^2$ か標準偏差 $\sigma$ かどちらか。
$X \sim N(60, 8^2)$ のとき、次の確率を求めよ。ただし $P(0 \leq Z \leq 1.25) = 0.3944$、$P(0 \leq Z \leq 1.875) = 0.4696$ とする。
(1) $P(X \geq 70)$
(2) $P(45 \leq X \leq 70)$
$Z = \frac{X - 60}{8}$ とおく。
(1) $X = 70$ のとき $Z = \frac{70-60}{8} = 1.25$
$P(X \geq 70) = P(Z \geq 1.25) = 0.5 - 0.3944 = 0.1056$
(2) $X = 45$ のとき $Z = \frac{45-60}{8} = -1.875$
$P(45 \leq X \leq 70) = P(-1.875 \leq Z \leq 1.25)$
$= P(0 \leq Z \leq 1.875) + P(0 \leq Z \leq 1.25) = 0.4696 + 0.3944 = 0.8640$
ある工場で生産される部品の長さ $X$ (mm) は $N(50.0, 0.5^2)$ に従う。規格が $49.0 \leq X \leq 51.0$ のとき、不良品の割合を求めよ。ただし $P(0 \leq Z \leq 2.0) = 0.4772$ とする。
$Z = \frac{X - 50.0}{0.5}$ とおく。
$X = 49.0$ のとき $Z = \frac{49.0 - 50.0}{0.5} = -2.0$
$X = 51.0$ のとき $Z = \frac{51.0 - 50.0}{0.5} = 2.0$
規格内の確率:$P(-2.0 \leq Z \leq 2.0) = 2 \times 0.4772 = 0.9544$
不良品の割合:$1 - 0.9544 = 0.0456$
よって約 $4.56\%$ が不良品となる。
ある試験の得点 $X$ は $N(55, 12^2)$ に従う。上位 $2.5\%$ に入る最低得点を求めよ。ただし $P(0 \leq Z \leq 1.96) = 0.4750$ とする。
$P(X \geq a) = 0.025$ を満たす $a$ を求める。
$P(Z \geq z_0) = 0.025$ より $P(0 \leq Z \leq z_0) = 0.5 - 0.025 = 0.475$
正規分布表から $z_0 = 1.96$
$\frac{a - 55}{12} = 1.96$ より $a = 55 + 12 \times 1.96 = 78.52$
よって約 $78.5$ 点以上が上位 $2.5\%$ に入る。
$X \sim N(\mu, \sigma^2)$ に対し、$P(X \leq 42) = 0.1587$ かつ $P(X \leq 58) = 0.8413$ が成り立つとき、$\mu$ と $\sigma$ の値を求めよ。ただし $P(0 \leq Z \leq 1.0) = 0.3413$ とする。
$P(Z \leq z_1) = 0.1587$ のとき $P(Z \geq -z_1) = 0.1587$ より
$P(0 \leq Z \leq -z_1) = 0.5 - 0.1587 = 0.3413$
正規分布表から $-z_1 = 1.0$ すなわち $z_1 = -1.0$
同様に $P(Z \leq z_2) = 0.8413$ のとき $P(0 \leq Z \leq z_2) = 0.8413 - 0.5 = 0.3413$
正規分布表から $z_2 = 1.0$
$\frac{42 - \mu}{\sigma} = -1.0$ より $42 - \mu = -\sigma$ ... (i)
$\frac{58 - \mu}{\sigma} = 1.0$ より $58 - \mu = \sigma$ ... (ii)
(i) + (ii):$100 - 2\mu = 0$ より $\mu = 50$
(ii) に代入:$58 - 50 = \sigma$ より $\sigma = 8$
2つの確率条件からZ変換の値を読み取り、$\mu$ と $\sigma$ に関する連立方程式を立てて解く問題です。対称性に注目して $\mu = \frac{42 + 58}{2} = 50$ と気づくと素早く解けます。$P(X \leq 42)$ と $P(X \leq 58)$ の和が $1$ であることから、$42$ と $58$ が平均に関して対称であることがわかります。