第9章 統計的な推測

標準正規分布と確率計算
─ Z変換と正規分布表の使い方

正規分布 $N(\mu, \sigma^2)$ に従う確率変数を標準化して $N(0,1)$ に変換することで、あらゆる正規分布の確率を統一的に計算できるようになります。本記事では標準正規分布の性質、Z変換の方法、正規分布表の読み方を丁寧に学びます。

1標準正規分布 $N(0,1)$ とは

前回学んだ正規分布 $N(\mu, \sigma^2)$ のうち、平均 $\mu = 0$、分散 $\sigma^2 = 1$ の特別な正規分布を標準正規分布と呼び、$N(0, 1)$ と表します。

標準正規分布の確率密度関数

$$f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \quad (-\infty < z < \infty)$$

※ グラフは $z = 0$ を中心に左右対称な釣鐘型をしています。

標準正規分布の基本的性質

1. 平均(期待値):$E(Z) = 0$

2. 分散:$V(Z) = 1$、標準偏差:$\sigma(Z) = 1$

3. グラフは $z = 0$ に関して左右対称

4. 曲線と $z$ 軸で囲まれた面積の合計は $1$

標準正規分布が重要な理由は、あらゆる正規分布を標準正規分布に変換できるからです。平均や分散が異なる無数の正規分布を、1つの正規分布表で統一的に扱えます。

なぜ「標準化」が必要なのか

例えば「$N(50, 10^2)$ で $X \geq 65$ の確率」を求めるのと「$N(170, 5^2)$ で $X \leq 160$ の確率」を求めるのでは、分布ごとに別々の数表が必要になってしまいます。標準化すれば、$N(0,1)$ の数表だけですべて対応できます。

2Z変換(標準化)の方法

確率変数 $X$ が正規分布 $N(\mu, \sigma^2)$ に従うとき、次の変換で標準正規分布に従う確率変数 $Z$ を作ることができます。

Z変換(標準化変換)

$$Z = \frac{X - \mu}{\sigma}$$

$X \sim N(\mu, \sigma^2)$ のとき、$Z \sim N(0, 1)$

※ 「$X$ の値から平均を引いて、標準偏差で割る」と覚えましょう。

Z変換が $N(0,1)$ になることの確認

$Z = \frac{X - \mu}{\sigma}$ とすると、期待値と分散の性質から:

$E(Z) = E\left(\frac{X - \mu}{\sigma}\right) = \frac{1}{\sigma}\{E(X) - \mu\} = \frac{1}{\sigma}(\mu - \mu) = 0$

$V(Z) = V\left(\frac{X - \mu}{\sigma}\right) = \frac{1}{\sigma^2} V(X) = \frac{\sigma^2}{\sigma^2} = 1$

よって $Z$ は平均 $0$、分散 $1$ の正規分布 $N(0, 1)$ に従います。

Z変換でよくある間違い

$Z = \frac{X - \mu}{\sigma^2}$(分散 $\sigma^2$ で割ってしまう)

$Z = \frac{X - \mu}{\sigma}$(標準偏差 $\sigma$ で割る)

分散ではなく標準偏差で割ることに注意しましょう。$N(\mu, \sigma^2)$ の $\sigma^2$ は分散です。

例題:Z変換の基本

問題:$X \sim N(50, 10^2)$ のとき、$P(X \geq 65)$ を標準正規分布を用いて表せ。

解:$Z = \frac{X - 50}{10}$ とおくと $Z \sim N(0, 1)$。

$X \geq 65$ を $Z$ に変換すると、$Z \geq \frac{65 - 50}{10} = 1.5$

$$P(X \geq 65) = P(Z \geq 1.5)$$

Z変換の直感的な意味

$Z = \frac{X - \mu}{\sigma}$ は「$X$ の値が平均からどれだけ離れているかを、標準偏差を単位として測った値」です。

例えば $Z = 1.5$ は「平均から標準偏差 $1.5$ 個分だけ上にある」ことを意味します。

3正規分布表の読み方

標準正規分布の確率を求めるために正規分布表を使います。教科書や問題の巻末に付いている数表のことです。

正規分布表の定義

正規分布表では次の確率 $P(0 \leq Z \leq z)$ の値が記載されています:

$$P(0 \leq Z \leq z) = \int_0^z \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} \, dt$$

※ $z = 0$ から $z$ までの面積を表す値です。この値を慣例的に $p(z)$ と書くこともあります。

代表的な正規分布表の値

$z$ $P(0 \leq Z \leq z)$ 意味
$1.00$ $0.3413$ $0$ から $1$ までの確率
$1.64$ $0.4495$ 片側 $5\%$ 点の近く
$1.96$ $0.4750$ 両側 $5\%$ 点
$2.00$ $0.4772$ $0$ から $2$ までの確率
$2.58$ $0.4951$ 両側 $1\%$ 点
正規分布表を使うときの3つの基本公式

1. $P(Z \geq z) = 0.5 - P(0 \leq Z \leq z)$(右裾の確率)

2. $P(Z \leq -z) = P(Z \geq z) = 0.5 - P(0 \leq Z \leq z)$(左右対称性)

3. $P(|Z| \leq z) = 2 \cdot P(0 \leq Z \leq z)$(中心からの対称区間)

例題:正規分布表を使った確率計算

問題:$Z \sim N(0, 1)$ のとき、$P(0.5 \leq Z \leq 2.0)$ を求めよ。ただし $P(0 \leq Z \leq 0.5) = 0.1915$、$P(0 \leq Z \leq 2.0) = 0.4772$ とする。

解:$P(0.5 \leq Z \leq 2.0) = P(0 \leq Z \leq 2.0) - P(0 \leq Z \leq 0.5)$

$= 0.4772 - 0.1915 = 0.2857$

対称性を活用しよう

標準正規分布は $z = 0$ に関して左右対称なので:

$P(-a \leq Z \leq 0) = P(0 \leq Z \leq a)$

この性質を使えば、負の $z$ の値を含む確率も正の値の表だけで計算できます。

4さまざまな確率の計算

ここでは一般の正規分布 $N(\mu, \sigma^2)$ の確率をZ変換と正規分布表を組み合わせて求める練習をします。

例題1:区間の確率

問題:ある製品の重さ $X$ は $N(500, 20^2)$ に従う。$P(470 \leq X \leq 540)$ を求めよ。ただし $P(0 \leq Z \leq 1.5) = 0.4332$、$P(0 \leq Z \leq 2.0) = 0.4772$ とする。

解:$Z = \frac{X - 500}{20}$ とおく。

$X = 470$ のとき $Z = \frac{470 - 500}{20} = -1.5$

$X = 540$ のとき $Z = \frac{540 - 500}{20} = 2.0$

$P(470 \leq X \leq 540) = P(-1.5 \leq Z \leq 2.0)$

$= P(-1.5 \leq Z \leq 0) + P(0 \leq Z \leq 2.0)$

$= P(0 \leq Z \leq 1.5) + P(0 \leq Z \leq 2.0)$(対称性)

$= 0.4332 + 0.4772 = 0.9104$

例題2:「以上」の確率

問題:テストの成績 $X$ が $N(60, 15^2)$ に従うとき、$P(X \geq 84)$ を求めよ。ただし $P(0 \leq Z \leq 1.6) = 0.4452$ とする。

解:$Z = \frac{X - 60}{15}$ とおく。

$X = 84$ のとき $Z = \frac{84 - 60}{15} = 1.6$

$P(X \geq 84) = P(Z \geq 1.6) = 0.5 - P(0 \leq Z \leq 1.6) = 0.5 - 0.4452 = 0.0548$

約 $5.5\%$ の生徒が $84$ 点以上をとることがわかります。

確率計算のパターンまとめ

$P(X \leq a)$ 型:$P\left(Z \leq \frac{a - \mu}{\sigma}\right)$ に変換

$P(X \geq a)$ 型:$P\left(Z \geq \frac{a - \mu}{\sigma}\right) = 0.5 - P\left(0 \leq Z \leq \frac{a - \mu}{\sigma}\right)$

$P(a \leq X \leq b)$ 型:区間を分割して正規分布表の値を足し引き

確率の足し引きで間違いやすいケース

$P(-1.5 \leq Z \leq 2.0) = P(0 \leq Z \leq 2.0) - P(0 \leq Z \leq 1.5)$

$P(-1.5 \leq Z \leq 2.0) = P(0 \leq Z \leq 1.5) + P(0 \leq Z \leq 2.0)$

区間が $0$ をまたぐときは「引く」のではなく「足す」。図を描いて面積の足し引きを確認する習慣をつけましょう。

5正規分布の応用問題

正規分布は試験の成績、製品の品質管理、身体測定など多くの場面で現れます。ここでは逆問題(確率から値を求める問題)や条件付き確率の問題を扱います。

例題3:逆問題(確率から値を求める)

問題:$X \sim N(170, 6^2)$ のとき、上位 $5\%$ に入る値 $a$ を求めよ。ただし $P(0 \leq Z \leq 1.64) = 0.4495$ とする。

解:$P(X \geq a) = 0.05$ を満たす $a$ を求める。

$P(Z \geq z_0) = 0.05$ のとき $P(0 \leq Z \leq z_0) = 0.5 - 0.05 = 0.45$

正規分布表から $z_0 \fallingdotseq 1.64$

$\frac{a - 170}{6} = 1.64$ より $a = 170 + 6 \times 1.64 = 179.84$

よって約 $179.8$ cm 以上が上位 $5\%$ に入ります。

正規分布の「$1\sigma, 2\sigma, 3\sigma$ ルール」

$X \sim N(\mu, \sigma^2)$ のとき、おおよそ次が成り立ちます:

$P(\mu - \sigma \leq X \leq \mu + \sigma) \fallingdotseq 0.6827$(約 $68\%$)

$P(\mu - 2\sigma \leq X \leq \mu + 2\sigma) \fallingdotseq 0.9545$(約 $95\%$)

$P(\mu - 3\sigma \leq X \leq \mu + 3\sigma) \fallingdotseq 0.9973$(約 $99.7\%$)

入試で頻出の正規分布表の値

以下の値は暗記しておくと問題を素早く解けます:

$z = 1.96$:$P(0 \leq Z \leq 1.96) = 0.4750$ → 両側 $5\%$ 点(信頼区間で多用)

$z = 2.58$:$P(0 \leq Z \leq 2.58) = 0.4951$ → 両側 $1\%$ 点

$z = 1.64$:$P(0 \leq Z \leq 1.64) = 0.4495$ → 片側 $5\%$ 点

まとめ

  • 標準正規分布 ─ $N(0, 1)$ は平均 $0$、分散 $1$ の正規分布。すべての正規分布の基準となる
  • Z変換 ─ $Z = \frac{X - \mu}{\sigma}$ で $N(\mu, \sigma^2)$ を $N(0, 1)$ に変換。分散ではなく標準偏差で割る
  • 正規分布表 ─ $P(0 \leq Z \leq z)$ の値が記載。対称性を利用して負の値にも対応できる
  • 確率計算 ─ 区間の端をZ変換し、正規分布表の値を足し引き。$0$ をまたぐ区間では足す
  • $1\sigma$-$2\sigma$-$3\sigma$ ─ 平均から $1\sigma$ 以内に約 $68\%$、$2\sigma$ 以内に約 $95\%$、$3\sigma$ 以内に約 $99.7\%$

確認テスト

Q1. 標準正規分布 $N(0, 1)$ の平均と分散をそれぞれ答えよ。

▶ クリックして解答を表示 平均 $E(Z) = 0$、分散 $V(Z) = 1$。

Q2. $X \sim N(100, 25^2)$ のとき、$X = 150$ に対応する $Z$ の値を求めよ。

▶ クリックして解答を表示 $Z = \frac{150 - 100}{25} = 2.0$

Q3. $P(0 \leq Z \leq 1.96) = 0.4750$ のとき、$P(Z \geq 1.96)$ を求めよ。

▶ クリックして解答を表示 $P(Z \geq 1.96) = 0.5 - 0.4750 = 0.0250$

Q4. $P(0 \leq Z \leq 1.0) = 0.3413$ のとき、$P(-1.0 \leq Z \leq 1.0)$ を求めよ。

▶ クリックして解答を表示 対称性より $P(-1.0 \leq Z \leq 1.0) = 2 \times 0.3413 = 0.6826$

Q5. Z変換の式 $Z = \frac{X - \mu}{\sigma}$ で割るのは分散 $\sigma^2$ か標準偏差 $\sigma$ かどちらか。

▶ クリックして解答を表示 標準偏差 $\sigma$ で割る。分散 $\sigma^2$ ではないことに注意。

入試問題演習

問題 1 A 基礎 Z変換

$X \sim N(60, 8^2)$ のとき、次の確率を求めよ。ただし $P(0 \leq Z \leq 1.25) = 0.3944$、$P(0 \leq Z \leq 1.875) = 0.4696$ とする。

(1) $P(X \geq 70)$

(2) $P(45 \leq X \leq 70)$

解答

$Z = \frac{X - 60}{8}$ とおく。

(1) $X = 70$ のとき $Z = \frac{70-60}{8} = 1.25$

$P(X \geq 70) = P(Z \geq 1.25) = 0.5 - 0.3944 = 0.1056$

(2) $X = 45$ のとき $Z = \frac{45-60}{8} = -1.875$

$P(45 \leq X \leq 70) = P(-1.875 \leq Z \leq 1.25)$

$= P(0 \leq Z \leq 1.875) + P(0 \leq Z \leq 1.25) = 0.4696 + 0.3944 = 0.8640$

▶ 解答を見る
問題 2 B 標準 正規分布表

ある工場で生産される部品の長さ $X$ (mm) は $N(50.0, 0.5^2)$ に従う。規格が $49.0 \leq X \leq 51.0$ のとき、不良品の割合を求めよ。ただし $P(0 \leq Z \leq 2.0) = 0.4772$ とする。

解答

$Z = \frac{X - 50.0}{0.5}$ とおく。

$X = 49.0$ のとき $Z = \frac{49.0 - 50.0}{0.5} = -2.0$

$X = 51.0$ のとき $Z = \frac{51.0 - 50.0}{0.5} = 2.0$

規格内の確率:$P(-2.0 \leq Z \leq 2.0) = 2 \times 0.4772 = 0.9544$

不良品の割合:$1 - 0.9544 = 0.0456$

よって約 $4.56\%$ が不良品となる。

▶ 解答を見る
問題 3 B 標準 逆問題

ある試験の得点 $X$ は $N(55, 12^2)$ に従う。上位 $2.5\%$ に入る最低得点を求めよ。ただし $P(0 \leq Z \leq 1.96) = 0.4750$ とする。

解答

$P(X \geq a) = 0.025$ を満たす $a$ を求める。

$P(Z \geq z_0) = 0.025$ より $P(0 \leq Z \leq z_0) = 0.5 - 0.025 = 0.475$

正規分布表から $z_0 = 1.96$

$\frac{a - 55}{12} = 1.96$ より $a = 55 + 12 \times 1.96 = 78.52$

よって約 $78.5$ 点以上が上位 $2.5\%$ に入る。

▶ 解答を見る
問題 4 C 発展 応用

$X \sim N(\mu, \sigma^2)$ に対し、$P(X \leq 42) = 0.1587$ かつ $P(X \leq 58) = 0.8413$ が成り立つとき、$\mu$ と $\sigma$ の値を求めよ。ただし $P(0 \leq Z \leq 1.0) = 0.3413$ とする。

解答

$P(Z \leq z_1) = 0.1587$ のとき $P(Z \geq -z_1) = 0.1587$ より

$P(0 \leq Z \leq -z_1) = 0.5 - 0.1587 = 0.3413$

正規分布表から $-z_1 = 1.0$ すなわち $z_1 = -1.0$

同様に $P(Z \leq z_2) = 0.8413$ のとき $P(0 \leq Z \leq z_2) = 0.8413 - 0.5 = 0.3413$

正規分布表から $z_2 = 1.0$

$\frac{42 - \mu}{\sigma} = -1.0$ より $42 - \mu = -\sigma$ ... (i)

$\frac{58 - \mu}{\sigma} = 1.0$ より $58 - \mu = \sigma$ ... (ii)

(i) + (ii):$100 - 2\mu = 0$ より $\mu = 50$

(ii) に代入:$58 - 50 = \sigma$ より $\sigma = 8$

解説

2つの確率条件からZ変換の値を読み取り、$\mu$ と $\sigma$ に関する連立方程式を立てて解く問題です。対称性に注目して $\mu = \frac{42 + 58}{2} = 50$ と気づくと素早く解けます。$P(X \leq 42)$ と $P(X \leq 58)$ の和が $1$ であることから、$42$ と $58$ が平均に関して対称であることがわかります。

▶ 解答を見る