母集団全体を調べることは通常不可能です。しかし標本から得られる情報を使えば、母平均がどの範囲にあるかを確率的に推定できます。本記事では信頼区間の考え方と計算方法を、具体例を通して丁寧に学びます。95%信頼区間・99%信頼区間の求め方を確実に身につけましょう。
母集団の平均 $\mu$ や分散 $\sigma^2$ を知りたいとき、母集団全体を調査する全数調査は費用や時間の面で困難なことがほとんどです。そこで母集団から無作為に標本を抽出し、その標本の情報をもとに母集団の特性値を推し量る方法を統計的推定といいます。
推定を正しく行うための前提条件は次の通りです。
1. 母集団から無作為抽出(ランダムサンプリング)されていること
2. 標本の大きさ $n$ が十分大きいこと(中心極限定理を使うため)
3. 母集団の標準偏差 $\sigma$ が既知であること(高校範囲の設定)
母集団の平均を $\mu$、標準偏差を $\sigma$ とし、大きさ $n$ の無作為標本 $X_1, X_2, \ldots, X_n$ をとるとき、標本平均 $\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i$ について次が成り立ちます。
$$E(\bar{X}) = \mu, \quad \sigma(\bar{X}) = \frac{\sigma}{\sqrt{n}}$$
$\frac{\sigma}{\sqrt{n}}$ を標準誤差(SE: Standard Error)と呼びます。$n$ が大きくなるほど標準誤差は小さくなり、推定の精度が上がります。
さらに中心極限定理により、$n$ が十分大きいとき(目安として $n \geq 30$)、母集団の分布によらず標本平均はおよそ正規分布に従います。
$$\bar{X} \sim N\!\left(\mu, \frac{\sigma^2}{n}\right) \quad \text{(近似的に)}$$これを標準化すると
$$Z = \frac{\bar{X} - \mu}{\dfrac{\sigma}{\sqrt{n}}} \sim N(0, 1)$$この標準正規分布に従う統計量 $Z$ を使って、母平均 $\mu$ の範囲を推定します。
母平均 $\mu$ の推定には大きく2つの方法があります。
点推定とは、母平均 $\mu$ を1つの値で推定する方法です。標本平均 $\bar{x}$ がその推定値となります。例えば、標本平均が $\bar{x} = 52.3$ であれば「母平均は $52.3$ である」と推定します。
点推定は簡潔ですが、推定値がどの程度信頼できるかという情報を含みません。
区間推定とは、母平均 $\mu$ がある範囲(区間)内にあることを、一定の確率(信頼度)のもとで推定する方法です。
点推定:「母平均は $52.3$ である」 → 精度の情報なし
区間推定:「母平均は $95\%$ の信頼度で $50.1$ 以上 $54.5$ 以下にある」 → 精度の情報あり
入試では区間推定が主に出題されます。区間推定で求めた区間を信頼区間といいます。
信頼度とは、何度も同じ調査を繰り返したとき、求めた信頼区間が母平均 $\mu$ を含む割合のことです。信頼度 $95\%$ であれば、100回調査して信頼区間を作ると、そのうち約95回は区間内に母平均が含まれることを意味します。
| 信頼度 | $z$ の値 | 意味 |
|---|---|---|
| $90\%$ | $z_{0.05} = 1.645$ | 100回中約90回は区間内に $\mu$ が含まれる |
| $95\%$ | $z_{0.025} = 1.96$ | 100回中約95回は区間内に $\mu$ が含まれる |
| $99\%$ | $z_{0.005} = 2.576$ | 100回中約99回は区間内に $\mu$ が含まれる |
高校数学では $95\%$ と $99\%$ が最も重要です。入試でも $z = 1.96$ と $z = 2.576$ は必ず覚えておきましょう。
標準正規分布において $P(-z_{\alpha/2} \leq Z \leq z_{\alpha/2}) = 1 - \alpha$ が成り立ちます。信頼度 $95\%$ のとき $\alpha = 0.05$ なので $z_{\alpha/2} = z_{0.025} = 1.96$ です。
$Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}$ を代入すると
$$P\!\left(-z_{\alpha/2} \leq \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \leq z_{\alpha/2}\right) = 1 - \alpha$$不等式の各辺を変形して $\mu$ について解くと
$$P\!\left(\bar{X} - z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X} + z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}\right) = 1 - \alpha$$信頼度 $(1 - \alpha) \times 100\%$ の信頼区間:
$$\bar{x} - z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{x} + z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
95%信頼区間($z = 1.96$):
$$\bar{x} - 1.96 \cdot \frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{x} + 1.96 \cdot \frac{\sigma}{\sqrt{n}}$$
99%信頼区間($z = 2.576$):
$$\bar{x} - 2.576 \cdot \frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{x} + 2.576 \cdot \frac{\sigma}{\sqrt{n}}$$
$\bar{x}$:標本平均、$\sigma$:母標準偏差、$n$:標本の大きさ
$-z_{\alpha/2} \leq \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \leq z_{\alpha/2}$ の各辺に $\frac{\sigma}{\sqrt{n}}$ を掛けると
$$-z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \leq \bar{X} - \mu \leq z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
各辺から $\bar{X}$ を引いて $-1$ を掛けると(不等号の向きが逆転)
$$\bar{X} - z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X} + z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
この式で $\bar{X}$ に実際の標本平均 $\bar{x}$ を代入したものが信頼区間です。
信頼区間の幅は $2 \times z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$ です。この幅に影響する要因を整理します。
| 要因 | 変化 | 信頼区間の幅 |
|---|---|---|
| 信頼度を上げる | $z_{\alpha/2}$ 増大 | 広くなる |
| 標本サイズ $n$ を増やす | $\sqrt{n}$ 増大 | 狭くなる |
| 母標準偏差 $\sigma$ が大きい | 分子が増大 | 広くなる |
信頼区間の幅を半分にしたいとき、標本サイズは $4$ 倍必要です。幅は $\frac{\sigma}{\sqrt{n}}$ に比例するので、幅を $\frac{1}{k}$ にするには $n$ を $k^2$ 倍にする必要があります。
ある工場で生産される製品の重さは母標準偏差 $\sigma = 5$ g であることがわかっている。無作為に $100$ 個を抽出したところ、標本平均は $\bar{x} = 250.2$ g であった。母平均 $\mu$ の $95\%$ 信頼区間を求めよ。
$\bar{x} = 250.2$、$\sigma = 5$、$n = 100$、$z = 1.96$
$$250.2 - 1.96 \times \frac{5}{\sqrt{100}} \leq \mu \leq 250.2 + 1.96 \times \frac{5}{\sqrt{100}}$$
$$250.2 - 1.96 \times 0.5 \leq \mu \leq 250.2 + 1.96 \times 0.5$$
$$250.2 - 0.98 \leq \mu \leq 250.2 + 0.98$$
$$\therefore \quad 249.22 \leq \mu \leq 251.18$$
上と同じ条件で、$99\%$ 信頼区間を求めよ。
$z = 2.576$ を用いて
$$250.2 - 2.576 \times \frac{5}{\sqrt{100}} \leq \mu \leq 250.2 + 2.576 \times \frac{5}{\sqrt{100}}$$
$$250.2 - 1.288 \leq \mu \leq 250.2 + 1.288$$
$$\therefore \quad 248.912 \leq \mu \leq 251.488$$
$95\%$ 信頼区間の幅 $1.96$ に対し、$99\%$ 信頼区間の幅 $2.576$ と広くなっています。信頼度を上げると区間は広くなります。
母標準偏差 $\sigma = 12$ の母集団について、$95\%$ 信頼区間の幅を $4$ 以下にしたい。標本の大きさ $n$ はいくつ以上必要か。
信頼区間の幅 $= 2 \times 1.96 \times \frac{12}{\sqrt{n}} \leq 4$
$$1.96 \times \frac{12}{\sqrt{n}} \leq 2$$
$$\frac{12}{\sqrt{n}} \leq \frac{2}{1.96} \approx 1.0204$$
$$\sqrt{n} \geq \frac{12}{1.0204} \approx 11.76$$
$$n \geq 138.3 \cdots$$
$$\therefore \quad n \geq 139$$
誤:$n \geq 138.3$ なので $n = 138$
正:$n$ は自然数であり、条件を満たす最小の $n$ は $139$
標本サイズは切り上げて求めます。$138$ では幅が $4$ をわずかに超えてしまいます。
「$95\%$ 信頼区間が $[249.22, 251.18]$ である」の正しい解釈は次の通りです。
正しい解釈:同じ方法で標本を取り信頼区間を作ることを何度も繰り返すと、そのうち $95\%$ の回で区間が母平均 $\mu$ を含む。
母平均 $\mu$ は定数であり、区間の方が標本ごとに変わります。「$\mu$ が $95\%$ の確率でこの区間に入る」という言い方は厳密には正しくありません。
誤:「母平均が $95\%$ の確率で区間 $[249.22, 251.18]$ に存在する」
正:「この方法で区間を作ると、$95\%$ の割合で母平均を含む区間が得られる」
母平均は確率変数ではなく固定された値です。区間の端が確率変数です。ただし、入試の答案ではここまで厳密な記述は求められないことが多いです。
信頼度を高くすると信頼区間は広くなります。これは「高い確率で正しい」ことを保証する代わりに「おおまかな推定」にしかならないことを意味します。逆に信頼度を低くすると区間は狭くなりますが、外れる可能性が高まります。
実用上は $95\%$ 信頼区間が最もよく使われます。
入試で頻出のパターンは次の3つです。
1. 条件を与えて信頼区間を計算させる問題
2. 信頼区間の幅から必要な標本サイズを逆算する問題
3. 信頼度を変えたときの区間の変化を論述する問題
いずれも公式 $\bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$ に正しく代入できるかが鍵です。
母比率 $p$ の推定では、標本比率 $\hat{p}$ を用いて次の信頼区間を求めます。
$$\hat{p} - z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \leq p \leq \hat{p} + z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$
$\hat{p} = \frac{x}{n}$($x$:標本中の該当個数)。母比率を推定するとき、$\sigma$ が未知でも $\hat{p}$ から標準誤差を計算できます。
Q1. 標本平均 $\bar{x} = 170$、母標準偏差 $\sigma = 10$、標本の大きさ $n = 25$ のとき、母平均の $95\%$ 信頼区間を求めよ。
Q2. 信頼度を $95\%$ から $99\%$ に上げると信頼区間の幅はどうなるか。
Q3. 信頼区間の幅を現在の $\frac{1}{3}$ にするには、標本の大きさを何倍にすればよいか。
Q4. 「母平均が $95\%$ の確率でこの区間にある」という解釈は正しいか。
Q5. 標本比率 $\hat{p} = 0.6$、$n = 400$ のとき、母比率の $95\%$ 信頼区間を求めよ。
ある地域の高校生の身長は母標準偏差 $\sigma = 6$ cm であることがわかっている。無作為に $36$ 人を選んで身長を測ったところ、標本平均は $\bar{x} = 168.5$ cm であった。母平均 $\mu$ の $95\%$ 信頼区間を求めよ。
$\bar{x} = 168.5$、$\sigma = 6$、$n = 36$、$z = 1.96$ より
$$168.5 - 1.96 \times \frac{6}{\sqrt{36}} \leq \mu \leq 168.5 + 1.96 \times \frac{6}{\sqrt{36}}$$
$$168.5 - 1.96 \times 1 \leq \mu \leq 168.5 + 1.96 \times 1$$
$$\therefore \quad 166.54 \leq \mu \leq 170.46$$
母標準偏差 $\sigma = 8$ の母集団から大きさ $n = 64$ の標本を抽出したところ $\bar{x} = 50$ であった。
(1) $95\%$ 信頼区間を求めよ。
(2) $99\%$ 信頼区間を求めよ。
(3) $95\%$ 信頼区間の幅を $1$ 以下にするには標本サイズをいくつ以上にすればよいか。
(1) $50 \pm 1.96 \times \frac{8}{\sqrt{64}} = 50 \pm 1.96 \times 1 = 50 \pm 1.96$
$$\therefore \quad 48.04 \leq \mu \leq 51.96$$
(2) $50 \pm 2.576 \times 1 = 50 \pm 2.576$
$$\therefore \quad 47.424 \leq \mu \leq 52.576$$
(3) 幅 $= 2 \times 1.96 \times \frac{8}{\sqrt{n}} \leq 1$
$$\frac{8}{\sqrt{n}} \leq \frac{1}{3.92}$$
$$\sqrt{n} \geq 8 \times 3.92 = 31.36$$
$$n \geq 983.45\cdots$$
$$\therefore \quad n \geq 984$$
ある選挙の事前調査で、有権者 $900$ 人を無作為に選んで調査したところ、$540$ 人が候補者Aを支持すると回答した。候補者Aの支持率 $p$ について $95\%$ 信頼区間を求めよ。
標本比率 $\hat{p} = \frac{540}{900} = 0.6$、$n = 900$
$$\hat{p} \pm 1.96 \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = 0.6 \pm 1.96 \sqrt{\frac{0.6 \times 0.4}{900}}$$
$$= 0.6 \pm 1.96 \sqrt{\frac{0.24}{900}} = 0.6 \pm 1.96 \times \frac{\sqrt{0.24}}{30}$$
$\sqrt{0.24} \approx 0.4899$ より
$$= 0.6 \pm 1.96 \times 0.01633 \approx 0.6 \pm 0.032$$
$$\therefore \quad 0.568 \leq p \leq 0.632$$
標本比率 $\hat{p} = 0.6$ なので、標準誤差は $\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$ で計算します。支持率は $56.8\%$ から $63.2\%$ の間にあると $95\%$ の信頼度で推定できます。
ある製品の重量は母標準偏差 $\sigma = 15$ g の正規分布に従う。次の各問に答えよ。
(1) 標本の大きさ $n = 225$ のとき、母平均 $\mu$ の $95\%$ 信頼区間の幅を求めよ。
(2) $99\%$ 信頼区間の幅を $3$ g 以下にするために必要な最小の標本サイズ $n$ を求めよ。
(3) 標本サイズを $n$ から $4n$ に増やすと、$95\%$ 信頼区間の幅は何倍になるか。理由とともに述べよ。
(1) 幅 $= 2 \times 1.96 \times \frac{15}{\sqrt{225}} = 2 \times 1.96 \times \frac{15}{15} = 2 \times 1.96 = 3.92$ g
(2) 幅 $= 2 \times 2.576 \times \frac{15}{\sqrt{n}} \leq 3$
$$2.576 \times \frac{15}{\sqrt{n}} \leq 1.5$$
$$\sqrt{n} \geq \frac{2.576 \times 15}{1.5} = 25.76$$
$$n \geq 663.6 \cdots$$
$$\therefore \quad n \geq 664$$
(3) $\frac{1}{2}$ 倍になる。
信頼区間の幅は $\frac{2z\sigma}{\sqrt{n}}$ に比例する。$n$ を $4n$ にすると
$$\frac{2z\sigma}{\sqrt{4n}} = \frac{2z\sigma}{2\sqrt{n}} = \frac{1}{2} \cdot \frac{2z\sigma}{\sqrt{n}}$$
よって幅は $\frac{1}{2}$ 倍になる。
信頼区間の幅は $\frac{1}{\sqrt{n}}$ に比例するため、標本サイズを $k$ 倍にすると幅は $\frac{1}{\sqrt{k}}$ 倍になります。これは推定精度を上げるためには多くの標本が必要であることを意味し、実験計画において重要な知識です。