「このコインは公正か」「新薬は効果があるか」──こうした主張の真偽を、データに基づいて客観的に判断する方法が仮説検定です。本記事では帰無仮説・対立仮説の立て方、有意水準、棄却域、両側検定と片側検定の違いを体系的に学びます。統計的推測の最重要テーマです。
仮説検定とは、母集団に関するある主張(仮説)が正しいかどうかを、標本データをもとに統計的に判断する方法です。
仮説検定の論理は数学の背理法に似ています。否定したい仮説を一旦正しいと仮定し、その仮定のもとで得られたデータが「めったに起こらないこと」ならば、仮説は正しくないと判断します。
1. 否定したい仮説(帰無仮説 $H_0$)を立てる
2. $H_0$ が正しいと仮定して、観測データが得られる確率を計算する
3. その確率が非常に小さい(有意水準以下)ならば $H_0$ を棄却する
4. $H_0$ を棄却できなければ、$H_0$ を積極的に否定する根拠はないと判断する
帰無仮説 $H_0$(きむかせつ)は「差がない」「効果がない」「変化がない」という主張です。否定したい方の仮説を帰無仮説に設定します。
対立仮説 $H_1$(たいりつかせつ)は帰無仮説の否定であり、主張したい方の仮説です。
例:あるコインが公正(表が出る確率 $p = 0.5$)かどうかを検定する場合
帰無仮説 $H_0$:$p = 0.5$(コインは公正である)
対立仮説 $H_1$:$p \neq 0.5$(コインは公正でない)
対立仮説が $p \neq 0.5$ のとき両側検定、$p > 0.5$ や $p < 0.5$ のとき片側検定になります。
有意水準($\alpha$)は、帰無仮説が正しいにもかかわらず誤って棄却してしまう確率の許容範囲です。通常は $\alpha = 0.05$($5\%$)または $\alpha = 0.01$($1\%$)を用います。
| 有意水準 | 意味 | 判断の厳しさ |
|---|---|---|
| $\alpha = 0.05$($5\%$) | $H_0$ が正しいのに棄却する確率が $5\%$ 以下 | 標準的 |
| $\alpha = 0.01$($1\%$) | $H_0$ が正しいのに棄却する確率が $1\%$ 以下 | より厳しい |
仮説検定は次の手順で行います。この手順を正確に踏むことが入試の答案でも求められます。
Step 1:帰無仮説 $H_0$ と対立仮説 $H_1$ を立てる
Step 2:有意水準 $\alpha$ を決める(通常 $5\%$)
Step 3:検定統計量を計算する
Step 4:棄却域を求め、検定統計量が棄却域に入るか判定する
Step 5:結論を述べる($H_0$ を棄却する / 棄却しない)
帰無仮説 $H_0$ のもとで標本から計算される統計量を検定統計量といいます。母平均の検定では
$$Z_0 = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}$$が検定統計量です。ここで $\mu_0$ は帰無仮説で仮定した母平均の値です。$H_0$ が正しければ $Z_0$ はおよそ標準正規分布 $N(0, 1)$ に従います。
棄却域(きゃくいき)とは、検定統計量がこの範囲に入ったとき帰無仮説を棄却する領域です。
有意水準 $\alpha = 0.05$ の両側検定の棄却域:
$$Z_0 < -1.96 \quad \text{または} \quad Z_0 > 1.96$$
有意水準 $\alpha = 0.01$ の両側検定の棄却域:
$$Z_0 < -2.576 \quad \text{または} \quad Z_0 > 2.576$$
ある機械で製造されるボルトの長さは、これまで平均 $\mu_0 = 20.0$ mm、標準偏差 $\sigma = 0.5$ mm であった。機械を調整した後、$25$ 本を無作為に抽出したところ標本平均が $\bar{x} = 20.3$ mm であった。調整により平均が変化したといえるか、有意水準 $5\%$ で検定せよ。
Step 1:$H_0$:$\mu = 20.0$、$H_1$:$\mu \neq 20.0$
Step 2:有意水準 $\alpha = 0.05$
Step 3:検定統計量 $Z_0 = \frac{20.3 - 20.0}{0.5 / \sqrt{25}} = \frac{0.3}{0.1} = 3.0$
Step 4:$\alpha = 0.05$ の両側検定の棄却域は $|Z_0| > 1.96$。$|Z_0| = 3.0 > 1.96$ なので棄却域に入る。
Step 5:$H_0$ を棄却する。よって、有意水準 $5\%$ で平均は変化したといえる。
入試の答案では、5つのステップを順番に明記することが重要です。特に次の点に注意しましょう。
1. $H_0$ と $H_1$ を数式で明記する
2. 検定統計量の計算過程を示す
3. 棄却域の値と検定統計量の比較を明示する
4. 結論は「$H_0$ を棄却する」「$H_0$ を棄却しない」と書く(「$H_0$ を採択する」とは書かない)
両側検定は対立仮説が $H_1$:$\mu \neq \mu_0$ の形をとり、母平均が「大きくなった」「小さくなった」のどちらの可能性も考慮する検定です。棄却域は $Z$ の正負両方にあります。
片側検定は対立仮説が $H_1$:$\mu > \mu_0$ または $H_1$:$\mu < \mu_0$ の形をとり、一方向の変化のみを考慮する検定です。
両側検定($H_1$:$\mu \neq \mu_0$)
棄却域:$Z_0 < -1.96$ または $Z_0 > 1.96$
右片側検定($H_1$:$\mu > \mu_0$)
棄却域:$Z_0 > 1.645$
左片側検定($H_1$:$\mu < \mu_0$)
棄却域:$Z_0 < -1.645$
片側検定は有意水準 $\alpha$ を片方に集めるため、$z$ の値が両側検定より小さくなります。片側:$z_{0.05} = 1.645$、両側:$z_{0.025} = 1.96$
| 検定の種類 | 対立仮説 | 棄却域($\alpha = 0.05$) | 棄却域($\alpha = 0.01$) |
|---|---|---|---|
| 両側検定 | $\mu \neq \mu_0$ | $|Z_0| > 1.96$ | $|Z_0| > 2.576$ |
| 右片側検定 | $\mu > \mu_0$ | $Z_0 > 1.645$ | $Z_0 > 2.326$ |
| 左片側検定 | $\mu < \mu_0$ | $Z_0 < -1.645$ | $Z_0 < -2.326$ |
誤:結果を見てから有利な方(片側 or 両側)を選ぶ
正:データを見る前に、問題の文脈から検定の種類を決める
「変化したか」→ 両側検定、「増えたか」「減ったか」→ 片側検定。問題文の聞き方で判断します。
p値とは、帰無仮説が正しいと仮定したとき、観測されたデータ以上に極端な結果が得られる確率です。p値が有意水準 $\alpha$ より小さいとき、$H_0$ を棄却します。
p値は「データが $H_0$ のもとでどれくらい珍しいか」を表す指標です。p値が小さいほど、帰無仮説に対する反証が強いことを意味します。
高校数学で最も出題されるのが母比率の検定です。コインやサイコロの公正さ、支持率の変化などを検定します。
帰無仮説 $H_0$:$p = p_0$ のもとで、標本比率 $\hat{p} = \frac{X}{n}$ に対する検定統計量は
$$Z_0 = \frac{\hat{p} - p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}$$
$H_0$ のもとで $Z_0$ はおよそ $N(0, 1)$ に従います。分母の $p_0$ は帰無仮説で仮定した値を用います。
あるコインを $400$ 回投げたところ、表が $224$ 回出た。このコインは公正といえるか。有意水準 $5\%$ で両側検定を行え。
Step 1:$H_0$:$p = 0.5$、$H_1$:$p \neq 0.5$
Step 2:有意水準 $\alpha = 0.05$
Step 3:$\hat{p} = \frac{224}{400} = 0.56$
$$Z_0 = \frac{0.56 - 0.5}{\sqrt{\frac{0.5 \times 0.5}{400}}} = \frac{0.06}{\sqrt{\frac{0.25}{400}}} = \frac{0.06}{0.025} = 2.4$$
Step 4:両側検定の棄却域は $|Z_0| > 1.96$。$|Z_0| = 2.4 > 1.96$ なので棄却域に入る。
Step 5:$H_0$ を棄却する。よって、有意水準 $5\%$ で、このコインは公正でないといえる。
ある候補者の以前の支持率は $40\%$ であった。最近の調査で $500$ 人中 $220$ 人が支持した。支持率は上がったといえるか。有意水準 $5\%$ で検定せよ。
Step 1:$H_0$:$p = 0.4$、$H_1$:$p > 0.4$(右片側検定)
Step 2:有意水準 $\alpha = 0.05$
Step 3:$\hat{p} = \frac{220}{500} = 0.44$
$$Z_0 = \frac{0.44 - 0.4}{\sqrt{\frac{0.4 \times 0.6}{500}}} = \frac{0.04}{\sqrt{\frac{0.24}{500}}} = \frac{0.04}{\sqrt{0.00048}} = \frac{0.04}{0.02191} \approx 1.826$$
Step 4:右片側検定の棄却域は $Z_0 > 1.645$。$Z_0 = 1.826 > 1.645$ なので棄却域に入る。
Step 5:$H_0$ を棄却する。よって、有意水準 $5\%$ で支持率は上がったといえる。
誤:分母に標本比率 $\hat{p}$ を使う → $\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$
正:分母に帰無仮説の値 $p_0$ を使う → $\sqrt{\frac{p_0(1-p_0)}{n}}$
信頼区間では $\hat{p}$ を使いますが、検定統計量では $H_0$ のもとでの値 $p_0$ を使います。混同しやすいので注意しましょう。
仮説検定では2種類の誤りが起こり得ます。
| $H_0$ が真 | $H_0$ が偽 | |
|---|---|---|
| $H_0$ を棄却 | 第1種の過誤($\alpha$) | 正しい判断 |
| $H_0$ を棄却しない | 正しい判断 | 第2種の過誤($\beta$) |
第1種の過誤:$H_0$ が正しいのに誤って棄却する確率。有意水準 $\alpha$ で制御される。
第2種の過誤:$H_0$ が誤りなのに棄却できない確率 $\beta$。
$\alpha$ を小さくすると $\beta$ は大きくなる傾向があります(トレードオフ)。標本サイズ $n$ を増やすことで両方を同時に小さくできます。
誤:「$H_0$ を棄却しない」= 「$H_0$ は正しい」
正:「$H_0$ を棄却しない」= 「$H_0$ を否定する十分な証拠がない」
帰無仮説を棄却できなかったとしても、帰無仮説が正しいことの証明にはなりません。単に「現在のデータからは判断できない」ということです。
検定と信頼区間には密接な関係があります。有意水準 $\alpha$ の両側検定で $H_0$:$\mu = \mu_0$ を棄却することは、信頼度 $(1-\alpha)$ の信頼区間に $\mu_0$ が含まれないことと同値です。
有意水準 $5\%$ の両側検定で $H_0$ を棄却する
$\Longleftrightarrow$ $95\%$ 信頼区間に帰無仮説の値 $\mu_0$ が含まれない
この関係を使うと、信頼区間から検定の結果を読み取ることもできます。
標本サイズが小さい場合は正規近似が使えないため、二項分布をそのまま用いて検定します。
例えば、コインを $10$ 回投げて表が $9$ 回出た場合、$H_0$:$p = 0.5$ のもとで $P(X \geq 9) = \binom{10}{9}(0.5)^{10} + \binom{10}{10}(0.5)^{10} = \frac{10+1}{1024} = \frac{11}{1024} \approx 0.0107$ です。両側検定なら $2 \times 0.0107 = 0.0214 < 0.05$ より $H_0$ を棄却できます。
Q1. 帰無仮説 $H_0$ と対立仮説 $H_1$ はそれぞれどのような仮説か。
Q2. 有意水準 $5\%$ の両側検定における棄却域を述べよ。
Q3. 母比率の検定統計量の分母には $\hat{p}$ と $p_0$ のどちらを用いるか。
Q4. 「$H_0$ を棄却しない」は「$H_0$ は正しい」と同じ意味か。
Q5. 有意水準 $5\%$ の両側検定で $H_0$ を棄却できるとき、$95\%$ 信頼区間について何がいえるか。
あるサイコロを $600$ 回振ったところ、$1$ の目が $120$ 回出た。このサイコロは公正($1$ の目が出る確率が $\frac{1}{6}$)といえるか。有意水準 $5\%$ で両側検定を行え。
$H_0$:$p = \frac{1}{6}$、$H_1$:$p \neq \frac{1}{6}$
$\hat{p} = \frac{120}{600} = 0.2$、$p_0 = \frac{1}{6} \approx 0.1667$
$$Z_0 = \frac{0.2 - \frac{1}{6}}{\sqrt{\frac{\frac{1}{6} \cdot \frac{5}{6}}{600}}} = \frac{0.0333}{\sqrt{\frac{5}{36 \times 600}}} = \frac{0.0333}{\sqrt{0.000231}} = \frac{0.0333}{0.01521} \approx 2.19$$
$|Z_0| = 2.19 > 1.96$ なので棄却域に入る。
$H_0$ を棄却する。有意水準 $5\%$ でこのサイコロは公正でないといえる。
ある品種のトマトの重さは、従来の平均が $\mu_0 = 150$ g、標準偏差 $\sigma = 20$ g であった。新しい肥料を使って育てた $64$ 個のトマトの平均重量は $\bar{x} = 155$ g であった。
(1) 新しい肥料でトマトの平均重量は変化したといえるか。有意水準 $5\%$ で両側検定を行え。
(2) 新しい肥料でトマトの平均重量は増加したといえるか。有意水準 $5\%$ で片側検定を行え。
(1) $H_0$:$\mu = 150$、$H_1$:$\mu \neq 150$
$$Z_0 = \frac{155 - 150}{20 / \sqrt{64}} = \frac{5}{2.5} = 2.0$$
$|Z_0| = 2.0 > 1.96$ → 棄却域に入る。$H_0$ を棄却。有意水準 $5\%$ で平均重量は変化したといえる。
(2) $H_0$:$\mu = 150$、$H_1$:$\mu > 150$
$Z_0 = 2.0 > 1.645$ → 棄却域に入る。$H_0$ を棄却。有意水準 $5\%$ で平均重量は増加したといえる。
$Z_0 = 2.0$ のとき、両側検定では $1.96$ と比較し、片側検定では $1.645$ と比較します。片側検定の方が棄却しやすいことがわかります。ただし、片側検定は「増加した」という方向性を事前に仮定しているため、適用には注意が必要です。
母標準偏差 $\sigma = 10$ の母集団から大きさ $n = 100$ の標本を抽出したところ、$\bar{x} = 52$ であった。
(1) 母平均 $\mu$ の $95\%$ 信頼区間を求めよ。
(2) 帰無仮説 $H_0$:$\mu = 50$ を有意水準 $5\%$ で両側検定せよ。
(3) (1)(2) の結果の関係を説明せよ。
(1) $52 \pm 1.96 \times \frac{10}{\sqrt{100}} = 52 \pm 1.96$
$$\therefore \quad 50.04 \leq \mu \leq 53.96$$
(2) $Z_0 = \frac{52 - 50}{10/\sqrt{100}} = \frac{2}{1} = 2.0$
$|Z_0| = 2.0 > 1.96$ → $H_0$ を棄却。有意水準 $5\%$ で $\mu = 50$ とはいえない。
(3) $95\%$ 信頼区間 $[50.04, 53.96]$ に $\mu_0 = 50$ は含まれていない。これは (2) で $H_0$ が棄却されたことと対応している。有意水準 $\alpha$ の両側検定で $H_0$ を棄却することと、信頼度 $(1-\alpha)$ の信頼区間に $\mu_0$ が含まれないことは同値である。
ある薬の副作用発生率はこれまで $10\%$ であった。改良された新薬を $200$ 人に投与したところ、副作用が出た人は $12$ 人であった。
(1) 新薬の副作用発生率は減少したといえるか。有意水準 $5\%$ で片側検定を行え。
(2) 有意水準 $1\%$ ではどうなるか。
(3) 副作用発生率の $95\%$ 信頼区間を求め、(1) の結果との関係を考察せよ。
(1) $H_0$:$p = 0.1$、$H_1$:$p < 0.1$(左片側検定)
$\hat{p} = \frac{12}{200} = 0.06$
$$Z_0 = \frac{0.06 - 0.1}{\sqrt{\frac{0.1 \times 0.9}{200}}} = \frac{-0.04}{\sqrt{0.00045}} = \frac{-0.04}{0.02121} \approx -1.886$$
左片側検定の棄却域は $Z_0 < -1.645$。$Z_0 = -1.886 < -1.645$ → 棄却域に入る。
$H_0$ を棄却。有意水準 $5\%$ で副作用発生率は減少したといえる。
(2) 有意水準 $1\%$ の棄却域は $Z_0 < -2.326$。$Z_0 = -1.886 > -2.326$ → 棄却域に入らない。
$H_0$ を棄却しない。有意水準 $1\%$ では副作用発生率が減少したとはいえない。
(3) $\hat{p} = 0.06$ の $95\%$ 信頼区間:
$$0.06 \pm 1.96\sqrt{\frac{0.06 \times 0.94}{200}} = 0.06 \pm 1.96 \times 0.01679 \approx 0.06 \pm 0.033$$
$$0.027 \leq p \leq 0.093$$
$p_0 = 0.1$ はこの信頼区間に含まれていない。これは (1) で左片側検定により $H_0$ を棄却した結果と整合する。
有意水準を厳しくすると棄却しにくくなります。$5\%$ では棄却できても $1\%$ では棄却できない「グレーゾーン」の結果です。このような場合は標本サイズを増やして再調査することが実務では推奨されます。