第9章 統計的な推測

連続型確率変数と確率密度関数
─ 離散から連続への拡張

これまで扱ってきた確率変数は「サイコロの目」や「成功回数」のように、とびとびの値をとる離散型でした。本記事では、身長や時間のように連続的な値をとる確率変数と、その確率を面積で表す確率密度関数を学びます。積分の考え方が登場しますが、基本的なアイデアはシンプルです。

1離散型と連続型の違い

確率変数には大きく分けて2種類あります。

離散型 連続型
値のとり方 とびとびの値($0, 1, 2, \ldots$) ある区間の任意の実数値
確率の表し方 確率関数 $P(X=k)$ 確率密度関数 $f(x)$
確率の計算 $\sum$(和) $\int$(積分=面積)
サイコロの目、成功回数 身長、体重、時間
📌 連続型の核心アイデア

連続型確率変数では、$P(X = a) = 0$ です(任意の1点の確率はゼロ)。

確率は「ある区間に入る確率」$P(a \leq X \leq b)$ という形で意味を持ち、これをグラフの下の面積(積分)として求めます。

離散型では確率を棒グラフで表しましたが、連続型では滑らかな曲線 $y = f(x)$ を描き、区間 $[a, b]$ における曲線と $x$ 軸の間の面積が確率になります。

⚠️ よくある誤解

✗ $f(a)$ は「$X = a$ となる確率」である

✓ $f(a)$ は確率密度であり、確率そのものではない。確率は面積(積分)で求める

$f(x)$ の値は「確率の密度」であり、$f(x) > 1$ となることもあります。$f(x)$ そのものは確率ではないことに注意しましょう。

2確率密度関数の定義と性質

📐 確率密度関数の定義

連続型確率変数 $X$ に対して、関数 $f(x)$ が次の2条件を満たすとき、$f(x)$ を $X$ の確率密度関数(PDF)という。

条件1:すべての $x$ に対して $f(x) \geq 0$

条件2:$\displaystyle\int_{-\infty}^{\infty} f(x) \, dx = 1$

※ 条件1は「曲線が $x$ 軸より下にならない」、条件2は「全体の面積が $1$」ということ。

確率密度関数を用いると、確率変数 $X$ が区間 $[a, b]$ に入る確率は次のように計算できます。

📐 確率の計算

$$P(a \leq X \leq b) = \int_a^b f(x) \, dx$$

※ 連続型では $P(a \leq X \leq b) = P(a < X < b) = P(a \leq X < b) = P(a < X \leq b)$(端点の確率は $0$ なので等号の有無は影響しない)。

💡 面積で確率を理解する

$y = f(x)$ のグラフと $x$ 軸の間の面積の合計は $1$(=100%)です。

区間 $[a, b]$ の部分の面積が $P(a \leq X \leq b)$ に対応します。

全体の面積が $1$ なので、面積がそのまま確率(割合)を表します。

累積分布関数

確率密度関数 $f(x)$ を $-\infty$ から $x$ まで積分した関数を累積分布関数(CDF)$F(x)$ といいます。

$$F(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) \, dt$$

$F(x)$ は $0$ から $1$ への単調増加関数で、$F'(x) = f(x)$ が成り立ちます。

3確率密度関数の具体例

📝 例題1:確率密度関数の確認

問題:$f(x) = \begin{cases} 2x & (0 \leq x \leq 1) \\ 0 & (\text{その他}) \end{cases}$ が確率密度関数であることを確認し、$P\left(\dfrac{1}{2} \leq X \leq 1\right)$ を求めよ。

解:

条件1の確認:$0 \leq x \leq 1$ のとき $f(x) = 2x \geq 0$。その他のとき $f(x) = 0$。よって常に $f(x) \geq 0$。

条件2の確認:

$$\int_{-\infty}^{\infty} f(x) \, dx = \int_0^1 2x \, dx = \left[x^2\right]_0^1 = 1$$

よって $f(x)$ は確率密度関数である。

確率の計算:

$$P\left(\frac{1}{2} \leq X \leq 1\right) = \int_{1/2}^{1} 2x \, dx = \left[x^2\right]_{1/2}^{1} = 1 - \frac{1}{4} = \frac{3}{4}$$

📝 例題2:定数の決定

問題:$f(x) = \begin{cases} ax(1-x) & (0 \leq x \leq 1) \\ 0 & (\text{その他}) \end{cases}$ が確率密度関数となるように定数 $a$ の値を求めよ。

解:条件2より:

$$\int_0^1 ax(1-x) \, dx = a \int_0^1 (x - x^2) \, dx = a \left[\frac{x^2}{2} - \frac{x^3}{3}\right]_0^1 = a \cdot \frac{1}{6} = 1$$

よって $a = 6$。

条件1の確認:$0 \leq x \leq 1$ のとき $f(x) = 6x(1-x) \geq 0$。条件を満たす。

📝 例題3:区間が無限の場合

問題:$f(x) = \begin{cases} e^{-x} & (x \geq 0) \\ 0 & (x < 0) \end{cases}$ が確率密度関数であることを確認せよ。

解:

条件1:$x \geq 0$ のとき $e^{-x} > 0$。$x < 0$ のとき $f(x) = 0$。よって $f(x) \geq 0$。

条件2:

$$\int_0^{\infty} e^{-x} \, dx = \left[-e^{-x}\right]_0^{\infty} = 0 - (-1) = 1$$

よって確率密度関数である。(これを指数分布という。)

⚠️ $f(x) > 1$ になることがある

✗ 確率密度関数は $0 \leq f(x) \leq 1$ を満たす

✓ $f(x) \geq 0$ であればよく、$f(x) > 1$ でもよい。例えば $f(x) = 2x$($0 \leq x \leq 1$)では $f(1) = 2 > 1$

確率の条件は「面積が $1$」であり、高さの上限はありません。

4連続型確率変数の期待値と分散

離散型の場合、期待値は $\sum x_k P(X = x_k)$ でしたが、連続型では和($\sum$)を積分($\int$)に置き換えます。

📐 連続型確率変数の期待値と分散

期待値:

$$E(X) = \int_{-\infty}^{\infty} x f(x) \, dx$$

分散:

$$V(X) = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) \, dx = E(X^2) - \{E(X)\}^2$$

ただし $\mu = E(X)$、$E(X^2) = \displaystyle\int_{-\infty}^{\infty} x^2 f(x) \, dx$

📝 例題:$f(x) = 2x$($0 \leq x \leq 1$)の期待値と分散

期待値:

$$E(X) = \int_0^1 x \cdot 2x \, dx = 2\int_0^1 x^2 \, dx = 2 \cdot \frac{1}{3} = \frac{2}{3}$$

$E(X^2)$ の計算:

$$E(X^2) = \int_0^1 x^2 \cdot 2x \, dx = 2\int_0^1 x^3 \, dx = 2 \cdot \frac{1}{4} = \frac{1}{2}$$

分散:

$$V(X) = E(X^2) - \{E(X)\}^2 = \frac{1}{2} - \left(\frac{2}{3}\right)^2 = \frac{1}{2} - \frac{4}{9} = \frac{1}{18}$$

標準偏差:

$$\sigma(X) = \sqrt{\frac{1}{18}} = \frac{1}{3\sqrt{2}} = \frac{\sqrt{2}}{6}$$

💡 離散型との対応

離散型と連続型の公式は、$\sum \leftrightarrow \int$、$P(X=x_k) \leftrightarrow f(x)dx$ と置き換えるだけです。

離散型:$E(X) = \sum x_k P(X = x_k)$ → 連続型:$E(X) = \int x f(x) \, dx$

離散型:$V(X) = \sum (x_k - \mu)^2 P(X = x_k)$ → 連続型:$V(X) = \int (x - \mu)^2 f(x) \, dx$

5一様分布

最もシンプルな連続型分布が一様分布(uniform distribution)です。区間 $[a, b]$ のすべての値が等しい確率密度を持ちます。

📐 一様分布 $U(a, b)$

確率密度関数:

$$f(x) = \begin{cases} \dfrac{1}{b-a} & (a \leq x \leq b) \\ 0 & (\text{その他}) \end{cases}$$

期待値:$E(X) = \dfrac{a+b}{2}$

分散:$V(X) = \dfrac{(b-a)^2}{12}$

📝 一様分布の期待値・分散の導出

確率密度関数の確認:$f(x) = \dfrac{1}{b-a} > 0$ であり、

$$\int_a^b \frac{1}{b-a} \, dx = \frac{b-a}{b-a} = 1$$

期待値:

$$E(X) = \int_a^b x \cdot \frac{1}{b-a} \, dx = \frac{1}{b-a} \left[\frac{x^2}{2}\right]_a^b = \frac{b^2 - a^2}{2(b-a)} = \frac{a+b}{2}$$

$E(X^2)$:

$$E(X^2) = \frac{1}{b-a} \int_a^b x^2 \, dx = \frac{1}{b-a} \cdot \frac{b^3 - a^3}{3} = \frac{a^2 + ab + b^2}{3}$$

分散:

$$V(X) = E(X^2) - \{E(X)\}^2 = \frac{a^2 + ab + b^2}{3} - \frac{(a+b)^2}{4} = \frac{(b-a)^2}{12}$$

📌 一様分布の具体例

例:バスが $10$ 分間隔で運行しているとき、バス停に着いてからの待ち時間 $X$ は $U(0, 10)$ に近い分布をとります。

$E(X) = \dfrac{0+10}{2} = 5$(分)、$V(X) = \dfrac{100}{12} = \dfrac{25}{3}$

平均 $5$ 分待つことになり、これは直感とも合います。

⚠️ 連続型での「$=$」の扱い

✗ $P(X = 5)$ を $f(5) = \dfrac{1}{10}$ と答える

✓ $P(X = 5) = 0$。連続型では1点の確率は常に $0$。$P(4 \leq X \leq 6) = \dfrac{2}{10} = \dfrac{1}{5}$

まとめ

  • 連続型確率変数 ─ ある区間の任意の実数値をとる確率変数。確率は面積(積分)で求める
  • 確率密度関数 ─ $f(x) \geq 0$ かつ $\int_{-\infty}^{\infty} f(x)\,dx = 1$ を満たす関数
  • 確率の計算 ─ $P(a \leq X \leq b) = \int_a^b f(x)\,dx$。1点の確率は $0$
  • 期待値・分散 ─ $\sum$ を $\int$ に置き換え。$E(X) = \int xf(x)\,dx$、$V(X) = E(X^2) - \{E(X)\}^2$
  • 一様分布 ─ $U(a,b)$:$E(X) = \dfrac{a+b}{2}$、$V(X) = \dfrac{(b-a)^2}{12}$

確認テスト

Q1. 確率密度関数が満たすべき2つの条件を述べよ。

▶ クリックして解答を表示 (1) すべての $x$ で $f(x) \geq 0$。(2) $\int_{-\infty}^{\infty} f(x)\,dx = 1$。

Q2. 連続型確率変数で $P(X = a) = 0$ となる理由を簡潔に説明せよ。

▶ クリックして解答を表示 $P(X = a) = \int_a^a f(x)\,dx = 0$。積分区間の幅が $0$ なので面積も $0$ になる。

Q3. $f(x) = 3x^2$($0 \leq x \leq 1$)のとき $P(0 \leq X \leq 1/2)$ を求めよ。

▶ クリックして解答を表示 $P(0 \leq X \leq 1/2) = \int_0^{1/2} 3x^2\,dx = [x^3]_0^{1/2} = \dfrac{1}{8}$

Q4. 一様分布 $U(2, 8)$ の期待値と分散を求めよ。

▶ クリックして解答を表示 $E(X) = \dfrac{2+8}{2} = 5$、$V(X) = \dfrac{(8-2)^2}{12} = \dfrac{36}{12} = 3$

Q5. $f(x) = cx$($0 \leq x \leq 2$)が確率密度関数となるような $c$ の値を求めよ。

▶ クリックして解答を表示 $\int_0^2 cx\,dx = c \cdot [x^2/2]_0^2 = 2c = 1$ より $c = \dfrac{1}{2}$。

入試問題演習

問題 1 A 基礎 確率密度関数

$f(x) = \begin{cases} a(1-x^2) & (0 \leq x \leq 1) \\ 0 & (\text{その他}) \end{cases}$ が確率密度関数となるように $a$ を定め、$P\left(0 \leq X \leq \dfrac{1}{2}\right)$ を求めよ。

解答

$\displaystyle\int_0^1 a(1-x^2)\,dx = a\left[x - \frac{x^3}{3}\right]_0^1 = a \cdot \frac{2}{3} = 1$ より $a = \dfrac{3}{2}$。

$P\left(0 \leq X \leq \dfrac{1}{2}\right) = \dfrac{3}{2}\displaystyle\int_0^{1/2}(1-x^2)\,dx = \dfrac{3}{2}\left[\,x - \frac{x^3}{3}\,\right]_0^{1/2}$

$= \dfrac{3}{2}\left(\dfrac{1}{2} - \dfrac{1}{24}\right) = \dfrac{3}{2} \cdot \dfrac{11}{24} = \dfrac{11}{16}$

▶ 解答を見る
問題 2 B 標準 期待値・分散

確率密度関数 $f(x) = \begin{cases} 6x(1-x) & (0 \leq x \leq 1) \\ 0 & (\text{その他}) \end{cases}$ について、$E(X)$ と $V(X)$ を求めよ。

解答

$E(X) = \displaystyle\int_0^1 x \cdot 6x(1-x)\,dx = 6\int_0^1 (x^2 - x^3)\,dx = 6\left[\frac{x^3}{3} - \frac{x^4}{4}\right]_0^1 = 6 \cdot \frac{1}{12} = \frac{1}{2}$

$E(X^2) = \displaystyle\int_0^1 x^2 \cdot 6x(1-x)\,dx = 6\int_0^1 (x^3 - x^4)\,dx = 6\left[\frac{x^4}{4} - \frac{x^5}{5}\right]_0^1 = 6 \cdot \frac{1}{20} = \frac{3}{10}$

$V(X) = \dfrac{3}{10} - \left(\dfrac{1}{2}\right)^2 = \dfrac{3}{10} - \dfrac{1}{4} = \dfrac{1}{20}$

▶ 解答を見る
問題 3 B 標準 一様分布

$[0, 1]$ 上の一様分布に従う確率変数 $X$ に対して、$Y = 3X + 2$ とおく。$E(Y)$、$V(Y)$、$\sigma(Y)$ を求めよ。

解答

$X \sim U(0, 1)$ より $E(X) = \dfrac{1}{2}$、$V(X) = \dfrac{1}{12}$

$E(Y) = E(3X + 2) = 3E(X) + 2 = 3 \cdot \dfrac{1}{2} + 2 = \dfrac{7}{2}$

$V(Y) = V(3X + 2) = 9V(X) = 9 \cdot \dfrac{1}{12} = \dfrac{3}{4}$

$\sigma(Y) = \sqrt{\dfrac{3}{4}} = \dfrac{\sqrt{3}}{2}$

解説

$Y = aX + b$ のとき $E(Y) = aE(X) + b$、$V(Y) = a^2 V(X)$ です。定数 $b$ は分散に影響を与えないことに注意しましょう。

▶ 解答を見る
問題 4 C 発展 累積分布関数

確率密度関数が $f(x) = \begin{cases} \dfrac{3}{32}(4-x^2) & (-2 \leq x \leq 2) \\ 0 & (\text{その他}) \end{cases}$ で与えられるとき:

(1) $P(-1 \leq X \leq 1)$ を求めよ。

(2) $E(X)$ を求めよ。

(3) $V(X)$ を求めよ。

解答

まず $f(x)$ が確率密度関数であることを確認する。$-2 \leq x \leq 2$ で $4 - x^2 \geq 0$ だから $f(x) \geq 0$。

$\displaystyle\int_{-2}^{2}\frac{3}{32}(4-x^2)\,dx = \frac{3}{32}\left[4x - \frac{x^3}{3}\right]_{-2}^{2} = \frac{3}{32} \cdot \frac{32}{3} = 1$ ✓

(1) $P(-1 \leq X \leq 1) = \dfrac{3}{32}\displaystyle\int_{-1}^{1}(4-x^2)\,dx = \dfrac{3}{32}\left[4x - \frac{x^3}{3}\right]_{-1}^{1}$

$= \dfrac{3}{32}\left[\left(4 - \frac{1}{3}\right) - \left(-4 + \frac{1}{3}\right)\right] = \dfrac{3}{32} \cdot \dfrac{22}{3} = \dfrac{22}{32} = \dfrac{11}{16}$

(2) $f(x)$ は偶関数($f(-x) = f(x)$)であるから $xf(x)$ は奇関数。

$$E(X) = \int_{-2}^{2} xf(x)\,dx = 0$$

(3) $E(X^2) = \dfrac{3}{32}\displaystyle\int_{-2}^{2}x^2(4-x^2)\,dx = \dfrac{3}{32} \cdot 2\int_0^{2}(4x^2 - x^4)\,dx$(偶関数)

$= \dfrac{3}{16}\left[\dfrac{4x^3}{3} - \dfrac{x^5}{5}\right]_0^{2} = \dfrac{3}{16}\left(\dfrac{32}{3} - \dfrac{32}{5}\right) = \dfrac{3}{16} \cdot \dfrac{64}{15} = \dfrac{4}{5}$

$V(X) = E(X^2) - \{E(X)\}^2 = \dfrac{4}{5} - 0 = \dfrac{4}{5}$

解説

$f(x)$ が偶関数のとき $E(X) = 0$ となることを利用すると計算が楽になります。対称な分布では期待値が対称の中心になります。定数の決定では $\int f(x)\,dx = 1$ の条件を必ず確認しましょう。

▶ 解答を見る