これまで扱ってきた確率変数は「サイコロの目」や「成功回数」のように、とびとびの値をとる離散型でした。本記事では、身長や時間のように連続的な値をとる確率変数と、その確率を面積で表す確率密度関数を学びます。積分の考え方が登場しますが、基本的なアイデアはシンプルです。
確率変数には大きく分けて2種類あります。
| 離散型 | 連続型 | |
|---|---|---|
| 値のとり方 | とびとびの値($0, 1, 2, \ldots$) | ある区間の任意の実数値 |
| 確率の表し方 | 確率関数 $P(X=k)$ | 確率密度関数 $f(x)$ |
| 確率の計算 | $\sum$(和) | $\int$(積分=面積) |
| 例 | サイコロの目、成功回数 | 身長、体重、時間 |
連続型確率変数では、$P(X = a) = 0$ です(任意の1点の確率はゼロ)。
確率は「ある区間に入る確率」$P(a \leq X \leq b)$ という形で意味を持ち、これをグラフの下の面積(積分)として求めます。
離散型では確率を棒グラフで表しましたが、連続型では滑らかな曲線 $y = f(x)$ を描き、区間 $[a, b]$ における曲線と $x$ 軸の間の面積が確率になります。
✗ $f(a)$ は「$X = a$ となる確率」である
✓ $f(a)$ は確率密度であり、確率そのものではない。確率は面積(積分)で求める
$f(x)$ の値は「確率の密度」であり、$f(x) > 1$ となることもあります。$f(x)$ そのものは確率ではないことに注意しましょう。
連続型確率変数 $X$ に対して、関数 $f(x)$ が次の2条件を満たすとき、$f(x)$ を $X$ の確率密度関数(PDF)という。
条件1:すべての $x$ に対して $f(x) \geq 0$
条件2:$\displaystyle\int_{-\infty}^{\infty} f(x) \, dx = 1$
※ 条件1は「曲線が $x$ 軸より下にならない」、条件2は「全体の面積が $1$」ということ。
確率密度関数を用いると、確率変数 $X$ が区間 $[a, b]$ に入る確率は次のように計算できます。
$$P(a \leq X \leq b) = \int_a^b f(x) \, dx$$
※ 連続型では $P(a \leq X \leq b) = P(a < X < b) = P(a \leq X < b) = P(a < X \leq b)$(端点の確率は $0$ なので等号の有無は影響しない)。
$y = f(x)$ のグラフと $x$ 軸の間の面積の合計は $1$(=100%)です。
区間 $[a, b]$ の部分の面積が $P(a \leq X \leq b)$ に対応します。
全体の面積が $1$ なので、面積がそのまま確率(割合)を表します。
確率密度関数 $f(x)$ を $-\infty$ から $x$ まで積分した関数を累積分布関数(CDF)$F(x)$ といいます。
$$F(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) \, dt$$$F(x)$ は $0$ から $1$ への単調増加関数で、$F'(x) = f(x)$ が成り立ちます。
問題:$f(x) = \begin{cases} 2x & (0 \leq x \leq 1) \\ 0 & (\text{その他}) \end{cases}$ が確率密度関数であることを確認し、$P\left(\dfrac{1}{2} \leq X \leq 1\right)$ を求めよ。
解:
条件1の確認:$0 \leq x \leq 1$ のとき $f(x) = 2x \geq 0$。その他のとき $f(x) = 0$。よって常に $f(x) \geq 0$。
条件2の確認:
$$\int_{-\infty}^{\infty} f(x) \, dx = \int_0^1 2x \, dx = \left[x^2\right]_0^1 = 1$$
よって $f(x)$ は確率密度関数である。
確率の計算:
$$P\left(\frac{1}{2} \leq X \leq 1\right) = \int_{1/2}^{1} 2x \, dx = \left[x^2\right]_{1/2}^{1} = 1 - \frac{1}{4} = \frac{3}{4}$$
問題:$f(x) = \begin{cases} ax(1-x) & (0 \leq x \leq 1) \\ 0 & (\text{その他}) \end{cases}$ が確率密度関数となるように定数 $a$ の値を求めよ。
解:条件2より:
$$\int_0^1 ax(1-x) \, dx = a \int_0^1 (x - x^2) \, dx = a \left[\frac{x^2}{2} - \frac{x^3}{3}\right]_0^1 = a \cdot \frac{1}{6} = 1$$
よって $a = 6$。
条件1の確認:$0 \leq x \leq 1$ のとき $f(x) = 6x(1-x) \geq 0$。条件を満たす。
問題:$f(x) = \begin{cases} e^{-x} & (x \geq 0) \\ 0 & (x < 0) \end{cases}$ が確率密度関数であることを確認せよ。
解:
条件1:$x \geq 0$ のとき $e^{-x} > 0$。$x < 0$ のとき $f(x) = 0$。よって $f(x) \geq 0$。
条件2:
$$\int_0^{\infty} e^{-x} \, dx = \left[-e^{-x}\right]_0^{\infty} = 0 - (-1) = 1$$
よって確率密度関数である。(これを指数分布という。)
✗ 確率密度関数は $0 \leq f(x) \leq 1$ を満たす
✓ $f(x) \geq 0$ であればよく、$f(x) > 1$ でもよい。例えば $f(x) = 2x$($0 \leq x \leq 1$)では $f(1) = 2 > 1$
確率の条件は「面積が $1$」であり、高さの上限はありません。
離散型の場合、期待値は $\sum x_k P(X = x_k)$ でしたが、連続型では和($\sum$)を積分($\int$)に置き換えます。
期待値:
$$E(X) = \int_{-\infty}^{\infty} x f(x) \, dx$$
分散:
$$V(X) = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) \, dx = E(X^2) - \{E(X)\}^2$$
ただし $\mu = E(X)$、$E(X^2) = \displaystyle\int_{-\infty}^{\infty} x^2 f(x) \, dx$
期待値:
$$E(X) = \int_0^1 x \cdot 2x \, dx = 2\int_0^1 x^2 \, dx = 2 \cdot \frac{1}{3} = \frac{2}{3}$$
$E(X^2)$ の計算:
$$E(X^2) = \int_0^1 x^2 \cdot 2x \, dx = 2\int_0^1 x^3 \, dx = 2 \cdot \frac{1}{4} = \frac{1}{2}$$
分散:
$$V(X) = E(X^2) - \{E(X)\}^2 = \frac{1}{2} - \left(\frac{2}{3}\right)^2 = \frac{1}{2} - \frac{4}{9} = \frac{1}{18}$$
標準偏差:
$$\sigma(X) = \sqrt{\frac{1}{18}} = \frac{1}{3\sqrt{2}} = \frac{\sqrt{2}}{6}$$
離散型と連続型の公式は、$\sum \leftrightarrow \int$、$P(X=x_k) \leftrightarrow f(x)dx$ と置き換えるだけです。
離散型:$E(X) = \sum x_k P(X = x_k)$ → 連続型:$E(X) = \int x f(x) \, dx$
離散型:$V(X) = \sum (x_k - \mu)^2 P(X = x_k)$ → 連続型:$V(X) = \int (x - \mu)^2 f(x) \, dx$
最もシンプルな連続型分布が一様分布(uniform distribution)です。区間 $[a, b]$ のすべての値が等しい確率密度を持ちます。
確率密度関数:
$$f(x) = \begin{cases} \dfrac{1}{b-a} & (a \leq x \leq b) \\ 0 & (\text{その他}) \end{cases}$$
期待値:$E(X) = \dfrac{a+b}{2}$
分散:$V(X) = \dfrac{(b-a)^2}{12}$
確率密度関数の確認:$f(x) = \dfrac{1}{b-a} > 0$ であり、
$$\int_a^b \frac{1}{b-a} \, dx = \frac{b-a}{b-a} = 1$$
期待値:
$$E(X) = \int_a^b x \cdot \frac{1}{b-a} \, dx = \frac{1}{b-a} \left[\frac{x^2}{2}\right]_a^b = \frac{b^2 - a^2}{2(b-a)} = \frac{a+b}{2}$$
$E(X^2)$:
$$E(X^2) = \frac{1}{b-a} \int_a^b x^2 \, dx = \frac{1}{b-a} \cdot \frac{b^3 - a^3}{3} = \frac{a^2 + ab + b^2}{3}$$
分散:
$$V(X) = E(X^2) - \{E(X)\}^2 = \frac{a^2 + ab + b^2}{3} - \frac{(a+b)^2}{4} = \frac{(b-a)^2}{12}$$
例:バスが $10$ 分間隔で運行しているとき、バス停に着いてからの待ち時間 $X$ は $U(0, 10)$ に近い分布をとります。
$E(X) = \dfrac{0+10}{2} = 5$(分)、$V(X) = \dfrac{100}{12} = \dfrac{25}{3}$
平均 $5$ 分待つことになり、これは直感とも合います。
✗ $P(X = 5)$ を $f(5) = \dfrac{1}{10}$ と答える
✓ $P(X = 5) = 0$。連続型では1点の確率は常に $0$。$P(4 \leq X \leq 6) = \dfrac{2}{10} = \dfrac{1}{5}$
Q1. 確率密度関数が満たすべき2つの条件を述べよ。
Q2. 連続型確率変数で $P(X = a) = 0$ となる理由を簡潔に説明せよ。
Q3. $f(x) = 3x^2$($0 \leq x \leq 1$)のとき $P(0 \leq X \leq 1/2)$ を求めよ。
Q4. 一様分布 $U(2, 8)$ の期待値と分散を求めよ。
Q5. $f(x) = cx$($0 \leq x \leq 2$)が確率密度関数となるような $c$ の値を求めよ。
$f(x) = \begin{cases} a(1-x^2) & (0 \leq x \leq 1) \\ 0 & (\text{その他}) \end{cases}$ が確率密度関数となるように $a$ を定め、$P\left(0 \leq X \leq \dfrac{1}{2}\right)$ を求めよ。
$\displaystyle\int_0^1 a(1-x^2)\,dx = a\left[x - \frac{x^3}{3}\right]_0^1 = a \cdot \frac{2}{3} = 1$ より $a = \dfrac{3}{2}$。
$P\left(0 \leq X \leq \dfrac{1}{2}\right) = \dfrac{3}{2}\displaystyle\int_0^{1/2}(1-x^2)\,dx = \dfrac{3}{2}\left[\,x - \frac{x^3}{3}\,\right]_0^{1/2}$
$= \dfrac{3}{2}\left(\dfrac{1}{2} - \dfrac{1}{24}\right) = \dfrac{3}{2} \cdot \dfrac{11}{24} = \dfrac{11}{16}$
確率密度関数 $f(x) = \begin{cases} 6x(1-x) & (0 \leq x \leq 1) \\ 0 & (\text{その他}) \end{cases}$ について、$E(X)$ と $V(X)$ を求めよ。
$E(X) = \displaystyle\int_0^1 x \cdot 6x(1-x)\,dx = 6\int_0^1 (x^2 - x^3)\,dx = 6\left[\frac{x^3}{3} - \frac{x^4}{4}\right]_0^1 = 6 \cdot \frac{1}{12} = \frac{1}{2}$
$E(X^2) = \displaystyle\int_0^1 x^2 \cdot 6x(1-x)\,dx = 6\int_0^1 (x^3 - x^4)\,dx = 6\left[\frac{x^4}{4} - \frac{x^5}{5}\right]_0^1 = 6 \cdot \frac{1}{20} = \frac{3}{10}$
$V(X) = \dfrac{3}{10} - \left(\dfrac{1}{2}\right)^2 = \dfrac{3}{10} - \dfrac{1}{4} = \dfrac{1}{20}$
$[0, 1]$ 上の一様分布に従う確率変数 $X$ に対して、$Y = 3X + 2$ とおく。$E(Y)$、$V(Y)$、$\sigma(Y)$ を求めよ。
$X \sim U(0, 1)$ より $E(X) = \dfrac{1}{2}$、$V(X) = \dfrac{1}{12}$
$E(Y) = E(3X + 2) = 3E(X) + 2 = 3 \cdot \dfrac{1}{2} + 2 = \dfrac{7}{2}$
$V(Y) = V(3X + 2) = 9V(X) = 9 \cdot \dfrac{1}{12} = \dfrac{3}{4}$
$\sigma(Y) = \sqrt{\dfrac{3}{4}} = \dfrac{\sqrt{3}}{2}$
$Y = aX + b$ のとき $E(Y) = aE(X) + b$、$V(Y) = a^2 V(X)$ です。定数 $b$ は分散に影響を与えないことに注意しましょう。
確率密度関数が $f(x) = \begin{cases} \dfrac{3}{32}(4-x^2) & (-2 \leq x \leq 2) \\ 0 & (\text{その他}) \end{cases}$ で与えられるとき:
(1) $P(-1 \leq X \leq 1)$ を求めよ。
(2) $E(X)$ を求めよ。
(3) $V(X)$ を求めよ。
まず $f(x)$ が確率密度関数であることを確認する。$-2 \leq x \leq 2$ で $4 - x^2 \geq 0$ だから $f(x) \geq 0$。
$\displaystyle\int_{-2}^{2}\frac{3}{32}(4-x^2)\,dx = \frac{3}{32}\left[4x - \frac{x^3}{3}\right]_{-2}^{2} = \frac{3}{32} \cdot \frac{32}{3} = 1$ ✓
(1) $P(-1 \leq X \leq 1) = \dfrac{3}{32}\displaystyle\int_{-1}^{1}(4-x^2)\,dx = \dfrac{3}{32}\left[4x - \frac{x^3}{3}\right]_{-1}^{1}$
$= \dfrac{3}{32}\left[\left(4 - \frac{1}{3}\right) - \left(-4 + \frac{1}{3}\right)\right] = \dfrac{3}{32} \cdot \dfrac{22}{3} = \dfrac{22}{32} = \dfrac{11}{16}$
(2) $f(x)$ は偶関数($f(-x) = f(x)$)であるから $xf(x)$ は奇関数。
$$E(X) = \int_{-2}^{2} xf(x)\,dx = 0$$
(3) $E(X^2) = \dfrac{3}{32}\displaystyle\int_{-2}^{2}x^2(4-x^2)\,dx = \dfrac{3}{32} \cdot 2\int_0^{2}(4x^2 - x^4)\,dx$(偶関数)
$= \dfrac{3}{16}\left[\dfrac{4x^3}{3} - \dfrac{x^5}{5}\right]_0^{2} = \dfrac{3}{16}\left(\dfrac{32}{3} - \dfrac{32}{5}\right) = \dfrac{3}{16} \cdot \dfrac{64}{15} = \dfrac{4}{5}$
$V(X) = E(X^2) - \{E(X)\}^2 = \dfrac{4}{5} - 0 = \dfrac{4}{5}$
$f(x)$ が偶関数のとき $E(X) = 0$ となることを利用すると計算が楽になります。対称な分布では期待値が対称の中心になります。定数の決定では $\int f(x)\,dx = 1$ の条件を必ず確認しましょう。