1. そもそもベイズ統計とは?
私たちが学校で習う一般的な統計学(頻度論)は、「サイコロを振って1が出る確率は常に1/6である」というような「客観的な確率」を扱います。
一方、ベイズ統計学は「主観的な確率」を扱います。「おそらくこうだろう」という最初の推測(信念)を持ち、新しいデータが得られるたびに、その推測をどんどん柔軟に修正していくのが最大の特徴です。
| 特徴 | ベイズ統計学(ベイズ派) | 従来の統計学(頻度派) |
|---|---|---|
| 確率の捉え方 | 主観確率(信念の度合い) | 客観確率(無限回繰り返した時の頻度) |
| アプローチ | データが手に入るたびに確率を更新する | 集めたデータから真の値を1つ特定する |
| 少ないデータ | 事前知識を活用して推論可能! | データが少ないと正確な推論が難しい |
2. 基本となる「ベイズの定理」
ベイズ統計の根幹を成すのが、18世紀のイギリスの牧師トーマス・ベイズによって発見された「ベイズの定理」です。数式にすると難しく見えますが、意味を理解すれば非常にシンプルです。
① 事前確率 $P(A)$
データ(結果B)を観測する前に持っていた、事象Aが起こる確率。「元々の思い込み」や「過去の実績」にあたります。
② 尤度(ゆうど) $P(B|A)$
もし事象Aが事実だとしたら、今回得られたデータ(結果B)がどれくらい観測されやすいかを示す確率です。
③ 事後確率 $P(A|B)$
データ(結果B)を観測した後の、事象Aが起こる確率。これが一番知りたい「更新された新しい確率」です。
④ 周辺尤度 $P(B)$
事象Aが起きる・起きないに関わらず、データ(結果B)が観測される全体の確率。事後確率を調整するための分母です。
3. なぜこの式になるの? 完全導出12ステップ
いきなり公式を見せられても納得できないかもしれません。しかし、ベイズの定理は決して魔法ではなく、高校数学で習う「条件付き確率」の基本ルールをパズルのように変形しただけの非常に論理的な数式です。
すべての始まり「事象の確率」
ある事象Aが起こる確率を $P(A)$、事象Bが起こる確率を $P(B)$ と定義します。全体の「世界」の中でその事象が占める面積(割合)だと考えてください。
2つが同時に起きる「同時確率」
事象Aと事象Bが両方とも起こる確率を、同時確率 $P(A \cap B)$ と呼びます。「AかつB」の確率です。
世界を絞り込む「条件付き確率」
「すでに事象Bが起きた」という情報が入ったとします。考えるべき「世界全体」はBの枠内に絞られます。この限られた世界の中で、さらに事象Aが起きている確率を、条件付き確率 $P(A|B)$ と呼びます。
条件付き確率の公式化
Step 3の概念を数式にします。「Bという世界」の中で「AとBが両方起きている部分」が占める割合なので、割り算を使います。
式の変形(乗法定理 その1)
Step 4の式の両辺に $P(B)$ を掛け算して分母を払います。これにより、同時確率 $P(A \cap B)$ を別の形で表現できます。
視点をA側から逆転させる
今度は逆に、「すでに事象Aが起きた」という前提からスタートします。Aが起きたという条件下でBが起きる確率は同様にこう書けます。
式の変形(乗法定理 その2)
Step 6の式の両辺に $P(A)$ を掛けて解きます。
2つのルートを繋ぐ架け橋
Step 5とStep 7の左辺はどちらも同じ $P(A \cap B)$ です。つまり右辺同士も等しいことになります。
ついに誕生!ベイズの定理(基本形)
私たちが最終的に知りたいのは事後確率 $P(A|B)$ です。Step 8の両辺を $P(B)$ で割ることで、目的の式が導出されます。
実践の壁「分母 $P(B)$ の正体」
実社会の問題では、分母の周辺尤度 $P(B)$(陽性になる全体の確率など)が直接与えられていないことがよくあります。
事象Bを2つのルートに分解する
そこで、Bが起こるケースを網羅的に2つに分けます。
① Aが起きて、かつBが起きるルート:$P(A \cap B)$
② Aが起きない($\neg A$)で、かつBが起きるルート:$P(\neg A \cap B)$
この2つを足せば全体の $P(B)$ になります(全確率の定理)。
ベイズの定理(展開形・実用形)の完成
Step 11の2要素を乗法定理を使って書き換えます。
$P(A \cap B) \rightarrow P(B|A)P(A)$
$P(\neg A \cap B) \rightarrow P(B | \neg A)P(\neg A)$
これをStep 9の分母に代入すれば、現場で使われる実用的なベイズの定理が完成します。
4. 体験!ベイズの定理シミュレーター
有名な「病気の検査問題」でベイズ更新を体験してみましょう。展開版(Step 12)の式が裏側で動いています。
「精度90%の検査で陽性が出た!自分は90%の確率で病気だ!」…果たして本当にそうでしょうか?
5. 応用編:複数人の「一致した意見」はどれだけ強い証拠か?
ベイズ推定が最も真価を発揮するシナリオの一つが、「複数の独立した情報を組み合わせる」場合です。正解率が異なる5人が全員「これが正解だ!」と意見を一致させた場合を計算します。
【問題設定】
- 全体の状況: その選択肢が「正解」である確率は 80%
- 5人の判定者: A〜Eは互いに相談せず独立して判定する
- 各自の正答能力: Aは80%、Bは70%、Cは70%、Dは70%、Eは80%
- 発生した事象: 「5人全員が『正解だ』と判断した」
Step 1 & 2: 尤度の掛け算
$$P(\text{全員一致}|\text{正解}) = 0.8 \times 0.7 \times 0.7 \times 0.7 \times 0.8 = \mathbf{0.21952}$$
$$P(\text{全員一致}|\text{不正解}) = 0.2 \times 0.3 \times 0.3 \times 0.3 \times 0.2 = \mathbf{0.00108}$$
Step 3: ベイズの定理に当てはめる
$$= \frac{0.175616}{0.175832} \approx \mathbf{0.99877}$$
個々の正答率は70%〜80%と「時々間違える」レベルですが、独立した5人の意見が一致したという事象は強烈な証拠です。全員が偶然同じように間違える確率が極めて低いため、元の80%からほぼ100%にまで確固たるものにアップデートされました。
6. 現代社会での強力な活用事例
新しいデータを取り込みながら学習していく「ベイズ統計」は、ビッグデータや機械学習と非常に相性が良く、私たちの身の回りのあらゆるテクノロジーに組み込まれています。
迷惑メールフィルター
「無料」などの単語が含まれている確率(尤度)から、そのメールが迷惑メールである確率(事後確率)を算出します。
A/Bテスト
少ないデータでも「現時点でデザインAが勝っている確率」を柔軟に評価でき、素早い意思決定が可能です。
検索アルゴリズム
曖昧なキーワードから、過去の検索履歴(事前知識)と照らし合わせて「探している情報」を確率的に推測します。
自動運転
ノイズだらけのセンサー情報をもとに、瞬時にベイズ更新して周囲の状況を確率的に推測し、安全な行動を選択します。

