ベイズ統計とは？ベイズの定理を12ステップ導出＆具体例で直感的に理解する

1. そもそもベイズ統計とは？
2. 基本となる「ベイズの定理」
3. なぜこの式になるの？完全導出12ステップ
4. 体験！ベイズの定理シミュレーター
5. 応用編：複数人の「一致した意見」はどれだけ強い証拠か？
1. 【問題設定】
  1. Step 1 & 2: 尤度の掛け算
  2. Step 3: ベイズの定理に当てはめる
6. 現代社会での強力な活用事例

1. そもそもベイズ統計とは？

私たちが学校で習う一般的な統計学（頻度論）は、「サイコロを振って1が出る確率は常に1/6である」というような「客観的な確率」を扱います。
一方、ベイズ統計学は「主観的な確率」を扱います。「おそらくこうだろう」という最初の推測（信念）を持ち、新しいデータが得られるたびに、その推測をどんどん柔軟に修正していくのが最大の特徴です。

特徴	ベイズ統計学（ベイズ派）	従来の統計学（頻度派）
確率の捉え方	主観確率（信念の度合い）	客観確率（無限回繰り返した時の頻度）
アプローチ	データが手に入るたびに確率を更新する	集めたデータから真の値を1つ特定する
少ないデータ	事前知識を活用して推論可能！	データが少ないと正確な推論が難しい

2. 基本となる「ベイズの定理」

ベイズ統計の根幹を成すのが、18世紀のイギリスの牧師トーマス・ベイズによって発見された「ベイズの定理」です。数式にすると難しく見えますが、意味を理解すれば非常にシンプルです。

$$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$$

※事象Bが起きたという条件のもとで、事象Aが起こる確率を求める式

① 事前確率 $P(A)$

データ（結果B）を観測する前に持っていた、事象Aが起こる確率。「元々の思い込み」や「過去の実績」にあたります。

② 尤度（ゆうど） $P(B|A)$

もし事象Aが事実だとしたら、今回得られたデータ（結果B）がどれくらい観測されやすいかを示す確率です。

③ 事後確率 $P(A|B)$

データ（結果B）を観測した後の、事象Aが起こる確率。これが一番知りたい「更新された新しい確率」です。

④ 周辺尤度 $P(B)$

事象Aが起きる・起きないに関わらず、データ（結果B）が観測される全体の確率。事後確率を調整するための分母です。

3. なぜこの式になるの？完全導出12ステップ

いきなり公式を見せられても納得できないかもしれません。しかし、ベイズの定理は決して魔法ではなく、高校数学で習う「条件付き確率」の基本ルールをパズルのように変形しただけの非常に論理的な数式です。

【第1部】確率の基礎と「条件付き確率」

すべての始まり「事象の確率」

ある事象Aが起こる確率を $P(A)$、事象Bが起こる確率を $P(B)$ と定義します。全体の「世界」の中でその事象が占める面積（割合）だと考えてください。

2つが同時に起きる「同時確率」

事象Aと事象Bが両方とも起こる確率を、同時確率 $P(A \cap B)$ と呼びます。「AかつB」の確率です。

$$P(A \cap B) = P(A \text{ かつ } B)$$

世界を絞り込む「条件付き確率」

「すでに事象Bが起きた」という情報が入ったとします。考えるべき「世界全体」はBの枠内に絞られます。この限られた世界の中で、さらに事象Aが起きている確率を、条件付き確率 $P(A|B)$ と呼びます。

条件付き確率の公式化

Step 3の概念を数式にします。「Bという世界」の中で「AとBが両方起きている部分」が占める割合なので、割り算を使います。

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

【第2部】視点の逆転と式の「等置」

式の変形（乗法定理その1）

Step 4の式の両辺に $P(B)$ を掛け算して分母を払います。これにより、同時確率 $P(A \cap B)$ を別の形で表現できます。

$$P(A \cap B) = P(A|B)P(B)$$

視点をA側から逆転させる

今度は逆に、「すでに事象Aが起きた」という前提からスタートします。Aが起きたという条件下でBが起きる確率は同様にこう書けます。

$$P(B|A) = \frac{P(A \cap B)}{P(A)}$$

式の変形（乗法定理その2）

Step 6の式の両辺に $P(A)$ を掛けて解きます。

$$P(A \cap B) = P(B|A)P(A)$$

2つのルートを繋ぐ架け橋

Step 5とStep 7の左辺はどちらも同じ $P(A \cap B)$ です。つまり右辺同士も等しいことになります。

$$P(A|B)P(B) = P(B|A)P(A)$$

ついに誕生！ベイズの定理（基本形）

私たちが最終的に知りたいのは事後確率 $P(A|B)$ です。Step 8の両辺を $P(B)$ で割ることで、目的の式が導出されます。

$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$

【第3部】実践で使える形への進化（全確率の定理）

実践の壁「分母 $P(B)$ の正体」

実社会の問題では、分母の周辺尤度 $P(B)$（陽性になる全体の確率など）が直接与えられていないことがよくあります。

事象Bを2つのルートに分解する

そこで、Bが起こるケースを網羅的に2つに分けます。
① Aが起きて、かつBが起きるルート：$P(A \cap B)$
② Aが起きない（$\neg A$）で、かつBが起きるルート：$P(\neg A \cap B)$
この2つを足せば全体の $P(B)$ になります（全確率の定理）。

$$P(B) = P(A \cap B) + P(\neg A \cap B)$$

ベイズの定理（展開形・実用形）の完成

Step 11の2要素を乗法定理を使って書き換えます。
$P(A \cap B) \rightarrow P(B|A)P(A)$
$P(\neg A \cap B) \rightarrow P(B | \neg A)P(\neg A)$
これをStep 9の分母に代入すれば、現場で使われる実用的なベイズの定理が完成します。

$$P(A|B) = \frac{P(B|A)P(A)}{P(B|A)P(A) + P(B | \neg A)P(\neg A)}$$

「事前確率」「尤度」「偽陽性率」の3つだけで事後確率を計算できます！

4. 体験！ベイズの定理シミュレーター

インタラクティブ

有名な「病気の検査問題」でベイズ更新を体験してみましょう。展開版（Step 12）の式が裏側で動いています。
「精度90%の検査で陽性が出た！自分は90%の確率で病気だ！」…果たして本当にそうでしょうか？

① 事前確率 $P(A)$

病気に罹患している人の一般的な割合

0.1%

② 検査の感度 (尤度) $P(B|A)$

実際に病気の人を正しく「陽性」と判定する確率

90.0%

③ 偽陽性率 $P(B|\neg A)$

健康な人なのに誤って「陽性」と判定する確率

5.0%

陽性と判定されたとき、本当に病気である確率（事後確率）

1.77%

💡 なぜ直感（90%）とこんなに違うの？

5. 応用編：複数人の「一致した意見」はどれだけ強い証拠か？

ベイズ推定が最も真価を発揮するシナリオの一つが、「複数の独立した情報を組み合わせる」場合です。正解率が異なる5人が全員「これが正解だ！」と意見を一致させた場合を計算します。

【問題設定】

全体の状況： その選択肢が「正解」である確率は 80%
5人の判定者： A〜Eは互いに相談せず独立して判定する
各自の正答能力： Aは80%、Bは70%、Cは70%、Dは70%、Eは80%
発生した事象： 「5人全員が『正解だ』と判断した」

Step 1 & 2: 尤度の掛け算

① 本当に「正解」だった場合、5人全員が見抜く確率
$$P(\text{全員一致}|\text{正解}) = 0.8 \times 0.7 \times 0.7 \times 0.7 \times 0.8 = \mathbf{0.21952}$$

② 本当は「不正解」なのに、5人全員が間違える確率
$$P(\text{全員一致}|\text{不正解}) = 0.2 \times 0.3 \times 0.3 \times 0.3 \times 0.2 = \mathbf{0.00108}$$

Step 3: ベイズの定理に当てはめる

$$P(\text{正解}|\text{全員一致}) = \frac{0.21952 \times 0.8}{(0.21952 \times 0.8) + (0.00108 \times 0.2)}$$
$$= \frac{0.175616}{0.175832} \approx \mathbf{0.99877}$$

【結論】

事後確率は約 99.88%

💡 集合知の魔法：
個々の正答率は70%〜80%と「時々間違える」レベルですが、独立した5人の意見が一致したという事象は強烈な証拠です。全員が偶然同じように間違える確率が極めて低いため、元の80%からほぼ100%にまで確固たるものにアップデートされました。

6. 現代社会での強力な活用事例

新しいデータを取り込みながら学習していく「ベイズ統計」は、ビッグデータや機械学習と非常に相性が良く、私たちの身の回りのあらゆるテクノロジーに組み込まれています。

迷惑メールフィルター

「無料」などの単語が含まれている確率（尤度）から、そのメールが迷惑メールである確率（事後確率）を算出します。

A/Bテスト

少ないデータでも「現時点でデザインAが勝っている確率」を柔軟に評価でき、素早い意思決定が可能です。

検索アルゴリズム

曖昧なキーワードから、過去の検索履歴（事前知識）と照らし合わせて「探している情報」を確率的に推測します。

自動運転

ノイズだらけのセンサー情報をもとに、瞬時にベイズ更新して周囲の状況を確率的に推測し、安全な行動を選択します。

たび友	ぴー友
クリプ友	パス友
サイトマップ	お問い合わせ

1. そもそもベイズ統計とは？

2. 基本となる「ベイズの定理」

① 事前確率 $P(A)$

② 尤度（ゆうど） $P(B|A)$

③ 事後確率 $P(A|B)$

④ 周辺尤度 $P(B)$

3. なぜこの式になるの？ 完全導出12ステップ

すべての始まり「事象の確率」

2つが同時に起きる「同時確率」

世界を絞り込む「条件付き確率」

条件付き確率の公式化

式の変形（乗法定理 その1）

視点をA側から逆転させる

式の変形（乗法定理 その2）

2つのルートを繋ぐ架け橋

ついに誕生！ベイズの定理（基本形）

実践の壁「分母 $P(B)$ の正体」

事象Bを2つのルートに分解する

ベイズの定理（展開形・実用形）の完成

4. 体験！ベイズの定理シミュレーター

5. 応用編：複数人の「一致した意見」はどれだけ強い証拠か？

【問題設定】

Step 1 & 2: 尤度の掛け算

Step 3: ベイズの定理に当てはめる

6. 現代社会での強力な活用事例

迷惑メールフィルター

A/Bテスト

検索アルゴリズム

自動運転

3. なぜこの式になるの？完全導出12ステップ

式の変形（乗法定理その1）

式の変形（乗法定理その2）