技術をかじる猫

適当に気になった技術や言語、思ったこと考えた事など。

確率の勉強

確率のキーワード周りを勉強してみる。
一般的な概念として分かりやすい例なので、サイコロを例に考えてみる。

試行と事象

とりえる値をランダムに1回抽出することを 試行 という

import numpy as np

dice = np.array([1, 2, 3, 4, 5, 6])  # サイコロの取りえる値 = 標本空間
print(np.random.choice(dice))    # 試行

そして結果としてランダムに一つ出現する。

3

こうした個々の結果を 事象 という。
具体的には個々の結果を 基本事象 といい、発生し得るすべての基本自称を集めた集合(上記だと dice 変数)を 標本空間 という。
この標本空間の一部(1個の場合≒基本事象も含む)を指して言う場合に 事象 という。

事象の計算周り

空集合も事象としてみなすことができ、これを 空事象 という。サイコロでいうと、 7 が出る確率なんて存在しないので、空事象とみなせる。
ある事象を  K (仮に、2, 4, 6 の事象と仮定)したとき、これ以外の取りえる値 (1, 3, 5) を 余事象 といい、  c を使って表す


K = \{ 2, 4, 6 \} \\
K^c = \{ 1, 3, 5 \}

また、二つの事象を


A = \{ 2, 4, 6 \} \\
B = \{ 1, 2, 5, 6 \}

としたとき、 積事象 (両方の事象に含まれる事象)を  A \cap B 和事象 (両方の事象の集合) を  A \cup B と記述する。


A \cap B = \{ 2, 6 \} \\
A \cup B = \{ 1, 2, 4, 5, 6 \}

またそれぞれ発生する確率を次の様に書く(  P は確率で用いる一般的な名称 )


P(X) = \frac{1}{6} 基本事象の発生確率 \\
P( \phi ) = 0  空事象の発生確率 \\
P(A \cap B) = \frac{1}{3} 積事象の発生確率 \\
P(A \cup B) = \frac{5}{6} 和事象の発生確率

条件付確率

はい、高校で理系を選択してれば習う項目です。
事象 A が発生した後に事象 B が発生する確率等、前提の付く確率を 条件付確率 といい


P(B|A) = P_A(B) = \frac{P(A \cup B)}{P(A)}

の様に表し、 P(A) > 0 のときは以下の様にもできる。


P(A \cup B) = P(B | A)P(A)

サイコロを 2 回振って、1回目が偶数(A)が、2回目が 5 以上(B)が出る確率を計算すると


A =\{ 2, 4, 6 \}, B = \{ 5, 6 \} \\
P(A) = \frac{3}{6} \\
P(B) = \frac{2}{6} \\
P(A \cap B) = P(\{ 6 \}) = \frac{1}{6} \\
P(B|A) = \frac{ \frac{1}{6} }{ \frac{3}{6} } = \frac{1}{6} \cdot \frac{6}{3} =  \frac{1}{3}

※ A/B は互いに独立した事象(相互の作用がない事象)なので実は特殊ケース

独立と従属

次の関係を持つ事象 A, B は、互いに独立である(定義)

 P(A|B) = P(A)

B の事象が A の事象に影響を与えていない状況である。
これは ↑ の計算でも同じ事象が起きてる。(↑ の条件付確率の例だと、サイコロを振って 偶数が出る確率は 2 回目にのサイコロで 5 以上が出る確率には影響していない)


P(A \cup B) = P(B | A)P(A)

この式に当てはめると


P(A \cup B) = P(B | A)P(A) = P(B)P(A)

なので、条件付き確率の例でも一致する。
この式が成立しない場合というのは、事象 A、B に何らかの因果関係があるということで、 従属 するという。

従属している場合を考えると、「くじ」を考える。「当たりが2本、ハズレが2本の計4本があり、自分はくじ引きの列の2番目にいる。前の人が当たりを引いた上で、自分もアタリを引く可能性は?」


P(A) = \frac{1}{2} … 前の人が当たりを引く可能性 \\
P(B) = \frac{1}{3} … 自分が当たりを引く可能性 \\
P(A \cap B) = \frac{1}{2} \cdot \frac{1}{3} = \frac{1}{6} … A, B が両方起こる確率 \\
P_A(B) = \frac{ \frac{1}{6} }{ \frac{1}{2} } = \frac{1}{3}

モンティホール問題

3 つのドア A, B, C のうちいずれか 1 つのドアの向こうに賞品が無作為に隠されている。 挑戦者はドアを 1 つだけ開けて、賞品があれば、それをもらうことができる。 挑戦者がドアを選ぶと、司会者は残った 2 つのドアのうちはずれのドアを 1 つ無作為に開ける。 このとき、挑戦者は開けるドアを変更することができる この時、挑戦者は司会者の開けた後にドアを変更すべきか?

条件ごとに考える

挑戦者が先に選ぶドアを A としておく。この時、司会がドアBを開けたとき、Aが当たりである確率を考える。
挑戦者ががドア A を開けた後、司会者がドア B を開ける確率(事象 S)を考えたとき


P(A) = P(B) = P(C) = \frac{1}{3}  ... 挑戦者がドア A を選ぶ確率

で、 A が当たりの場合は、司会者はB/C 両方開けれるので  P(S) = \frac{1}{2} なので


P(A \cap S) = P(A)P_A(S) = \frac{1}{3} \cdot \frac{1}{2} = \frac{1}{6}

B が当たりだった場合は、司会はBが開けられないので


P(B \cap S) = P(B)P_B(S) = \frac{1}{3} \cdot 0 = 0

C が当たりの場合は司会はBを開けるので


P(C \cap S) = P(C)P_C(S) = \frac{1}{3} \cdot 1 = \frac{1}{3}

なので、司会が B のドアを開ける確率は


P(S) = P(A \cap S) + P(B \cap S) + P(C \cap S) = \frac{1}{6} + \frac{1}{3} = \frac{1}{2}

で、求めたいのは「Aが当たりである確率」なので


P_S(A) = \frac{ P(A \cap S) }{ P(S) } = \frac{1}{6} \cdot \frac{2}{1} = \frac{1}{3}

要するに最初に挑戦者が 3 択で一つ選んで、そのまま通したのだから、そりゃ  \frac{1}{3} だよねって話。
では、司会者がドア B を開けたときの、ドア C が当たりである確率は


P_S(B) = \frac{ P(C \cap S) }{ P(S) } = \frac{1}{3} \cdot \frac{2}{1} = \frac{2}{3}

つまり最初に選んだ A よりも、選びなおした方が当たる確率が高くなる。