確率の勉強
確率のキーワード周りを勉強してみる。
一般的な概念として分かりやすい例なので、サイコロを例に考えてみる。
試行と事象
とりえる値をランダムに1回抽出することを 試行 という
import numpy as np dice = np.array([1, 2, 3, 4, 5, 6]) # サイコロの取りえる値 = 標本空間 print(np.random.choice(dice)) # 試行
そして結果としてランダムに一つ出現する。
3
こうした個々の結果を 事象 という。
具体的には個々の結果を 基本事象 といい、発生し得るすべての基本自称を集めた集合(上記だと dice
変数)を 標本空間 という。
この標本空間の一部(1個の場合≒基本事象も含む)を指して言う場合に 事象 という。
事象の計算周り
空集合も事象としてみなすことができ、これを 空事象 という。サイコロでいうと、 7 が出る確率なんて存在しないので、空事象とみなせる。
ある事象を
(仮に、2, 4, 6 の事象と仮定)したとき、これ以外の取りえる値 (1, 3, 5) を 余事象 といい、
を使って表す
また、二つの事象を
としたとき、 積事象 (両方の事象に含まれる事象)を 、和事象 (両方の事象の集合) を と記述する。
またそれぞれ発生する確率を次の様に書く( は確率で用いる一般的な名称 )
条件付確率
はい、高校で理系を選択してれば習う項目です。
事象 A が発生した後に事象 B が発生する確率等、前提の付く確率を 条件付確率 といい
の様に表し、 のときは以下の様にもできる。
サイコロを 2 回振って、1回目が偶数(A)が、2回目が 5 以上(B)が出る確率を計算すると
※ A/B は互いに独立した事象(相互の作用がない事象)なので実は特殊ケース
独立と従属
次の関係を持つ事象 A, B は、互いに独立である(定義)
B の事象が A の事象に影響を与えていない状況である。
これは ↑ の計算でも同じ事象が起きてる。(↑ の条件付確率の例だと、サイコロを振って 偶数が出る確率は 2 回目にのサイコロで 5 以上が出る確率には影響していない)
この式に当てはめると
なので、条件付き確率の例でも一致する。
この式が成立しない場合というのは、事象 A、B に何らかの因果関係があるということで、 従属 するという。
従属している場合を考えると、「くじ」を考える。「当たりが2本、ハズレが2本の計4本があり、自分はくじ引きの列の2番目にいる。前の人が当たりを引いた上で、自分もアタリを引く可能性は?」
モンティホール問題
3 つのドア A, B, C のうちいずれか 1 つのドアの向こうに賞品が無作為に隠されている。 挑戦者はドアを 1 つだけ開けて、賞品があれば、それをもらうことができる。 挑戦者がドアを選ぶと、司会者は残った 2 つのドアのうちはずれのドアを 1 つ無作為に開ける。 このとき、挑戦者は開けるドアを変更することができる この時、挑戦者は司会者の開けた後にドアを変更すべきか?
条件ごとに考える
挑戦者が先に選ぶドアを A としておく。この時、司会がドアBを開けたとき、Aが当たりである確率を考える。
挑戦者ががドア A を開けた後、司会者がドア B を開ける確率(事象 S)を考えたとき
で、 A が当たりの場合は、司会者はB/C 両方開けれるので なので
B が当たりだった場合は、司会はBが開けられないので
C が当たりの場合は司会はBを開けるので
なので、司会が B のドアを開ける確率は
で、求めたいのは「Aが当たりである確率」なので
要するに最初に挑戦者が 3 択で一つ選んで、そのまま通したのだから、そりゃ だよねって話。
では、司会者がドア B を開けたときの、ドア C が当たりである確率は
つまり最初に選んだ A よりも、選びなおした方が当たる確率が高くなる。