技術をかじる猫

適当に気になった技術や言語、思ったこと考えた事など。

確率周りの勉強続き

確率変数が複数あるときの確率分布

white-azalea.hatenablog.jp

これの続き

同時確率分布

ある薬の治験に 40 人が集まり各データ

A型 B型 O型 AB型 合計
男性 10 4 4 2 20
女性 8 2 8 2 20

で発生確率は人数的に確率はこんな感じ

A型 B型 O型 AB型 合計
男性 0.25 0.1 0.1 0.05 0.5
女性 0.2 0.05 0.2 0.05 0.5
0.45 0.15 0.3 0.1 1

で、血液型 X 性別 Y としたときにそれぞれが特定の値を取るときの確率を表したものを「同時確率分布」と言う。 血液型が  x_i , 性別が  y_j を取るときの確率を表す関数を同時確率関数という。


P(X=x_i, Y=y_j) = p_{X,Y} (x_i, y_j)

例えば、A 型かつ男性  P(X=x_1, Y=y_1) = 0.25 と取得できる。
また、  x_i の時(または  y_j )固定の時の確率分布を「周辺確率分布」といい


p_x(x_i) = \sum_j P(X=x_i, Y=y_j) = P(X=x_i)

てな感じで周辺確率関数を定義できる。
仮に、A型と割り切って(  x_i )  \sum_j P(X=x_i, Y=y_j) を考えると、 Y は性別なので、男性女性の合計なので、合計確率 0.45 と。

条件付き確率関数

 X = x_i を与えたときの  Y = y_i である確率(条件付き確率関数)を


P_{Y|X} (y_j | x_i) = P(Y=y_j | X=x_i) = \frac{P_{X,Y} (x_i, y_j)}{ p_x (x_i) }

と記述する。

条件付き期待値

前述の条件付き確率関数に、期待値を取ったもの。
 X=x_i を与えたときの Y の 条件付き期待値


E[Y|X=x_i] = \sum^{\infty}_{j=1} y_j p_{Y|X} (y_j | x_i) \\
= \frac{ \sum^\infty_{j=1}y_j p_{X,Y} (x_i, y_j) }{ p_x(x_i) }

と記述する。