機器學習筆記(二) | 貝氏推論機器學習

機器學習筆記(二) - 機率、貝氏定理 ... 貝氏定理(Bayes' theorem) ... 另一個就是先驗機率,也就是在看過資料之前,你對你要推論的東西知道多少。

跳到主要內容機器學習筆記(二)-機率、貝氏定理取得連結FacebookTwitterPinterest以電子郵件傳送其他應用程式3月20,2018機率(probability)機率是人類基於不確定性的描述,對於已經發生或確定的事情,我們一般會說機率為1;對於不太可能發生的事,我們會說發生機率接近於0,以上這段描述說明了機率的上界與下界。

接下來以投擲硬幣為例,列出在機率會用到的相關名詞定義:試驗(trail):投擲一次硬幣。

試驗結果(outcome):投擲硬幣的結果(正面、反面)。

樣本空間(samplespace):所有試驗結果所產生的集合\(\mathrm{U}=\{\H,\T\\}\)。

事件(event):符合設定條件的樣本空間子集合。

隨機變數(randomvariable):將樣本空間的元素對應到實數的對應函數。

機率密度函數(probabilitydensityfunction,PDF):\((x,y):y=\mathrm{P}(X=x)\),其中\(X\)為一連續型隨機變數(continuousrandomvariable)。

機率質量函數(probabilitymassfunction,PMF):\((x,y):y=\mathrm{P}(X=x)\),其中\(X\)為一離散型隨機變數(discreterandomvariable)。

累積分布函數(cumulativedistributionfunction,CDF):\(F_X(x)=\mathrm{P}\{X\leqx\}.\)。

蒙特霍問題(MontyHallproblem)蒙特霍問題又稱三門問題,是一個源自博弈論的數學遊戲問題,大致出自美國的電視遊戲節目Let'sMakeaDeal,問題的名字來自該節目的主持人蒙蒂·霍爾,該問題的修正描述如下:參賽者在三扇門中挑選一扇。

他並不知道內裏有甚麼。

主持人知道每扇門後面有什麼。

主持人必須開啓剩下的其中一扇門,並且必須提供換門的機會。

主持人永遠都會挑一扇有山羊的門。

如果參賽者挑了一扇有山羊的門,主持人必須挑另一扇有山羊的門。

如果參賽者挑了一扇有汽車的門,主持人隨機(機率均勻分布)在另外兩扇門中挑一扇有山羊的門。

參賽者會被問是否保持他的原來選擇,還是轉而選擇剩下的那一道門。

節錄自維基百科要解決這個問題可以先假設選的門是固定的(在不知道門後面是什麼情情況下,選任何一個門都是等價的),接著分兩部分討論:不換門:因為決定不換門,主持人告知一扇有山羊的門並不影響結果,因此是\(\frac{1}{3}\)。

換門:這邊需要考慮兩個狀況:第一次選到車子的門:此情況的機率為\(\frac{1}{3}\),剩下的兩扇門都為山羊,主持人隨機開啟其中一扇門,最後必留下山羊的門被參賽者選中,勝利的機率為0。

第一次選到山羊的門:此情況的機率為\(\frac{2}{3}\),剩下的門一扇為山羊、一扇為車子,主持人打開後面為山羊的門,最後必留下後面為車子的門,勝利的機率為\(1\)。

由上面的討論可以得知:不換門選到車子的機率為\(\frac{1}{3}\);而換門選到車子的機率為\(\frac{2}{3}\),因此選擇換門對參賽者較有利。

我們試著將其推廣到\(G\)隻山羊、\(C\)台車子:不換門:任何一扇門後面是車子的機率為\(\frac{C}{G+C}\)。

換門:這邊同樣需要考慮兩個狀況,值得注意的是第二次選擇的時候只剩下\(G+C-2\)扇門(少了一開始選的門及主持人打開後面為山羊的門):第一次選到車子的門:此情況的機率為\(\frac{C}{G+C}\),再從剩下的門中選到車子的機率為\(\frac{C-1}{G+C-2}\)。

第一次選到山羊的門:此情況的機率為\(\frac{G}{G+C}\),再從剩下的門中選到車子的機率為\(\frac{C}{G+C-2}\)。

由上面的討論可以得知:不換門選到車子的機率為\(\frac{C}{G+C}\);而換門選到車子的機率為\(\frac{C^2+GC-C}{(G+C)(G+C-2)}\),因此依然是選擇換門對參賽者較有利。



常見投資理財問答


延伸文章資訊