[機器學習]⎝⎛MultinomialNB 貝氏(貝葉氏)分類⎞⎠ | 貝氏推論機器學習

貝氏定理(英語:Bayes' theorem)是概率論中的一個定理,描述在已知一些條件下,某事件的發生機率。

比如,如果已知某癌症與壽命有關,使用貝氏定理則可以通過得知某人年齡 ...GetstartedOpeninappDerekWuSigninGetstarted35FollowersAboutGetstartedOpeninapp[機器學習]⎝⎛MultinomialNB貝氏(貝葉氏)分類⎞⎠DerekWu·Aug3,2020機器學習裡面,有個簡單又實用的model叫做貝氏分類器。

這個詞或許很陌生,但大家的生活中已經有很多相關的應用,比如:垃圾郵件分類、塞車預測、甚至是簡單的天氣預測..等。

現在,貝氏分類可以應用在更多的地方,比如:AI聊天機器人、案件分類(預測)…等,可以參考我的另一篇文章--Python實作篇(待出版XD)。

現在就來介紹一下,貝氏分類器的背後原理、概念說明。

進入正題在機器學習套件sklearn裡的MultinomialNB貝氏分類器,是建立在公式—貝氏定理—上。

維基百科對於貝氏定理的說明:貝氏定理(英語:Bayes’theorem)是概率論中的一個定理,描述在已知一些條件下,某事件的發生機率。

比如,如果已知某癌症與壽命有關,使用貝氏定理則可以通過得知某人年齡,來更加準確地計算出他罹患癌症的機率。

公式非常簡單,一行就結束了:貝氏定理其中P(A|B)是條件機率,也就是B發生的條件下,A發生的機率。

計算方法為P(A|B)=P(A∩B)/P(B)假設今天我有過去12天的天氣跟遲到的數據,我想了解下雨天遲到的機率,那根據圖片的貝氏定理就會是其中P(下雨)=下雨的機率=3/12P(遲到)=遲到的機率=3/12P(下雨|遲到)=已知遲到的情況下,下雨的機率。

這我們可以從過去的數據紀錄計算出來=P(遲到又下雨)/P(遲到)=(1/12)/(3/12)=1/3最後算出來雨天遲到的機率=(1/3)(3/12)/(3/12)=1/3=33%同理,晴天遲到的機率為=2/9=22%33%>22%我們可以合理的推測,雨天遲到的可能>>晴天遲到的可能所以其實整個貝氏定理,我們也可以理解成,透過已知的三個機率P(A)、P(B)、P(B|A)而推出第四個機率P(A|B)。

當然遲到的原因可能複雜,於是我們可以加入星期幾、時間、有無塞車等更多的條件,整個公式可以拓展成圖片是拿來嚇嚇人的,實際動手算比較快。

再舉個簡單的例子,假設今天我有名校入學跟家庭收入的資料如下,我想知道.小孩唸名校的條件下,家庭是高收入的機率於是我們就來用貝氏定理計算一下。

帶入公式前我們需要先計算一下條件機率:帶入貝氏定理:也就是說,唸名校的條件下,家庭是高收入的機率為66.7%因此我們可以合理的推論威,歪了不是啦,我們可以合理推論(根據過往的資料)如果我們能有高的家庭年收入,就能有較高機會給我們的小孩更好的就學環境。

以上就是機器學習貝氏分類器,背後的貝氏定理說明。

還有不懂可以參考這個國外的影片,講得非常清楚了解原理可以在資料調整上更有方向,如果還看不懂直接用用看也可以,實作可以看我的另一篇文章Python實作(待出版XD)祝大家都能在自己的人生、事業上成功,然後高的家庭年收入。

如果有讓你看完這篇文,可以幫我拍手1–10下如果覺得文還算有趣,可以幫我拍手10-20下如果覺得這文章讓你有點收穫,請幫我拍手20–30下如果覺得想看到更多關於學習筆記的文章,可以幫我拍手30–50下讓我知道,也記得Follow我DerekWu更歡迎你在下方留言,我很樂意與你討論聊天或回答問題!99 99MachineLearningBayesianMachineLearning機器學習貝氏定理MultinomialnbMorefromDerekWuFollow數學系畢業,一年交換學生,演算法工程師&數據分析&系統工程師。

推薦系統研發中Workhard,playhard!


常見投資理財問答


延伸文章資訊