機器學習舉一反三(2/2) | 貝氏推論機器學習

現在運用貝氏推論的人工智慧,僅需數個範例就可辨識圖形,表現堪比人類。

... 另一種機器學習的方法,在近幾年改變了AI的發展,運作方式剛好相反:由 ...Sunday19thSeptember202119-Sep-2021人工智慧化學物理數學生命科學生命科學文章植物圖鑑地球科學環境能源科學繪圖高瞻專區第一期高瞻計畫第二期高瞻計畫第三期高瞻計畫綠色奇蹟-中等學校探究課程發展計畫關於我們網站主選單機器學習舉一反三(2/2)撰文/AlisonGopnik|譯者/鍾樹人轉載自《科學人》2017年9月第187期科學家長期研究人類的學習方式,以教導電腦如何學習。

現在運用貝氏推論的人工智慧,僅需數個範例就可辨識圖形,表現堪比人類。

(續前文)由上而下另一種機器學習的方法,在近幾年改變了AI的發展,運作方式剛好相反:由上而下。

我們假設人類可以從實際資料裡獲得抽象知識,因為人類已經知道很多事,更是因為大腦已經了解基本的抽象概念。

就像科學家一樣,我們可以藉由這些概念建構關於這個世界的假設,如果假設正確,就能預測資料(事件)的樣貌;相較之下,採行由下而上方法的AI會設法從原始資料中擷取出模式,做法南轅北轍。

要說明這個概念,可討論上述泛濫成災的詐騙信,這回談一件跟我有關的真實案例。

我先前收到某期刊編輯寄來的電子郵件,那份期刊名稱奇怪。

編輯明確提到我的一篇論文,並提議我寫篇論文發表在這本期刊。

這封電子郵件中沒有提到奈及利亞、威而鋼和百萬美元獎金,沒有詐騙信共同的特徵。

但我依據已經知道的資訊,並且抽象思考詐騙信的產生方式,可以判定這封電子郵件很可疑。

首先,我知道詐騙信發送者騙取他人錢財的手法是基於人類的貪婪;學術圈人士對發表論文的渴望,可能跟一般人對百萬美元獎金或性能力的渴求一樣強烈。

其次,我知道「開放取用」期刊已經開始向作者收費來分擔成本,而非向訂閱者收費。

另外,我的工作跟期刊名稱完全不相干。

綜合以上因素,我提出合理假設:這類電子郵件想讓學術圈人士誤以為只要付費給「假」期刊就能「發表」論文。

我從單一例子就得出這項結論,而且還能進一步測試自己的假設:透過搜尋引擎查詢這位編輯是否真有其人。

資訊科學家會說我的推論過程是「生成模型」(generativemodel),生成模型能描繪抽象概念,例如貪婪與欺騙。

同樣的模型也可以描述提出假設的過程,這個推論過程得出這封郵件可能是詐騙信的結論。

運用這個模型,我能假想這種類型的詐騙信如何運作,也能揣測其他類型,即使是我從未看過或聽過。

當我收到這個期刊寄來的電子郵件,便能反向運用這個模型,一步步追查這封郵件的真偽。

1950~60年代第一波AI和認知科學的發展中,生成模型至關重要,但也有局限。

首先,原則上我們可以用各種不同的假設來解釋大多數證據模式;就我的例子而言,即使那封郵件看似詐騙信,但也可能不是。

於是,生成模型必須納入機率概念,而機率是這些方法近來最重大的進展之一。

其次,我們通常不知道那些構成生成模型的基本概念出自何處。

笛卡兒與喬姆斯基(NoamChomsky)這類學者指出,你天生就擁有這些概念,但你一誕生在世上時就知道他人如何憑藉貪婪和謊言來詐騙?貝氏模型是近來由上而下方法的絕佳範例,試圖處理這兩個問題。

貝氏模型是以18世紀統計學家兼哲學家貝茲(ThomasBayes)為名,利用一種稱為貝氏推論(Bayesianinference)的方法,結合生成模型與機率論。

機率生成模型可以告訴你,如果某個假設為真,你看到特定模式資料的機率有多高。

如果某封電子郵件是場騙局,可能就是基於收件者的貪婪。

不過,基於貪婪的電子郵件不一定是詐騙信。

貝氏模型結合你提出假設所依據的知識以及你手上的資料,讓你精準計算某封電子郵件是詐騙信的機率。

比起由下而上的方式,這種由上而下的方式更符合我們對孩童學習方式的認知,這就是為什麼過去15年我和同事一直採用貝氏模型來研究他們的學習方式。

我們與其他實驗室都使用這些技術來了解孩童學習的因果關係,預測他們如何與何時會萌生出關於這個世界的新想法,以及何時會改變既有的想法。

貝氏方法也是教導機器像人一樣學習的絕妙方式。

2015年,美國麻省理工學院(MIT)的特南鮑姆(JoshuaB.Tenenbau


常見投資理財問答


延伸文章資訊