Python自然語言處理 | 被動收入的投資秘訣 - 2024年9月

Python自然語言處理

作者:(美)伯德
出版社:人民郵電
出版日期:2014年07月01日
ISBN:9787115333681
語言:繁體中文
售價:465元

自然語言處理(Natural Language Processing ,NLP)是計算機科學領域與人工智能領域中的一個重要方向。它研究能夠實現人與計算機之間用自然語言進行有效通信的各種理論和方法,涉及所有用計算機對自然語言進行的操作。伯德、克萊恩、洛佩爾編著的這本《Python自然語言處理》是自然語言處理領域的一本實用入門指南,旨在幫助讀者學習如何編寫程序來分析書面語言。《Python自然語言處理》基於Python編程語言以及一 個名為NLTK的自然語言工具包的開源庫,但並不要求讀者有Python編程的經驗。全書共11章,按照難易程度順序編排。第1章到第3章介紹了語言處理的基礎,講述如何使用小的Python程序分析感興趣的文本信息。第4章討論結構化程序設計,以鞏固前面幾章中介紹的編程要點。第5章到第7章介紹語言處理的基本原理,包括標注、分類和信息提取等。第8章到第10章介紹了句子解析、句法結構識別和句意表達方法。第11章介紹了如何有效管理語言數據。后記部分簡要討論了NLP領域的過去和未來。《Python自然語言處理》的實踐性很強,包括上百個實際可用的例子和分級練習。《Python自然語言 處理》可供讀者用於自學,也可以作為自然語言處理或計算語言學課程的教科書,還可以作為人工智能、文本挖掘、語料庫語言學等課程的補充讀物。

第1章 語言處理與Python 1.1 語言計算:文本和詞匯 1.2 近觀Python:將文本當做詞鏈表 1.3 計算語言:簡單的統計 1.4 回到Python:決策與控制 1.5 自動理解自然語言 1.6 小結 1.7 深入閱讀 1.8 練習第2章 獲得文本語料和詞匯資源 2.1 獲取文本語料庫 2.2 條件頻率分布 2.3 更多關於Python:代碼重用 2.4 詞典資源 2.5 WordNet 2.6 小結 2.7 深入閱讀 2.8 練習第3章 處理原始文本 3.1 從網絡和硬盤訪問文本 3.2 字符串:最底層的文本處理 3.3 使用Unicode進行文字處理 3.4 使用正則表達式檢測詞組搭配 3.5 正則表達式的有益應用 3.6 規范化文本 3.7 用正則表達式為文本分詞 3.8 分割 3.9 格式化:從鏈表到字符串 3.10 小結 3.11 深入閱讀 3.12 練習第4章 編寫結構化程序 4.1 回到基礎 4.2 序列 4.3 風格的問題 4.4 函數:結構化編程的基礎 4.5 更多關於函數 4.6 程序開發 4.7 算法設計 4.8 Python庫的樣例 4.9 小結 4.10 深入閱讀 4.11 練習第5章 分類和標注詞匯 5.1 使用詞性標注器 5.2 標注語料庫 5.3 使用Python字典映射詞及其屬性 5.4 自動標注 5.5 N-gram標注 5.6 基於轉換的標注 5.7 如何確定一個詞的分類 5.8 小結 5.9 深入閱讀 5.10 練習第6章 學習分類文本 6.1 監督式分類 6.2 監督式分類的舉例 6.3 評估 6.4 決策樹 6.5 朴素貝葉斯分類器 6.6 最大熵分類器 6.7 為語言模式建模 6.8 小結 6.9 深入閱讀 6.10 練習第7章 從文本提取信息 7.1 信息提取 7.2 分塊 7.3 開發和評估分塊器 7.4 語言結構中的遞歸 7.5 命名實體識別 7.6 關系抽取 7.7 小結 7.8 深入閱讀 7.9 練習第8章 分析句子結構 8.1 一些語法困境 8.2 文法的用途 8.3 上下文無關文法 8.4 上下文無關文法分析 8.5 依存關系和依存文法 8.6 文法開發 8.7 小結 8.8 深入閱讀 8.9 練習第9章 建立基於特征的文法 9.1 文法特征 9.2 處理特征結構 9.3 擴展基於特征的文法 9.4 小結 9.5 深入閱讀 9.6 練習第10章 分析語句的含義 10.1 自然語言理解 10.2 命題邏輯 10.3 一階邏輯 10.4 英語語句的語義 10.5 段落語義層 10.6 小結 10.7 深入閱讀 10.8 練習第11章 語言數據管理 11.1 語料庫結構:案例研究 11.2 語料庫生命周期 11.3 數據采集 11.4 使用XML 11.5 使用Toolbox數據 11.6 使用OLAC元數據描述語言資源 11.7 小結 11.8 深入閱讀 11.9 練習后記參考文獻


相關書籍