短文本數據理解 | 被動收入的投資秘訣 - 2024年7月

短文本數據理解

作者：王仲遠

出版社：機械工業

出版日期：2017年05月01日

ISBN：9787111558811

語言：繁體中文

售價：199元

書籍連結

短文本理解是伴隨着搜索引擎、社交網絡,以及聊天機器人等應用場景而興起的一個研究課題。它是近年來的一個研究熱點，且對未來人工智能的發展有重要的影響。本書所介紹的短文本數據理解技術，涵蓋學術界及工業界前沿的理論及方法，可以廣泛應用於搜索引擎、廣告系統、智能助手等場景中，是大數據管理不可或缺的部分，具有較高的實際應用價值。王仲遠，中國人民大學博士，微軟亞洲研究院研究員。負責微軟研究院大型Web知識庫系統Probase項目，以及企業知識庫系統Enterprise Dictionary項目。已在VLDB、ICDE、IJCAI、CIKM等國際頂ji學術會議上發表論文十余篇，並獲得ICDE 2015佳論文獎。出版技術專著2本，擁有美國專利5項。研究領域包括：人工智能、知識庫系統、自然語言處理、機器學習、數據挖掘等。

叢書前言推薦序一推薦序二前言作者簡介第1章短文本理解及其應用 1.1 短文本理解 1.2 短文本理解研究現狀 1.2.1 短文本理解模型概述 1.2.2 短文本理解模型粒度分析 1.3 短文本理解框架第2章基於概率的屬性提取與推導 2.1 引言 2.2 屬性提取 2.2.1 屬性提取的整體框架 2.2.2 概率isA網絡 2.2.3 基於概念和基於實體的屬性提取 2.3 屬性得分推導 2.3.1 典型度得分 2.3.2 根據CB列表計算典型度 2.3.3 根據IB列表計算典型度 2.3.4 典型度聚合 2.3.5 同義屬性集合 2.4 相關研究 2.5 小結第3章單實體概念化模型 3.1 引言 3.1.1 基本層次類別 3.1.2 應用 3.1.3 BLC計算方法 3.2 語義網絡 3.3 基本層次類別化 3.3.1 典型性 3.3.2 將典型性用於BLC 3.3.3 將平滑典型性用於BLC 3.3.4 將PMI用於BLC 3.3.5 將Rep(e，c)用於BLC 3.4 小結第4章基於概念化的短文本理解 4.1 引言 4.2 預備知識 4.2.1 概念 4.2.2 概念聚類 4.2.3 屬性 4.2.4 整體框架和符號表示 4.3 挖掘詞匯關系 4.3.1 概述 4.3.2 解析 4.3.3 P(z|t)推導 4.3.4 P(c|t,z)推導 4.3.5 語義網絡 4.4 查詢理解 4.4.1 方法概況 4.4.2 算法 4.5 小結第5章基於概念化的短文本主題詞與修飾詞檢測 5.1 引言 5.2 整體框架 5.3 非限定性修飾詞挖掘 5.4 限定性修飾詞挖掘 5.4.1 Probase:一個大規模的isA知識庫 5.4.2 實體級別主題詞修飾詞 5.4.3 概念級別主題詞修飾詞 5.5 主題詞與修飾詞檢測 5.5.1 解析 5.5.2 針對兩個組件的主題詞修飾詞檢測 5.5.3 針對兩個以上組件的主題詞修飾詞檢測 5.6 相關工作 5.7 小結第6章基於概念化的詞相似度計算 6.1 引言 6.2 語義網絡和同義詞集合 6.3 基本方法 6.3.1 類型判別 6.3.2 語境表示 6.3.3 語境相似度 6.3.4 討論 6.4 改進方法 6.4.1 概念聚類 6.4.2 Max?Max相似度計算方法 6.4.3 聚類刪減優化 6.5 相關工作 6.6 小結第7章基於概念化的海量競價關鍵字匹配 7.1 引言 7.2 語義網絡 7.3 系統框架 7.4 概念化 7.4.1 實體檢測 7.4.2 詞義推導 7.4.3 消除歧義 7.5 檢索 7.5.1 基於點擊數據的候選競價關鍵字選擇 7.5.2 基於概念的候選競價關鍵字選擇 7.5.3 排名 7.6 相關工作 7.7 小結第8章短文本理解研究展望 8.1 知識語義網 8.2 顯性知識和隱性知識的結合參考文獻

品牌物理學：科技力量與消費模式背後...