輿情計算方法與技術 | 被動收入的投資秘訣 - 2024年7月

輿情計算方法與技術

作者:饒元
出版社:電子工業
出版日期:2016年08月01日
ISBN:9787121296260
語言:繁體中文
售價:528元

社會計算是近十年來快速發展起來的一個新興的研究領域,它一方面依托於近年社交網絡技術以及應用的快速發展,使得越來越多的網絡用戶之間產生自聯接、自媒體、自選擇的內容傳播新方式,並且帶來了關於針對文本內容深入挖掘與分析的強大動力基礎;另一方面傳統社會學對於社會活動領域中的分析方法,特別是基於網絡化的社會化分析方法,使得人們發現在龐大的網絡數據中,可以充分地利用其中的一些指標與算法進行有效的度量與分析,從而使得社會網絡分析方法從技術角度上再次獲得了新的生命力。在這兩股力量的共同作用與影響下,社會計算領域中大量的研究成果也在不斷涌現出來。因此,本書從社會計算和自然語言處理與文本挖掘兩個角度出發,針對社會輿情分析過程中存在的核心方法進行綜合介紹。CCF會員;ACM會員 。負責或主持過國家863RFID重大專項「基於RFID的信息集成管理技術研究與開發」(2006AA04A118);北京市科委重大專項以及海淀區科技項目與博士后科研基金項目等多項;國家科技部火炬計划項目(高技術成果轉化協同創新平台與示范)國家社科基金重大項目(「基於多學科理解的社會網絡分析模型研究」第5子課題:虛擬Web網絡空間中的社會網 絡模型與個體行為機制研究)陝西省科技攻關項目: 基於專家知識地圖的科技協同創新平台關鍵技術研究與應用(2012K11-18)、基於網絡化感知計算的智慧社區管理關鍵技術與應用(2013K06-20);2013年,陝西省社科重點項目「中小企業首席工程師交流互動平台」機制研究;2012年,西安市技術轉移促進工程項目:社會網絡環境下的跨學科知識協同創新關鍵技術研究(CX12178(3))榆林市科技局「產學研」合作項目(科技資源統籌協同平台建設)等10余項。

第1章 社會計算與社會輿情分析概述11.1社會計算的概念與關鍵技術11.1.1Web2.0與社會化軟件的特征11.1.2社會計算的概念31.1.3社會計算與社會智能研究的核心內容61.2社會輿情的特征與分析方法101.2.1社會輿情的概念與特征101.2.2網絡輿情的形成和演化過程111.2.3網絡輿情的關鍵技術與方法131.3本書的知識結構15參考文獻17第2章 社會網絡分析理論與相關技術基礎182.1社會網絡分析方法182.1.1社會網絡分析方法的發展與研究的問題域182.1.2社會網絡分析方法的主要理論與概念體系242.1.3社會網絡分析的主要研究方法與分析工具282.2自然語言處理312.2.1自然語言處理的基本問題312.2.2中文分詞322.2.3命名實體識別332.2.4共指消解342.2.5實體關系的抽取342.2.6事件探測與追蹤352.3數據挖掘與機器學習方法概述352.3.1數據挖掘與機器學習方法352.3.2基於Web的文本挖掘392.4本章 小結41參考文獻42第3章 中文文本特征與詞分析技術433.1中文文本的基本特征433.1.1中文文本的基本特征433.1.2中文文本分析的任務與數據結構特征453.1.3中文文本句法結構分析503.1.4基於統計的句法分析方法543.2中文分詞技術553.2.1中文分詞的核心問題553.2.2基於規則的中文分詞的關鍵技術與算法583.2.3基於統計的中文分詞的關鍵技術與算法603.2.4基於理解的分詞方法653.2.5主要中文分詞工具653.3主題詞庫的構建673.3.1主題詞基本概念673.3.2主題詞間的關系定義693.3.3主題詞的抽取方法713.3.4主題詞庫的構建733.4本章 小結79參考文獻80第4章 社會網絡環境下的文本數據預處理技術814.1文本數據的詞義沖突與數據消歧814.1.1文本數據存在的詞義沖突與消歧814.1.2基於知識的詞義消歧方法834.1.3無監督的詞義消歧技術864.1.4有監督的詞義消歧技術894.2文本數據的稀疏性與降維904.2.1數據稀疏問題及解決914.2.2數據平滑技術924.2.3數據降維方法934.3數據融合974.3.1數據融合的概念與方法984.3.2實體的識別與統一表示994.3.3數據沖突處理1024.3.4數據關聯1034.4本章 小結104參考文獻104第5章 文本聚類方法分析1075.1聚類基礎概念1075.1.1聚類算法的定義1075.1.2聚類算法的目標與基本數據結構1085.1.3數據對象距離及相似度度量1095.1.4其他數據類型與相似度度量1115.2常用的文本聚類算法1135.2.1文本聚類的基本需求1135.2.2文本聚類方法1145.2.3文本聚類結果的評價方法1205.3基於文本數據流的聚類方法1215.3.1數據流問題的背景1215.3.2數據流基本概念與模型1225.3.3數據流聚類方法1245.3.4演化分析技術1295.4本章 小結131參考文獻131第6章 文本分類方法1346.1分類基礎概念1346.1.1分類問題的定義1346.1.2文本分類與目標1356.1.3分類算法的評價1366.2基於概率的貝葉斯分類方法1376.2.1貝葉斯概率公式1386.2.2朴素貝葉斯分類原理1386.2.3基於朴素貝葉斯分類算法的文本分類器設計1396.2.4貝葉斯網絡模型1416.3基於核的分類算法1436.3.1支持向量機算法1436.3.2核函數的定義1456.3.3多類問題的求解算法1476.4其他分類器的常用構造算法1496.4.1Rocchio分類算法1496.4.2KNN算法1496.4.3Boosting算法1516.5本章 小結152參考文獻153第7章 信息抽取與摘要自動生成技術1547.1命名實體的識別與抽取技術1547.1.1命名實體識別的基本任務1547.1.2人名實體抽取1567.1.3地名實體抽取方法1607.1.4機構名實體抽取方法1637.2網絡文本數據中的實體間關系的抽取1657.2.1實體關系的定義與基本分類1657.2.2存在關系的實體對抽取方法1667.2.3基於核函數的實體關系抽取方法1687.3話題識別與追蹤技術(TDT)1717.3.1話題識別與追蹤需要解決的問題與目標1717.3.2話題識別與追蹤的經典方法1737.3.3話題識別與追蹤的評價方法1757.4自動摘要生成技術1767.4.1自動文檔摘要生成所需要解決的問題與目標1767.4.2單文檔自動摘要生成技術1787.4.3多文檔自動文摘生成的關鍵技術1817.4.4自動摘要系統的評價標准1837.5本章 小結185參考文獻185第8章 社會網絡中社區識別與信息傳播1888.1網絡社區的識別1888.1.1網絡社區的概念1898.1.2網絡社區的特征與關鍵問題1918.1.3基於非重疊社區的發現算法1958.1.4基於重疊的網絡社區發現與識別算法1988.1.5社區發現算法評價方法2018.2網絡信息的傳播模型2038.2.1網絡信息傳播中的基本問題2038.2.2行動者影響力分析2048.2.3信息傳播動力學模型2078.3鏈接預測模型與方法2118.3.1鏈接預測的概念與主要目標2128.3.2鏈接預測存在的主要算法分類與指標2128.3.3鏈接預測存在的經典算法2158.4本章 小結218參考文獻218第9章 社會網絡下的情感分析2219.1情感計算的基本概念與問題挑戰2219.1.1情感分析的概念與研究目標2219.1.2情感詞的識別與標注2239.1.3情感詞典的構建2259.2文本的主/客觀分析與觀點挖掘分析方法2289.2.1文本的主/客觀分析方法2289.2.2觀點挖掘分析方法2299.3情感分析與計算方法2329.3.1基於詞的經典情感計算與分析方法2329.3.2不同粒度下的情感分析方法2349.3.3文檔主體對象的情感傾向分析方法2409.3.4跨領域文檔的情感傾向分析方法2459.3.5情感計算評價方法2459.4本章 小結246參考文獻247第10章 數據可視化技術25010.1可視化技術概述25010.1.1可視化技術的基本概念與目標25010.1.2可視化技術的分類25210.2社會網絡可視化的靜態分析方法26010.2.1社會網絡環境下的可視化方法介紹26010.2.2力導引布局相關算法26210.2.3層次布局26410.2.4樹形布局26910.3動態可視化交互方法與可視化模式挖掘技術27310.3.1可視化的動態交互與形變技術27410.3.2可視化模式挖掘與分析方法27710.4數據可視化的質量評價方法27810.4.1數據可視化的質量評價模型27810.4.2數據可視化的質量評價指標28010.5本章 小結281參考文獻282第11章 社會計算與輿情分析應用28411.1社會網絡輿情分析與應用28411.1.1分析指標體系與分析模型的建立28411.1.2分析平台的建立與應用28811.2企業社會網絡分析與應用28911.2.1企業社會網絡構造方法29011.2.2企業特征的抽取29111.2.3企業社會網絡服務平台與可視化分析29211.3專家網絡與知識圖譜應用29311.3.1專家模型的構建與屬性抽取規則29311.3.2專家模型中的屬性消歧與網絡構建29711.4專利地圖的應用29811.4.1專利地圖的研究與制作方法29811.4.2專利地圖的構建與分析29911.5金融風險預測與分析應用30211.6本章 小結304參考文獻305第12章 社會計算與輿情分析的技術發展趨勢30712.1大數據與數據世系30812.2基於機器學習的類人腦科學的演化31012.3社會計算向社會智能的演化31212.4小結314參考文獻315附錄A 基於信息傳播的分類及網站示例317附錄B 基於LDA模型的候選主題詞抽取算法描述318附錄C 常用的中文停用詞表321附錄D TBDC4TS聚類算法偽代碼示意333后記335

在 CMU訪學的日子是這樣的漫長和寧靜,遠處在匹茲堡城南一角,每天在考慮着自己的生存模式的同時,還時時被來自國內的信息所包圍着、簇擁着,深深地感受到「世界上最遙遠的距離就是沒有網絡」。但是,讓自己印象最深刻的場景不是新鮮的空氣和美麗的天空,也不是讓我心生恐懼的 Pizza大餐,而是當我在實驗室內部進行的工作匯報中,剛說到自己希望完成這樣一本書時,看到合作導師 Alex教授一臉茫然和不確信。能完成嗎?我自己同樣也在問自己,這是一個巨大的、辛苦的工作,因為在每一個章節中都存在着巨大的挑戰與工作量,盡管在每一章節中我們實驗室都有一些相關的工作基礎,但是其中大量的背景、算法及算法應用,如何在短短的篇幅中能夠盡可能地介紹清楚,這對於我而言絕對是一次重大的挑戰。


相關書籍