大數據:語意分析整合篇 | 被動收入的投資秘訣 - 2024年7月
![](https://www.books.com.tw/img/001/073/47/0010734706.jpg)
大數據:語意分析整合篇
不要再拔草測風向了!
大數據讓你了解現實世界的風向。
●市長失言,網友怎麼看?粉絲專頁經營,關鍵字是什麼?社群平台除了交朋友,還能拿來做什麼?本書通通報你知!
●全彩印刷、圖文並茂,詳細解說語意輿情分析的方法。
●R語言、Fanpage Karma、Tagxedo、D3、ECharts等超好用分析工具介紹。
隨著網路科技發達,人們漸漸地習慣在網路上傳遞訊息,這些訊息具有很大的用處。對於企業來說,分析消費者在Facebook對產品的意見,能幫助他們調整行銷策略;對於政府來說,可利用大數據分析得到民眾對於政策的想法,無形間起到監督政府的作用。
本書解析大數據中的「語意分析」方法。語意分析是對文本進行分析、處理、歸納和推理的過程,主要目的是用來分辨使用者對於人、事、物的看法或態度。利用分析工具如R語言、Tagxedo、D3等,更可以將資料圖像化,使資料清楚呈現、一目了然。
作者簡介
謝邦昌
學歷
國立臺灣大學農藝學系生物統計組博士
現職
臺北醫學大學生物科技高階管理碩士在職專班 教授
臺北醫學大學管理學院 院長
臺北醫學大學管理學院大數據研究中心 主任
中華市場研究協會理事長
中華資料採礦協會(CDMS) 榮譽理事長
主要經歷
輔仁大學創新育成中心主任(2010.08.01~2011.07.31)
輔仁大學商學研究所所長(2010.08.01~2011.07.31)
中華資料採礦協會理事長(2005-2012)
中華市場調查研究協會秘書長(2009-迄今)
中國統計學社理事(2005-迄今)
臺北醫學大學人體生物資料庫倫理委員會委員(2010.08.01~2011.7.31)
輔仁大學教師申訴評議委員會委員(2009.08.01-迄今)
中央警察大學時間序列分析課程兼任教授(2008.02.01-迄今)
中央警察大學行政警察學系警政民意調查中心顧問(2003.03-迄今)
臺灣大學醫學院附設醫院評選委員會委員(2009.07-迄今)
財團法人天主教聖保祿修女會醫院醫學研究統計諮詢顧問(2009.06-迄今)
臺灣大學農藝系系友會會務委員(2009.04-迄今)
中國統計學社出版委員會委員(2008.01-迄今)
行政院主計處普查委員會委員(2006.01-迄今)
臺北市政府市政顧問(2007.04-迄今)
臺北市政府民意調查諮詢委員(2004.11-迄今)
新北市政府顧問(2008.09-迄今)
行政院國家退除役官兵輔導委員會臺北榮總醫院名譽顧問(1999.07-迄今)
行政院國科會企劃考核處統計顧問(1996-迄今)
內政部統計委員會委員(1995-迄今)
教育部統計委員會委員(1995-迄今)
行政院人事行政局「軍公教員工待遇審議委員會」委員(2010.07.18~2012.05.30)
國立編譯館統計名詞審議委員會審議委員(2009.11.5-迄今)
謝邦彥
學歷
北京市首都經濟貿易大學 統計博士
現任
美商IEG創新學院深圳總經理
全國意向顧問股份有限公司顧問
中華資料採礦協會秘書長
中華粹智(TRIZ)創新學會理事
目前為ETtoday東森新聞雲及中國時報專欄作家,發表過應用大數據結合各產業的文章,如:市調業的革新,驅動未來的產品研發,社群經營的戰略等。
經歷
曾任英華達股份有限公司、鴻海精密工業股份有限公司、昇陽光電科技股份有限公司等公司品質主管及六標準差大黑帶。
曾輔導兩岸各領域企業,創造上億元的財務績效。客戶領域包括:電子及資訊產品相關產業、太陽光電相關產業、面板產業、化工產業及汽車產業等。服務業領域包含量販店及連鎖酒店、通路商、FMCG等。專業領域為產品創新及技術創新、大數據在各產業的應用。
序
第一部分 語意分析、輿情分析介紹
第1章 緒論
第2章 語意分析
第3章 輿情分析
第二部分 相關的使用軟體
第1章 語意分析R軟體
第2章 Fanpage Karma
第3章 語意視覺化
第三部分 語意分析相關案例
第1章 網路輿論
第2章 行銷創新
第3章 收視率調查
第4章 文章產生器
第5章 文件檢索
參考文獻
序
「老公,我覺得好冷」、「用AA品牌化妝品,可以讓你美美地勝過姊妹淘」。你看懂這些文字背後的意義嗎?
大數據時代,社群媒體的興起,已經成為民眾生活中不可或缺的一個平台。舉凡個人的生活點滴,對於事物及政策的評價,為自我意識發聲等,政府機構、企業、甚至到新聞媒體的營銷,都希望藉由社群媒體這個平台「發聲」。每個人都是自己的新聞台,都是自己的「主人」,社群平台每天產生大量的文字訊息,每天光是流向社群網站Facebook與Twitter的資料量,就多達25億則發文、27億按讚數。大數據海嘯席捲而來,這些文章文字散布在各個地方,每天光速成長,數據既多,也雜亂,如何從「亂而無章」的文字信息中萃取出有價值的寶藏,是在這大量訊息的時代的重要課題。
隨著資料儲存技術的演進,Open Source工具的發達(如R語言),筆者分享利用文字探勘的技術,來實現語意分析。如晉‧陳壽《三國志‧魏志‧高貴鄉公傳》:「高貴鄉公卒」裴松之注引《漢晉春秋》:「司馬昭之心,路人所知也。」透過文字探勘的技術,找出文章語句中的司馬昭之心,是本書想要帶給讀者的價值。
本書由淺入深,以見樹又見林的方式撰寫:第一章先闡述語意分析及輿情分析的概念,讓讀者對於「語意」有初步的認識。第二章則是如何利用工具達成語意分析,講述的是工具軟體可實現性的介紹。最後一章,筆者利用了文字探勘的技術,包含文字特徵、相關、聚類、脈絡主題及情感分析的技術,以深入淺出的手法,搭配實際的案例(如:輿情掌控及危機處理、行銷與創新、商品及通路選擇、收視率預測等),讓這些技術有別於理論,而是可以落地應用,對於個人、政府及企業產生實際價值。
「老公,我覺得好冷」—透過語意分析,得知想要表達的是「需要溫暖」。「用AA品牌化妝品,可以讓你美美地勝過姊妹淘」—代表的是驕傲出眾。試想,將大量文字透過文字探勘技術的萃取,進而了解消費者的觀點(Insight)、文字背後的涵義、民眾對政策走向的觀感、事件發生的脈絡及關連性,還可以看到別人看不到的「隱意」,以及預先知道危機的產生。這種利用文字探勘產生深知及預知的能力,若是結合社會學及心理學的分析與觀察,對於消費者行為及事件的洞察,會產生意想不到的加乘效果。
你準備好了跟我一起進行這尋寶的旅程了嗎?讓我們一起遨遊,讓您「猜」透文字的奧秘,享受字字珠璣,點字成金的旅程。
臺北醫學大學 管理學院 院長
臺北醫學大學 大數據研究中心 主任
謝邦昌
IEG創新學院(深圳)
謝邦彥