用商業案例學R語言數據挖掘 | 被動收入的投資秘訣 - 2024年6月

用商業案例學R語言數據挖掘

作者:經管之家主編
出版社:電子工業
出版日期:2017年09月01日
ISBN:9787121319587
語言:繁體中文

商業智能時代已經全面到來,分析型人才的崗位數量在就業市場中呈現井噴式增長。無論是從事產品研發的工程師,還是從事產品推廣的市場人員、人力資源和財務會計人員,都需要掌握數據分析技術,否則很有可能被人工智能替代。本書包括18章,涉及使用R語言做數據分析和數據挖掘的主要分析方法。其中,第1、2章為數據分析方法概述,第3章為R語言編程基礎,第4章到第8章為統計學習方法,第9章到第16章為數據挖掘方法,第17章為特征工程,第18章為R文本挖掘。每章都根據所涉及的知識點的不同,選取了實用的案例,並為讀者准備了相應的練習題。本書作為CDA數據分析師系列叢書中《如虎添翼!數據處理的SPSS和SASEG實現(第2版)》和《胸有成竹!數據分析的SPSS和SASEG進階(第2版)》的姊妹篇,將前兩本書的內容進行整合並做了重大拓展,而且秉承了該系列叢書的特點:內容精練、重點突出、示例豐富、語言通俗。可以作為廣大從業人員自學商業數據分析的讀物,適合大中專院校師生學習和閱讀,同時也可以作為高等院校商科、社會科學及相關培訓機構的教材。經管之家(www.jg.com.cn):原人大經濟論壇,於2003年成立,致力於推動經管學科的進步,傳播優秀教育資源,目前已經發展成為國內優秀的經濟、管理、金融、統計類的在線教育和咨詢網站,也是國內活躍和具影響力的經管類網絡社區。經管之家從2006年起在國內開展數據分析培訓,累計培訓學員數萬人。在大數據的趨勢背景下,創新「CDA數據分析師」品牌,致力於為社會各界數據分析愛好者提供優質、科學、系統的數據分析教育。截至2016年3月已成功舉辦40多期系統培訓,培訓學員達3千余名;CDA認證考試已成功舉辦三屆,報考人數上千人;中國數據分析師俱樂部(CDACLUB),每周線下免費沙龍活動,已舉力40多期,累積會員2千余名;中國數據分析師行業峰會(CDA Summit),一年兩屆,參會人數皆達2千余名,在大數據領域影響力超前。「CDA數據分析師」隊伍在業界不斷壯大,對數據分析人才產業起到了巨大的推動作用。常國珍,北京大學光華管理學院會計學在讀博士生,北京大學人口研究所社會學碩士,河北聯合大學土木工程專業學士。德勤管理咨詢公司兼職咨詢顧問,SAS專業培訓講師。曾以數據挖掘工程師身份就職於亞信科技(中國)有限公司市場部。具有八年的數據挖掘實戰經驗,主要從事電信和銀行業數據挖掘工作。項目涉及客戶精准營銷、信用評估、欺詐偵測和流失預警等,尤其熟悉銀行個人客戶精准營銷的建模工作。

第1章商業數據分析基礎1.1商業數據分析的本質1.2商業數據分析中心的建設第2章數據分析的武器庫2.1數據挖掘簡介2.2R語言簡介2.3R與RStudio的下載和安裝2.4在RStudio中安裝包2.5練習題第3章R語言編程3.1R的基本數據類型3.2R的基本數據結構3.3R的過程控制3.4R的函數3.5R的日期與時間數據類型3.6在R中讀寫數據3.7練習題第4章R描述性統計分析與繪圖4.1描述性統計分析4.2制圖的步驟4.3R基礎繪圖包4.4ggplot2繪圖4.5練習題第5章數據整合和數據清洗5.1數據整合5.2R中的高級數據整合5.3R中的抽樣5.4R的數據清洗5.5數據整合第6章統計推斷基礎6.1基本的統計學概念6.3雙樣本t檢驗6.4方差分析(分類變量和連續變量關系檢驗)6.5相關分析(兩連續變量關系檢驗)6.6卡方檢驗(兩分類變量關系檢驗)6.7練習題第7章客戶價值預測:線性回歸模型與診斷7.1相關性分析7.2線性回歸7.3線性回歸診斷7.4正則化方法7.5練習題第8章Logistic回歸構建初始信用評級8.1Logistic回歸的相關關系分析8.2Logistic回歸模型及實現8.3很大熵模型與極大似然法估計8.4模型評估8.5練習題第9章使用決策樹進行信用評級9.1決策樹建模思路9.2決策樹算法9.3在R中實現決策樹9.4組合算法(Ensemble Learning)9.5練習題第10章神經網絡10.1神經元模型10.2人工神經網絡模型10.3單層感知器10.4BP神經網絡10.5RBF神經網絡10.6神經網絡設計與R代碼實現10.7練習題第11章分類器入門:最近鄰域與貝葉斯網絡11.1分類器的概念11.2KNN算法11.3朴素貝葉斯11.4貝葉斯網絡11.5練習題第12章高級分類器:支持向量機12.1線性可分與線性不可分12.2線性可分支持向量機12.3線性支持向量機12.4非線性支持向量機12.5R中的支持向量機12.6練習題第13章連續變量的維度歸約13.1維度歸約方法概述13.2主成分分析13.3因子分析13.4奇異值分解13.5對應分析和多維尺度分析13.6練習題第14章聚類14.1聚類分析概述14.2聚類算法邏輯14.3層次聚類14.4k—means聚類14.5基於密度的聚類14.6聚類模型的評估14.7高斯混合模型(Gaussian Mixture Model)14.8客戶分群14.9練習題第15章關聯規則與推薦算法15.1長尾理論15.2關聯規則15.3序貫模型15.4推薦算法與推薦系統15.5練習題第16章時間序列建模16.1認識時間序列16.2簡單時間序列分析16.3平穩時間序列分析ARMA模型16.4非平穩時間序列分析ARIMA模型第17章特征工程(Feature Engineering)(博文視點官方網站下載)17.1特征工程概述17.2數據預處理(Data Preprocessing)17.3特征構造(Feature Construction)17.4特征抽取(Feature Extraction)17.5特征選擇(Feature Selection)第18章R文本挖掘(博文視點官方網站下載)18.1文本挖掘18.2文本清洗18.3中文分詞與文檔模型18.4文本的特征選擇及相關性度量18.5文本分類18.6主題模型18.7綜合案例附錄A數據說明(博文視點官方網站下載)


相關書籍