用商業案例學R語言數據挖掘 | 被動收入的投資秘訣 - 2024年6月

用商業案例學R語言數據挖掘

作者：經管之家主編

出版社：電子工業

出版日期：2017年09月01日

ISBN：9787121319587

語言：繁體中文

商業智能時代已經全面到來，分析型人才的崗位數量在就業市場中呈現井噴式增長。無論是從事產品研發的工程師，還是從事產品推廣的市場人員、人力資源和財務會計人員，都需要掌握數據分析技術，否則很有可能被人工智能替代。本書包括18章，涉及使用R語言做數據分析和數據挖掘的主要分析方法。其中，第1、2章為數據分析方法概述，第3章為R語言編程基礎，第4章到第8章為統計學習方法，第9章到第16章為數據挖掘方法，第17章為特征工程，第18章為R文本挖掘。每章都根據所涉及的知識點的不同，選取了實用的案例，並為讀者准備了相應的練習題。本書作為CDA數據分析師系列叢書中《如虎添翼！數據處理的SPSS和SASEG實現（第2版）》和《胸有成竹!數據分析的SPSS和SASEG進階（第2版）》的姊妹篇，將前兩本書的內容進行整合並做了重大拓展，而且秉承了該系列叢書的特點：內容精練、重點突出、示例豐富、語言通俗。可以作為廣大從業人員自學商業數據分析的讀物，適合大中專院校師生學習和閱讀，同時也可以作為高等院校商科、社會科學及相關培訓機構的教材。經管之家（www.jg.com.cn）：原人大經濟論壇，於2003年成立，致力於推動經管學科的進步，傳播優秀教育資源，目前已經發展成為國內優秀的經濟、管理、金融、統計類的在線教育和咨詢網站，也是國內活躍和具影響力的經管類網絡社區。經管之家從2006年起在國內開展數據分析培訓，累計培訓學員數萬人。在大數據的趨勢背景下，創新「CDA數據分析師」品牌，致力於為社會各界數據分析愛好者提供優質、科學、系統的數據分析教育。截至2016年3月已成功舉辦40多期系統培訓，培訓學員達3千余名；CDA認證考試已成功舉辦三屆，報考人數上千人；中國數據分析師俱樂部（CDACLUB），每周線下免費沙龍活動，已舉力40多期，累積會員2千余名；中國數據分析師行業峰會（CDA Summit），一年兩屆，參會人數皆達2千余名，在大數據領域影響力超前。「CDA數據分析師」隊伍在業界不斷壯大，對數據分析人才產業起到了巨大的推動作用。常國珍，北京大學光華管理學院會計學在讀博士生，北京大學人口研究所社會學碩士，河北聯合大學土木工程專業學士。德勤管理咨詢公司兼職咨詢顧問，SAS專業培訓講師。曾以數據挖掘工程師身份就職於亞信科技（中國）有限公司市場部。具有八年的數據挖掘實戰經驗，主要從事電信和銀行業數據挖掘工作。項目涉及客戶精准營銷、信用評估、欺詐偵測和流失預警等，尤其熟悉銀行個人客戶精准營銷的建模工作。

第1章商業數據分析基礎1.1商業數據分析的本質1.2商業數據分析中心的建設第2章數據分析的武器庫2.1數據挖掘簡介2.2R語言簡介2.3R與RStudio的下載和安裝2.4在RStudio中安裝包2.5練習題第3章R語言編程3.1R的基本數據類型3.2R的基本數據結構3.3R的過程控制3.4R的函數3.5R的日期與時間數據類型3.6在R中讀寫數據3.7練習題第4章R描述性統計分析與繪圖4.1描述性統計分析4.2制圖的步驟4.3R基礎繪圖包4.4ggplot2繪圖4.5練習題第5章數據整合和數據清洗5.1數據整合5.2R中的高級數據整合5.3R中的抽樣5.4R的數據清洗5.5數據整合第6章統計推斷基礎6.1基本的統計學概念6.3雙樣本t檢驗6.4方差分析（分類變量和連續變量關系檢驗）6.5相關分析（兩連續變量關系檢驗）6.6卡方檢驗（兩分類變量關系檢驗）6.7練習題第7章客戶價值預測：線性回歸模型與診斷7.1相關性分析7.2線性回歸7.3線性回歸診斷7.4正則化方法7.5練習題第8章Logistic回歸構建初始信用評級8.1Logistic回歸的相關關系分析8.2Logistic回歸模型及實現8.3很大熵模型與極大似然法估計8.4模型評估8.5練習題第9章使用決策樹進行信用評級9.1決策樹建模思路9.2決策樹算法9.3在R中實現決策樹9.4組合算法（Ensemble Learning）9.5練習題第10章神經網絡10.1神經元模型10.2人工神經網絡模型10.3單層感知器10.4BP神經網絡10.5RBF神經網絡10.6神經網絡設計與R代碼實現10.7練習題第11章分類器入門：最近鄰域與貝葉斯網絡11.1分類器的概念11.2KNN算法11.3朴素貝葉斯11.4貝葉斯網絡11.5練習題第12章高級分類器：支持向量機12.1線性可分與線性不可分12.2線性可分支持向量機12.3線性支持向量機12.4非線性支持向量機12.5R中的支持向量機12.6練習題第13章連續變量的維度歸約13.1維度歸約方法概述13.2主成分分析13.3因子分析13.4奇異值分解13.5對應分析和多維尺度分析13.6練習題第14章聚類14.1聚類分析概述14.2聚類算法邏輯14.3層次聚類14.4k—means聚類14.5基於密度的聚類14.6聚類模型的評估14.7高斯混合模型（Gaussian Mixture Model）14.8客戶分群14.9練習題第15章關聯規則與推薦算法15.1長尾理論15.2關聯規則15.3序貫模型15.4推薦算法與推薦系統15.5練習題第16章時間序列建模16.1認識時間序列16.2簡單時間序列分析16.3平穩時間序列分析ARMA模型16.4非平穩時間序列分析ARIMA模型第17章特征工程（Feature Engineering）（博文視點官方網站下載）17.1特征工程概述17.2數據預處理（Data Preprocessing）17.3特征構造（Feature Construction）17.4特征抽取（Feature Extraction）17.5特征選擇（Feature Selection）第18章R文本挖掘（博文視點官方網站下載）18.1文本挖掘18.2文本清洗18.3中文分詞與文檔模型18.4文本的特征選擇及相關性度量18.5文本分類18.6主題模型18.7綜合案例附錄A數據說明（博文視點官方網站下載）

高等會計學(會計師考試適用)