R語言與數據挖掘 | 被動收入的投資秘訣 - 2024年5月

R語言與數據挖掘

作者:張良均等
出版社:機械工業
出版日期:2016年06月01日
ISBN:9787111540526
語言:繁體中文

本書主要分為三個部分,基礎篇、建模應用篇和Rattle篇。基礎篇(第1~5章)介紹了有關R語言的安裝與使用、R語言中的數據結構、常用操作和繪圖功能等基礎功能。建模應用篇(第6~10章)主要介紹了目前在數據挖掘中的常用的建模方法在R語言中的實現函數,並對輸出結果進行了解釋,有助於讀者快速掌握應用R語言進行分析挖掘建模的方法。Rattle篇(第11章)介紹了一個R語言的圖形界面工具。圖書配套提供了程序代碼及數據,讀者可通過上機實驗,快速掌握書中所介紹的R語言的使用方法。張良均,資深大數據挖掘專家和模式識別專家,有10多年的大數據挖掘應用、咨詢經驗,10余年數據倉庫系統管理與實施經驗,超過10年的系統開發與設計經驗。為電信、電力、互聯網、生產制造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘應用與咨詢服務,實踐經驗非常豐富。此外,他精通Java EE企業級應用開發,是廣東工業大學和華南師范大學兼職教授,著有《神經網絡實用教程》、《數據挖掘:實用案例分析》等暢銷書。謝佳標,資深R語言專家,多次於中國R語言大會發表演講,具有十余年的數據挖掘實戰經驗。目前於某上市互聯網游戲公司,任高級數據分析師,負責大數據挖掘及可視化。培訓過的精品課程有:《R語言基礎訓練》《數據分析之R語言實戰》《機器學習與R語言實踐》等。

前 言第一部分 基礎篇第1章 R語言的安裝與使用 21.1 R安裝與升級 31.2 R使用入門 41.2.1 R操作界面 41.2.2 RStudio窗口介紹 51.2.3 R常用操作 61.3 R數據分析包 81.4 配套資源使用說明 101.5 小結 101.6 上機實驗 10第2章 數據對象與數據讀寫 122.1 數據類型 122.2 數據結構 162.2.1 向量 162.2.2 矩陣 192.2.3 數組 242.2.4 數據框 252.2.5 因子 282.2.6 列表 312.3 數據文件的讀寫 342.3.1 鍵盤輸入數據 342.3.2 讀取不同格式的數據 352.3.3 從其他統計軟件獲取數據 372.3.4 從數據庫獲取數據 372.3.5 從網頁獲取數據 392.4 小結 402.5 上機實驗 40第3章 R語言常用數據管理 423.1 變量的重命名 423.2 缺失值分析 453.3 數據排序 463.4 隨機抽樣 483.5 數值運算函數 493.6 字符串處理 523.7 文本分詞 563.8 apply函數族 623.9 數據整合 653.10 控制流 683.11 函數的編寫 713.12 小結 723.13 上機實驗 73第4章 圖形探索 754.1 圖形元素 764.1.1 顏色 764.1.2 點 804.1.3 文本 824.1.4 線條 864.1.5 圖例 914.1.6 坐標軸 924.2 圖形組合 944.3 圖形保存 974.4 圖形函數 984.5 小結 1164.6 上機實驗 116第5章 高級繪圖工具 1175.1 lattice包繪圖工具 1175.1.1 繪圖特色 1175.1.2 基本圖形 1225.2 ggplot2包繪圖工具 1355.2.1 從qplot開始 1355.2.2 ggplot作圖 1375.3 交互式繪圖工具簡介 1425.3.1 rCharts包 1435.3.2 recharts包 1475.3.3 googleVis包 1475.3.4 htmlwidgets包 1485.3.5 shiny包 1535.4 小結 1635.5 上機實驗 163第二部分 建模應用篇第6章 分類與預測 1666.1 回歸分析 1666.2 決策樹 1756.2.1 C4.5算法 1766.2.2 CART算法 1786.2.3 C5.0算法 1806.3 人工神經網絡 1816.4 KNN算法 1836.5 朴素貝葉斯分類 1856.6 其他分類與預測算法函數 1876.7 分類與預測算法評價 1926.8 小結 1966.9 上機實驗 196第7章 聚類分析 1987.1 K-Means聚類分析函數 1997.2 層次聚類算法 2047.3 其他聚類分析函數 2077.4 小結 2117.5 上機實驗 212第8章 關聯規則 2138.1 Apriori關聯規則 2148.2 小結 2268.3 上機實驗 226第9章 智能推薦 2289.1 智能推薦模型構建 2289.2 智能推薦模型評價 2329.3 小結 2359.4 上機實驗 235第10章 時間序列 23710.1 ARIMA模型 23710.2 其他時間序列模型 24510.3 小結 25010.4 上機實驗 251第三部分 Rattle篇第11章 可視化數據挖掘工具Rattle 25411.1 Rattle簡介及其安裝 25411.1.1 Rattle簡介 25411.1.2 Rattle安裝 25411.2 功能預覽 25511.3 數據導入 25611.3.1 導入CSV數據 25611.3.2 導入ARFF數據 26111.3.3 導入ODBC數據 26211.3.4 R Dataset--導入其他數據源 26411.3.5 導入RData File數據集 26711.3.6 導入Library數據 26811.4 數據探索 26911.4.1 數據總體概況 26911.4.2 數據分布探索 27211.4.3 相關性 27511.4.4 主成分 27711.4.5 交互圖 27811.5 數據建模 28311.5.1 聚類分析 28311.5.2 關聯規則 28811.5.3 決策樹 29111.5.4 隨機森林 29311.6 模型評估 29611.6.1 混淆矩陣 29611.6.2 風險圖 29611.6.3 ROC圖及相關圖表 29711.6.4 模型得分數據集 29811.7 小結 29911.8 上機實驗 299參考資料 301


相關書籍