Python數據分析與挖掘實戰 | 被動收入的投資秘訣 - 2024年7月

Python數據分析與挖掘實戰

作者:張良均,王路,譚立雲,蘇劍林等
出版社:機械工業
出版日期:2016年01月01日
ISBN:9787111521235
語言:繁體中文
售價:360元

第一部分是基礎篇(第1~5章),第1章的主要內容是數據挖掘概述;第2章對Python以及本書所用到的數據挖掘建模庫進行了簡明扼要的說明;第3章、第4章、第5章對數據挖掘的建模過程,包括數據探索、數據預處理及挖掘建模的常用算法與原理進行了介紹。第二部分是實戰篇(第6~15章),重點對數據挖掘技術在電力、航空、醫療、互聯網、生產制造以及公共服務等行業的應用進行了分析。在案例結構組織上,本書是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最后完成模型構建的順序進行的,在建模過程關鍵環節,穿插程序實現代碼。最后通過上機實踐,加深數據挖掘技術在案例應用中的理解。張良均,資深大數據挖掘專家和模式識別專家,有10多年的大數據挖掘應用、咨詢經驗,10余年數據倉庫系統管理與實施經驗,超過10年的系統開發與設計經驗。為電信、電力、互聯網、生產制造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘應用與咨詢服務,實踐經驗非常豐富。此外,他精通Java EE企業級應用開發,是廣東工業大學和華南師范大學兼職教授,著有《神經網絡實用教程》、《數據挖掘:實用案例分析》等暢銷書。

前言 基礎篇 第1章數據挖掘基礎 1.1某知名連鎖餐飲企業的困惑 1.2從餐飲服務到數據挖掘 1.3數據挖掘的基本任務 1.4數據挖掘建模過程 1.4.1定義挖掘目標 1.4.2數據取樣 1.4.3數據探索 1.4.4數據預處理 1.4.5挖掘建模 1.4.6模型評價 1.5常用的數據挖掘建模工具 1.6小結 每2章Python數據分析簡介 2.1搭建Python開發平台 2.1.1所要考慮的問題 2.1.2基礎平台的搭建 2.2Python使用入門 2.2.1運行方式 2.2.2基本命令 2.2.3數據結構 2.2.4庫的導入與添加 2.3Python數據分析工具 2.3.1Numpy 2.3.2Scipy 2.3.3Matplotlib 2.3.4Pandas 2.3.5StatsModels 2.3.6Scikit—Leam 2.3.7Keras 2.3.8Gensim 2.4配套資源使用設置 2.5小結 第3章數據探索 3.1數據質量分析 3.1.1缺失值分析 3.1.2異常值分析 3.1.3—致性分析 3.2數據特征分析 3.2.1分布分析 3.2.2對比分析 3.2.3統計量分析 3.3Python主要數據探索函數 3.3.1基本統計特征函數 3.3.2拓展統計特征函數 3.3.3統計作圖函數 3.4小結 數據預處理 4.1數據清洗 4.1.1缺失值處理 4.1.2異常值處理 4.2數據集成 4.2.1實體識別 4.2.2冗余屬性識別 413數據變換 4.3.1簡單函數變換 4.3.2規范化 4.3.3連續屬性離散化 4.3.4屬性構造 4.3.5小波變換 4.4數據規約 4.4.1屬性規約 4.4.2數值規約 4.5Python主要數據預處理函數 4.6小結 第5章挖掘建模 5.1分類與預測 5.1.1實現過程 5.1.2常用的分類與預測算法 5.1.3回歸分析 5.1.4決策樹 5.1.5人工神經網絡 5.1.6分類與預測算法評價 5.1.7Python分類預測模型特點 5.2聚類分析 5.2.1常用聚類分析算法 5.2.2K—Means聚類算法 5.2.3聚類分析算法評價 5.2.4Python主要聚類分析算法 5.3關聯規則 5.3.1常用關聯規則算法 5.3.2Apriori算法 5.4時序模式 5.4.1時間序列算法 5.4.2時間序列的預處理 5.4.3平穩時間序列分析 5.4.4非平穩時間序列分析 5.4.5Python主要時序模式算法 5.5離群點檢測134 5.5.1離群點檢測方法 5.5.2基於模型的離群點檢測方法 5.5.3基於聚類的離群點檢測方法 5.6小結 實戰篇 第6章電力竊漏電用戶自動識別 6.1背景與挖掘目標 6.2分析方法與過程 6.2.1數據抽取 6.2.2數據探索分析 6.2.3數據預處理 6.2.4構建專家樣本 6.3上機實驗 6.4拓展思考 6.5小結 第7章航空公司客戶價值分析 7.1背景與挖掘目標 7.2分析方法與過程 7.2.1數據抽取 7.2.2數據探索分析 7.2.3數據預處理 7.2.4模型構建 7.3上機實驗 7.4拓展思考 7.5小結 第8章中醫證型關聯規則挖掘 8.1背景與挖掘目標 8.2分析方法與過程 8.2.1數據獲取 8.2.2數據預處理 8.2.3模型構建 8.3上機實驗 8.4拓展思考 8.5小結 第9章基於水色圖像的水質評價 9.1背景與挖掘目標 9.2分析方法與過程 9.2.1數據預處理 9.2.2模型構建 9.2.3水質評價 9.3上機實驗 9.4拓展思考 9.5小結 第10章家用電器用戶行為分析與事件識別 10.1背景與挖掘目標 10.2分析方法與過程 10.2.1數據抽取 10.2.2數據探索分析 10.2.3數據預處理 10.2.4模型構建 10.2.5模型檢驗 10.3上機實驗 10.4拓展思考 10.5小結 第11章應用系統負載分析與磁盤容量預測 11.1背景與挖掘目標 11.2分析方法與過程 11.2.1數據抽取 11.2.2數據探索分析 11.2.3數據預處理 11.2.4模型構建 11.3上機實驗 11.4拓展思考 11.5小結 第12章電子商務網站用戶行為分析及服務推薦 12.1背景與挖掘目標 12.2分析方法與過程 12.2.1數據抽取 12.2.2數據探索分析 12.2.3數據預處理 12.2.4模型構建 12.3上機實驗 12.4拓展思考 12.5小結 第13章財政收入影響因素分析及 13.1預測模型 13.2背景與挖掘目標 分析方法與過程 13.2.1灰色預測與神經網絡的組合模型 13.2.2數據探索分析 13.2.3模型構建 13.3上機實驗 13.4拓展思考 13.5小結 第14章基於基站定位數據的商圈分析 14.1背景與挖掘目標 14.2分析方法與過程 14.2.1數據抽取 14.2.2數據探索分析 14.2.3數據預處理 14.2.4模型構建 14.3上機實驗 14.4拓展思考 14.5小結 第15章電商產品評論數據情感分析 15.1背景與挖掘目標 15.2分析方法與過程 15.2.1評論數據采集 15.2.2評論預處理 15.2.3文本評論分詞 15.2.4模型構建 15.3上機實驗 15.4拓展思考 15.5小結 參考文獻


相關書籍