大數據分析師權威教程:機器學習、大數據分析和可視化 | 被動收入的投資秘訣 - 2024年5月

大數據分析師權威教程:機器學習、大數據分析和可視化

作者:WROX國際IT認證項目組
出版社:人民郵電
出版日期:2017年08月01日
ISBN:9787115456892
語言:繁體中文

「大數據」已連年入選IT領域的熱點話題,人們每天都會通過互聯網、移動設備等生產大量數據。如何從海量數據中洞悉出隱藏其后的見解是當今社會各領域人士極為關注的話題。本系列圖書以「大數據分析師」應掌握的IT技術為主線,共分兩卷,以7個模塊(第1卷含4個模塊,第2卷含3個模塊)分別介紹大數據入門,分析和R編程入門,使用R進行數據分析,用R進行高級分析,機器學習的概念,社交媒體、移動分析和可視化,大數據分析的行業應用等核心內容,全面且詳盡地涵蓋了大數據分析的各個領域。國際知名IT培訓機構中的多名大牛講師,通過對技術、IT市場需求以及當今就業培訓方面的全球行業標准進行了廣泛並嚴格的調研之后,開發而成。作者們的這些計划的構思目標是,成為理想的就業能力培訓項目,為那些有志於在國際IT行業取得事業成功的人提供服務。

模塊1 機器學習的概念第1講 理解機器學習技術 31.1 什麼是機器學習 41.1.1 數據挖掘與機器學習之間的差異 51.1.2 SpamAssassin特性 61.2 機器學習的應用 81.2.1 圖像識別 81.2.2 語音識別 101.2.3 醫療診斷 101.2.4 統計套利 111.2.5 關聯學習 111.2.6 分類 111.2.7 預測 121.2.8 提取 131.2.9 回歸 131.2.10 概率 131.3 機器學習的類型 141.3.1 有監督學習 141.3.2 無監督學習 151.3.3 強化學習 151.4 機器學習方法 161.4.1 決策樹學習 161.4.2 關聯規則學習 161.4.3 人工神經網絡 171.4.4 歸納邏輯編程 171.4.5 支持向量機 171.4.6 聚類 181.4.7 貝葉斯網絡 181.4.8 強化學習 181.4.9 表示學習 181.4.10 相似性和度量學習 181.4.11 稀疏字典學習 191.5 機器學習算法列表 19練習 22備忘單 24第2講 R上的圖模型和貝葉斯網絡 252.1 圖模型簡介 262.1.1 圖模型的類型 302.1.2 圖中的條件獨立性 322.1.3 圖中的條件獨立性與分割 332.1.4 圖的分解或者因子化 352.1.5 圖模型的應用 362.2 案例研究——圖模型在大眾公司的應用 372.2.1 背景 372.2.2 問題 372.2.3 解決方案 382.3 貝葉斯統計簡介 382.3.1 貝葉斯定理 392.3.2 貝葉斯網絡 392.4 貝葉斯網絡特性 432.5 貝葉斯網絡中的概率推理 492.5.1 推斷未觀測變量 492.5.2 參數學習 492.5.3 結構學習 492.6 貝葉斯方法 512.6.1 變量消除 512.6.2 動態編程 522.6.3 逼近算法 522.7 貝葉斯網絡的應用 54練習 57備忘單 59第3講 人工神經網絡 603.1 神經網絡簡介 623.2 神經網絡的應用 653.3 神經網絡的結構 663.4 人工神經網絡模型 683.4.1 多層感知器 683.4.2 徑向基函數網絡 693.4.3 Kohonen網絡 703.5 學習規則 723.5.1 Hebbian學習規則 733.5.2 感知器學習規則 733.5.3 Delta學習規則(Windrow—Hoff學習規則) 743.5.4 相關學習規則 743.5.5 外向星學習規則 743.6 神經網絡訓練算法 753.6.1 梯度下降 763.6.2 演化算法 773.6.3 遺傳算法 783.7 在R中實現神經網絡 80練習 84備忘單 87第4講 在R中使用PCA和因子分析降維 884.1 降維簡介 904.2 降維的應用 914.2.1 文檔分類 914.2.2 基因表達微陣列分析 924.2.3 面部識別 934.3 因子分析 944.4 因子分析的應用 964.4.1 心理測驗學中的因子分析 964.4.2 營銷中的因子分析 974.5 因子分析方法 984.5.1 EFA和CFA的相似之處 984.5.2 EFA和CFA之間的差異 984.6 作為數據歸約方法的因子分析 994.6.1 確定因子數量的標准 1014.6.2 公因子方差 1024.6.3 因子載荷 1034.6.4 因子結構的旋轉 1044.6.5 旋轉策略 1044.6.6 因子結構的解讀 1054.6.7 層次化因子分析 1064.6.8 因子得分 1074.7 主成分分析 1074.7.1 主成分分析的顯著性 1084.7.2 主成分的提取 1084.7.3 主成分的特性 1084.7.4 主成分分析的特性 1094.8 主成分分析中的數據歸約和解讀 1094.8.1 投影於一個軸上的慣性 1104.8.2 距離 1104.8.3 逆方差 1104.8.4 協方差 1114.8.5 變量的范數 1124.8.6 因子軸 1124.8.7 因子平面 1124.8.8 主成分分析的目標 1134.8.9 相關矩陣的特征值 1134.8.10 變量的表示 1134.8.11 個體的表示 1144.8.12 主成分分析過程 1144.8.13 選擇主成分數量 1164.8.14 主成分分析的變種 1184.9 在R上實現主成分分析 1204.9.1 示例1:歐洲人的蛋白質消耗 1204.9.2 示例2:美國月度失業率 122練習 123備忘單 125第5講 支持向量機 1275.1 支持向量機簡介 1285.2 支持向量機的應用領域 1295.3 SVM算法 1315.3.1 可分情況 1325.3.2 不可分情況 1335.4 線性支持向量機 1355.4.1 原型 1355.4.2 對偶形式 1365.4.3 有偏和無偏超平面 1375.5 核函數 1375.5.1 核規則 1375.5.2 支持向量機核示例 1395.6 在R中訓練和測試SVM模型 1395.7 用SVM模型預測的實例 1435.7.1 數據集 1435.7.2 准備數據集 1445.7.3 選擇參數 1445.7.4 訓練模型 1455.7.5 測試模型 146練習 147備忘單 149模塊2 社交媒體、移動分析和可視化第1講 大數據解決方案工程 1531.1 大數據展望過程 1541.1.1 步驟1:研究和面談以理解業務活動 1551.1.2 步驟2:獲取和分析數據 1571.1.3 步驟3:對新思路展開頭腦風暴 1581.1.4 步驟4:排定大數據集用例的優先級 1591.1.5 步驟5:文檔 1601.2 大數據用例的優先級排定 1601.2.1 優先順序矩陣過程 1611.2.2 優先順序矩陣的陷阱 1621.3 解決方案工程過程 1641.3.1 第1步:理解組織是如何賺錢的 1641.3.2 第2步:識別組織的關鍵業務活動 1671.3.3 第3步:進行頭腦風暴,確定大數據在業務上的作用 1671.3.4 第4步:將業務活動分解為用例 1681.3.5 第5步:證明用例 1681.3.6 第6步:設計和實施大數據解決方案 1691.4 解決方案工程示例 1701.4.1 客戶行為分析 1711.4.2 減少欺詐行為 1721.5 大數據解決方案的挑戰 172練習 174備忘單 176第2講 社交媒體分析和文本分析 1772.1 什麼是社交媒體 1782.2 社交分析、指標和計量 1812.2.1 社交媒體分析工具 1812.2.2 社交媒體分析與業務決策 1822.2.3 社交媒體分析與其他分析類型的對比 1842.3 社交媒體分析的關鍵要素 1842.3.1 目標受眾 1842.3.2 預期行動 1852.3.3 內容 1852.3.4 內容機制 1852.3.5 社交媒體分析中使用的技術 1862.3.6 在線社交媒體分析工具 1872.3.7 社交媒體分析所用的桌面應用程序 1872.4 文本挖掘簡介 1882.4.1 文本挖掘工作方式 1892.4.2 文本挖掘的應用 1902.5 文本分析過程 1902.6 情緒分析 1922.6.1 情緒分析使用的方法 1932.6.2 在線情緒分析 1932.7 在R上實施Twitter情緒分析 194練習 203備忘單 205第3講 執行移動分析 2073.1 移動分析簡介 2083.1.1 什麼是移動分析 2093.1.2 移動分析和Web分析 2093.1.3 移動分析和商業價值 2103.1.4 移動分析結果類型 2103.1.5 移動分析應用類型 2113.1.6 使用移動分析的領域 2123.2 移動分析工具 2123.2.1 基於位置的跟蹤工具 2133.2.2 實時分析工具 2133.2.3 用戶行為跟蹤工具 2143.3 執行移動分析 2163.3.1 通過移動應用收集數據 2163.3.2 將數據收集到服務器 2173.4 應用分析報告 2183.5 移動分析的挑戰 2193.5.1 網絡問題 2193.5.2 安全性問題和政府協議 220練習 221備忘單 223第4講 大數據可視化 2254.1 什麼是可視化 2264.1.1 為什麼對數據進行可視化 2264.1.2 可視化技術 2274.1.3 可視化類型 2274.1.4 可視化的應用 2284.2 大數據可視化的重要性 2294.2.1 傳統信息可視化的不足 2294.2.2 大數據可視化的商業價值 2294.2.3 用可視化將數據變成信息 2304.2.4 使用不同工具的可視化示例 2314.2.5 大數據可視化中的障礙 2334.3 大數據可視化工具 2334.3.1 大數據可視化專屬服務 2344.3.2 開源可視化程序庫 2344.3.3 用於大數據可視化的技術 2354.4 Tableau產品 2354.4.1 用TableauDesktop創建可視化 2364.4.2 TableauDesktop工作區簡介 2394.4.3 多個工作表頁面 2404.4.4 Tableau工作區 2404.5 使用數據源 2464.5.1 用Tableau聯合數據庫表 2464.5.2 連接到SQL 2474.6 數據運算(排序、聚合、聯接) 2484.6.1 地圖和地理單元 2494.6.2 創建交互式可視化 251練習 254備忘單 256第5講 招聘准備 2585.1 大數據分析師所需要的關鍵技能 2605.2 大數據分析崗位職責 2625.2.1 初級分析師 2625.2.2 中級分析師 2635.2.3 高級分析師 2635.3 大數據工作機會領域 264……模塊3 大數據分析的行業應用


相關書籍