• <em id="pai5d"></em><sup id="pai5d"></sup>
    
    

    <small id="pai5d"><rp id="pai5d"></rp></small>
    <option id="pai5d"></option>

    
    
  • <sup id="pai5d"></sup>
    <em id="pai5d"><label id="pai5d"></label></em>

  • <s id="pai5d"></s>
    當前位置 : 首頁(yè)  圖書(shū) 正文

    Spark機器學(xué)習進(jìn)階實(shí)戰簡(jiǎn)介,目錄書(shū)摘

    2020-04-15 09:47 來(lái)源:京東 作者:京東
    機器學(xué)習實(shí)戰
    Spark機器學(xué)習進(jìn)階實(shí)戰
    暫無(wú)報價(jià)
    200+評論 98%好評
    編輯推薦:
    內容簡(jiǎn)介:全書(shū)一共分三大部分:
    基礎篇(1-2章)對Spark機器學(xué)習進(jìn)行概述、并通過(guò)Spark機器學(xué)習開(kāi)始進(jìn)行數據分析;
    算法篇(3-8章)針對分類(lèi)、聚類(lèi)、回歸、協(xié)同過(guò)濾、關(guān)聯(lián)規則、降維等算法進(jìn)行詳細講解,并進(jìn)行案例支持;
    綜合案例篇(9-12章)重點(diǎn)通過(guò)異常檢測、用戶(hù)畫(huà)像、廣告點(diǎn)擊率預估、智慧交通大數據4個(gè)綜合場(chǎng)景,詳細講解基于Spark機器學(xué)習的綜合應用。
    作者簡(jiǎn)介:
    目錄:前 言
    第一篇 基礎篇
    第1章 機器學(xué)習概述 2
    1.1 機器學(xué)習概述 2
    1.1.1 理解大數據 2
    1.1.2 機器學(xué)習發(fā)展過(guò)程 4
    1.1.3 大數據生態(tài)環(huán)境 5
    1.2 機器學(xué)習算法 6
    1.2.1 傳統機器學(xué)習 6
    1.2.2 深度學(xué)習 8
    1.2.3 其他機器學(xué)習 8
    1.3 機器學(xué)習分類(lèi) 9
    1.3.1 監督學(xué)習 9
    1.3.2 無(wú)監督學(xué)習 10
    1.3.3 半監督學(xué)習 10
    1.3.4 強化學(xué)習 10
    1.4 機器學(xué)習綜合應用 11
    1.4.1 異常檢測 12
    1.4.2 用戶(hù)畫(huà)像 12
    1.4.3 廣告點(diǎn)擊率預估 12
    1.4.4 企業(yè)征信大數據應用 12
    1.4.5 智慧交通大數據應用 13
    1.5 本章小結 13
    第2章 數據分析流程和方法 14
    2.1 數據分析概述 14
    2.2 數據分析流程 15
    2.2.1 業(yè)務(wù)調研 16
    2.2.2 明確目標 16
    2.2.3 數據準備 16
    2.2.4 特征處理 17
    2.2.5 模型訓練與評估 21
    2.2.6 輸出結論 23
    2.3 數據分析的基本方法 24
    2.3.1 匯總統計 24
    2.3.2 相關(guān)性分析 25
    2.3.3 分層抽樣 26
    2.3.4 假設檢驗 26
    2.4 簡(jiǎn)單的數據分析實(shí)踐 27
    2.4.1 環(huán)境準備 27
    2.4.2 準備數據 28
    2.4.3 數據分析 29
    2.5 本章小結 30
    第二篇 算法篇
    第3章 構建分類(lèi)模型 32
    3.1 分類(lèi)模型概述 32
    3.2 分類(lèi)模型算法 34
    3.2.1 邏輯回歸 34
    3.2.2 樸素貝葉斯模型 36
    3.2.3 SVM模型 37
    3.2.4 決策樹(shù)模型 39
    3.2.5 K-近鄰 40
    3.3 分類(lèi)效果評估 40
    3.3.1 正確率 41
    3.3.2 準確率、召回率和F1值 41
    3.3.3 ROC和AUC 42
    3.4 App數據的分類(lèi)實(shí)現 44
    3.4.1 選擇分類(lèi)器 44
    3.4.2 準備數據 45
    3.4.3 訓練模型 46
    3.4.4 模型性能評估 48
    3.4.5 模型參數調優(yōu) 49
    3.5 其他分類(lèi)模型 50
    3.5.1 隨機森林 50
    3.5.2 梯度提升樹(shù) 51
    3.5.3 因式分解機模型 51
    3.6 本章小結 52
    第4章 構建聚類(lèi)模型 53
    4.1 聚類(lèi)概述 53
    4.2 聚類(lèi)模型 54
    4.2.1 KMeans聚類(lèi) 54
    4.2.2 DBSCAN聚類(lèi) 55
    4.2.3 主題聚類(lèi) 56
    4.3 聚類(lèi)效果評價(jià) 58
    4.3.1 集中平方誤差和 58
    4.3.2 Purity評價(jià)法 59
    4.4 使用KMeans對鳶尾花卉數據集聚類(lèi) 59
    4.4.1 準備數據 59
    4.4.2 特征處理 60
    4.4.3 聚類(lèi)分析 60
    4.4.4 模型性能評估 62
    4.5 使用DBSCAN對GPS數據進(jìn)行聚類(lèi) 62
    4.5.1 準備數據 63
    4.5.2 特征處理 64
    4.5.3 聚類(lèi)分析 64
    4.5.4 模型參數調優(yōu) 65
    4.6 其他模型 66
    4.6.1 層次聚類(lèi) 66
    4.6.2 基于圖的聚類(lèi) 67
    4.6.3 混合聚類(lèi)模型 67
    4.7 本章小結 68
    第5章 構建回歸模型 69
    5.1 常用回歸模型 69
    5.1.1 線(xiàn)性回歸模型 70
    5.1.2 回歸樹(shù)模型 70
    5.1.3 其他回歸模型 71
    5.2 評估指標 73
    5.3 回歸模型優(yōu)化 74
    5.3.1 特征選擇 74
    5.3.2 特征變換 74
    5.4 構建UCI裙子銷(xiāo)售數據回歸模型 75
    5.4.1 準備數據 75
    5.4.2 訓練模型 78
    5.4.3 評估效果 79
    5.4.4 模型優(yōu)化 79
    5.5 其他回歸模型案例 80
    5.5.1 GDP影響因素分析 81
    5.5.2 大氣污染分析 81
    5.5.3 大數據比賽中的回歸問(wèn)題 81
    5.6 本章小結 82
    第6章 構建關(guān)聯(lián)規則模型 83
    6.1 關(guān)聯(lián)規則概述 83
    6.2 常用關(guān)聯(lián)規則算法 84
    6.2.1 Apriori算法 84
    6.2.2 FP-Growth算法 85
    6.3 效果評估和優(yōu)化 86
    6.3.1 效果評估 86
    6.3.2 效果優(yōu)化 87
    6.4 使用FP-Growth對豆瓣評分數據進(jìn)行挖掘 88
    6.4.1 準備數據 89
    6.4.2 訓練模型 89
    6.4.3 觀(guān)察規則 91
    6.4.4 參數調優(yōu) 91
    6.4.5 使用算法 92
    6.5 其他應用場(chǎng)景 94
    6.6 本章小結 96
    第7章 協(xié)同過(guò)濾 97
    7.1 協(xié)同過(guò)濾概述 97
    7.2 常用的協(xié)同過(guò)濾算法 98
    7.2.1 基于用戶(hù)的協(xié)同過(guò)濾 99
    7.2.2 基于物品的協(xié)同過(guò)濾 100
    7.2.3 矩陣分解技術(shù) 101
    7.2.4 推薦算法的選擇 102
    7.3 評估標準 103
    7.3.1 準確率 103
    7.3.2 覆蓋率 103
    7.3.3 多樣性 104
    7.3.4 其他指標 104
    7.4 使用電影評分數據進(jìn)行協(xié)同過(guò)濾實(shí)踐 104
    7.4.1 準備數據 105
    7.4.2 訓練模型 106
    7.4.3 測試模型 109
    7.4.4 使用ALS結果 111
    7.5 本章小結 112
    第8章 數據降維 113
    8.1 降維概述 113
    8.2 常用降維算法 114
    8.2.1 主成分分析 114
    8.2.2 奇異值分解 116
    8.2.3 廣義降維 117
    8.2.4 文本降維 118
    8.3 降維評估標準 121
    8.4 使用PCA對Digits數據集進(jìn)行降維 122
    8.4.1 準備數據 122
    8.4.2 訓練模型 123
    8.4.3 分析降維結果 124
    8.5 其他降維方法 124
    8.5.1 線(xiàn)性判別分析 124
    8.5.2 局部線(xiàn)性嵌入 125
    8.5.3 拉普拉斯特征映射 125
    8.6 本章小結 126
    第三篇 綜合應用篇
    第9章 異常檢測 128
    9.1 異常概述 128
    9.1.1 異常的產(chǎn)生 129
    9.1.2 異常檢測的分類(lèi) 129
    9.2 異常檢測方法 130
    9.2.1 基于模型的方法 130
    9.2.2 基于鄰近度的方法 131
    9.2.3 基于密度的方法 132
    9.2.4 基于聚類(lèi)的方法 133
    9.3 異常檢測系統 133
    9.3.1 異常檢測過(guò)程 133
    9.
    熱門(mén)推薦文章
    相關(guān)優(yōu)評榜
    品類(lèi)齊全,輕松購物 多倉直發(fā),極速配送 正品行貨,精致服務(wù) 天天低價(jià),暢選無(wú)憂(yōu)
    購物指南
    購物流程
    會(huì )員介紹
    生活旅行/團購
    常見(jiàn)問(wèn)題
    大家電
    聯(lián)系客服
    配送方式
    上門(mén)自提
    211限時(shí)達
    配送服務(wù)查詢(xún)
    配送費收取標準
    海外配送
    支付方式
    貨到付款
    在線(xiàn)支付
    分期付款
    郵局匯款
    公司轉賬
    售后服務(wù)
    售后政策
    價(jià)格保護
    退款說(shuō)明
    返修/退換貨
    取消訂單
    特色服務(wù)
    奪寶島
    DIY裝機
    延保服務(wù)
    京東E卡
    京東通信
    京東JD+
    亚洲精品乱码久久久97_国产伦子一区二区三区_久久99精品久久久欧美_天天看片永久av影城网页
  • <em id="pai5d"></em><sup id="pai5d"></sup>
    
    

    <small id="pai5d"><rp id="pai5d"></rp></small>
    <option id="pai5d"></option>

    
    
  • <sup id="pai5d"></sup>
    <em id="pai5d"><label id="pai5d"></label></em>

  • <s id="pai5d"></s>