第1章 數據挖掘概念
1.1 數據挖掘概述
1.1.1 什么是數據挖掘
1.1.2 數據挖掘常用算法概述
1.1.3 數據挖掘常用工具概述
1.2 數據探索
1.2.1 數據概述
1.2.2 數據質(zhì)量
1.2.3 數據預處理
1.3 數據挖掘的應用
1.3.1 數據挖掘現狀及發(fā)展趨勢
1.3.2 數據挖掘需要解決的問(wèn)題
1.3.3 數據挖掘的應用場(chǎng)景
1.4 作業(yè)與練習
參考文獻
第2章 分類(lèi)
2.1 分類(lèi)概述
2.1.1 分類(lèi)的基本概念
2.1.2 解決分類(lèi)問(wèn)題的一般方法
2.1.3 決策樹(shù)
案例:Web機器人檢測
2.1.4 模型的過(guò)分擬合
2.2 貝葉斯決策與分類(lèi)器
2.2.1 規則分類(lèi)器
2.2.2 分類(lèi)中貝葉斯定理的應用
2.2.3 分類(lèi)中樸素貝葉斯的應用
2.3 支持向量機
2.3.1 最大邊緣超平面
2.3.2 線(xiàn)性支持向量機SVM
2.3.3 非線(xiàn)性支持向量機SVM
2.4 分類(lèi)在實(shí)際場(chǎng)景中的應用案例
案例一:如何解決文章主題關(guān)鍵字與搜索引擎關(guān)鍵字帶來(lái)的檢索結果差異
案例二:甄別新金融交易方式的欺詐行為
案例三:在線(xiàn)廣告推薦中的分類(lèi)
2.5 作業(yè)與練習
參考文獻
第3章 聚類(lèi)
3.1 聚類(lèi)概述
3.1.1 聚類(lèi)的基本概念
3.1.2 聚類(lèi)算法
3.2 聚合分析方法
3.2.1 歐氏距離
3.2.2 聚合過(guò)程
3.2.3 聚類(lèi)樹(shù)
3.2.4 聚合分析方法應用例子
3.3 聚類(lèi)在實(shí)際場(chǎng)景中的應用案例
3.4 聚類(lèi)的實(shí)現例子
3.5 作業(yè)與練習
參考文獻
第4章 關(guān)聯(lián)規則
4.1 關(guān)聯(lián)規則概述
4.1.1 經(jīng)典案例導入
4.1.2 關(guān)聯(lián)規則的基本概念和定義
4.1.3 關(guān)聯(lián)規則的分類(lèi)
4.2 關(guān)聯(lián)規則的挖掘過(guò)程
4.2.1 知識回顧
4.2.2 頻繁項集產(chǎn)生
4.2.3 強關(guān)聯(lián)規則
4.2.4 關(guān)聯(lián)規則評價(jià)標準
4.3 關(guān)聯(lián)規則的Apriori算法
4.3.1 知識回顧
4.3.2 Apriori算法的核心思想
4.3.3 Apriori算法描述
4.3.4 Apriori算法評價(jià)
4.3.5 Apriori算法改進(jìn)
4.4 關(guān)聯(lián)規則的FP-growth算法
4.4.1 構建FP樹(shù)
4.4.2 從FP樹(shù)中挖掘頻繁項集
4.5 實(shí)戰:關(guān)聯(lián)規則挖掘實(shí)例
4.5.1 關(guān)聯(lián)規則挖掘技術(shù)在國內外的應用現狀
4.5.2 關(guān)聯(lián)規則應用實(shí)例
4.5.3 關(guān)聯(lián)規則在大型超市中應用的步驟
4.6 作業(yè)與練習
參考文獻
第5章 綜合實(shí)戰—日志的挖掘與應用
5.1 日志概念
5.1.1 日志是什么
5.1.2 日志能做什么
5.2 日志處理
5.2.1 產(chǎn)生日志
5.2.2 傳輸日志
5.2.3 存儲日志
5.2.4 分析日志
5.2.5 日志規范與標準
5.3 日志分析原理及工具
5.3.1 日志分析原理
5.3.2 日志分析工具
5.3.3 日志分析系統規劃建設
5.4 日志挖掘應用
5.4.1 安全運維
5.4.2 系統健康分析
5.4.3 用戶(hù)行為分析
5.4.4 業(yè)務(wù)分析設計
5.5 日志分析挖掘實(shí)例
5.6 作業(yè)與練習
參考文獻
第6章 數據挖掘應用案例
6.1 電力行業(yè)采用聚類(lèi)方法進(jìn)行主變油溫分析
6.1.1 需求背景及采用的大數據分析方法
6.1.2 大數據分析方法的實(shí)現過(guò)程
6.1.3 大數據分析方法的實(shí)現結果
6.2 銀行信貸評價(jià)
6.2.1 簡(jiǎn)介
6.2.2 神經(jīng)網(wǎng)絡(luò )模型
6.2.3 實(shí)證檢驗
6.3 指數預測
6.3.1 金融時(shí)間序列概況
6.3.2 小波消噪
6.3.3 向量機
6.3.4 指數預測
6.4 客戶(hù)分群的精準智能營(yíng)銷(xiāo)
6.4.1 挖掘目標
6.4.2 分析方法和過(guò)程
6.4.3 建模仿真
6.5 使用WEKA進(jìn)行房屋定價(jià)
6.6 作業(yè)與練習
參考文獻
附錄A 大數據和人工智能實(shí)驗環(huán)境
附錄B Hadoop環(huán)境要求
附錄C 名詞解釋