你好,請登錄
免費注冊
我的訂單
◇
我的京東
京東會(huì )員
企業(yè)采購
◇
手機京東
◇
關(guān)注京東
◇
客戶(hù)服務(wù)
◇
網(wǎng)站導航
京東
搜索
>
我的購物車(chē)
實(shí)用指南
安裝服務(wù)
名詞解釋
常見(jiàn)問(wèn)題
購買(mǎi)須知
品牌故事
更多
評測體驗
幫助中心
家電知識
美容美妝
居家生活
裝修知識
養生健康
母嬰知識
男裝女裝
數碼電子
運動(dòng)戶(hù)外
京東服務(wù)幫
情感生活
星座知識
婚假知識
花草植物
互聯(lián)網(wǎng)醫院
互聯(lián)網(wǎng)醫療
資訊
趣味測試
精選
熱門(mén)
手機
生活
風(fēng)尚
親子
數碼
美食
女神
型男
運動(dòng)
汽車(chē)
家居
家電
休閑
樂(lè )器 京東母嬰
廣告
家用電器
廚具
寵物生活
電腦、辦公
服飾內衣
個(gè)人護理
家紡
家居日用
家具
家庭清潔/紙品
家裝建材
酒類(lèi)
禮品
美妝護膚
母嬰
汽車(chē)用品
生鮮
食品飲料
玩具樂(lè )器
鞋靴
醫藥保健
鐘表
珠寶首飾
手機通訊
圖書(shū)
母嬰行業(yè)資訊
測試
京東介紹
當前位置 :
首頁(yè)
>
圖書(shū)
>
正文
數據科學(xué):理論、方法與R語(yǔ)言實(shí)踐簡(jiǎn)介,目錄書(shū)摘
2020-04-30 17:25
來(lái)源:京東
作者:京東
數據科學(xué):理論、方法與R語(yǔ)言實(shí)踐
暫無(wú)報價(jià)
100+評論
100%好評
內容簡(jiǎn)介: 本書(shū)從實(shí)用的角度較為全面地展現了數據科學(xué)的主要內容,并結合大量的實(shí)際項目案例,利用R語(yǔ)言詳細地講解了數據項目的開(kāi)發(fā)過(guò)程和關(guān)鍵技術(shù)。本書(shū)包括三個(gè)部分共11章的內容,主要介紹了數據科學(xué)項目的處理過(guò)程、選擇合適的建模方法,也討論了bagging算法、隨機森林、廣義加性模型、核和支持向量機等高級建模方法。此外,還討論了文檔編制和結果部署,以及如何向組織內不同的受眾展現項目結果。本書(shū)適合作為高等院校高年級本科生和研究生及從事數據管理與分析工程技術(shù)人員的主要參考書(shū)。
目錄:譯者序
序言
前言
第一部分 數據科學(xué)引論
第1章 數據科學(xué)處理過(guò)程2
1.1 數據科學(xué)項目中的角色2
1.2 數據科學(xué)項目的階段4
1.2.1 制定目標5
1.2.2 收集和管理數據5
1.2.3 建立模型7
1.2.4 模型評價(jià)和批判8
1.2.5 展現和編制文檔9
1.2.6 模型部署和維護10
1.3 設定預期11
1.4 小結12
第2章 向R加載數據14
2.1 運用文件中的數據14
2.1.1 在源自文件或URL的良結構數據上使用R15
2.1.2 在欠結構數據上使用R17
2.2 在關(guān)系數據庫上使用R19
2.2.1 一個(gè)生產(chǎn)規模的示例20
2.2.2 從數據庫向R系統加載數據23
2.2.3 處理PUMS數據25
2.3 小結28
第3章 探索數據29
3.1 使用概要統計方法發(fā)現問(wèn)題30
3.2 用圖形和可視化方法發(fā)現問(wèn)題34
3.2.1 可視化檢測單變量的分布35
3.2.2 可視化檢測兩個(gè)變量間的關(guān)系42
3.3 小結51
第4章 管理數據52
4.1 清洗數據52
4.1.1 處理缺失值52
4.1.2 數據轉換56
4.2 為建模和驗證采樣61
4.2.1 測試集和訓練集的劃分61
4.2.2 創(chuàng )建一個(gè)樣本組列62
4.2.3 記錄分組63
4.2.4 數據溯源63
4.3 小結63
第二部分 建模方法
第5章 選擇和評價(jià)模型66
5.1 將業(yè)務(wù)問(wèn)題映射到機器學(xué)習任務(wù)67
5.1.1 解決分類(lèi)問(wèn)題67
5.1.2 解決打分問(wèn)題68
5.1.3 目標未知情況下的處理69
5.1.4 問(wèn)題到方法的映射71
5.2 模型評價(jià)71
5.2.1 分類(lèi)模型的評價(jià)72
5.2.2 打分模型的評價(jià)76
5.2.3 概率模型的評價(jià)78
5.2.4 排名模型的評價(jià)82
5.2.5 聚類(lèi)模型的評價(jià)82
5.3 模型驗證84
5.3.1 常見(jiàn)的模型問(wèn)題的識別 84
5.3.2 模型可靠性的量化85
5.3.3 模型質(zhì)量的保證86
5.4 小結88
第6章 記憶化方法89
6.1 KDD和KDD Cup 200989
6.2 構建單變量模型91
6.2.1 使用類(lèi)別型特征92
6.2.2 使用數值型特征94
6.2.3 使用交叉驗證估計過(guò)擬合的影響96
6.3 構建多變量模型97
6.3.1 變量選擇97
6.3.2 使用決策樹(shù)99
6.3.3 使用最近鄰方法102
6.3.4 使用樸素貝葉斯105
6.4 小結108
第7章 線(xiàn)性回歸與邏輯斯諦回歸110
7.1 使用線(xiàn)性回歸110
7.1.1 理解線(xiàn)性回歸110
7.1.2 構建線(xiàn)性回歸模型113
7.1.3 預測114
7.1.4 發(fā)現關(guān)系并抽取建議117
7.1.5 解讀模型概要并刻畫(huà)系數質(zhì)量118
7.1.6 線(xiàn)性回歸要點(diǎn)122
7.2 使用邏輯斯諦回歸123
7.2.1 理解邏輯斯諦回歸123
7.2.2 構建邏輯斯諦回歸模型124
7.2.3 預測125
7.2.4 從邏輯斯諦回歸模型中發(fā)現關(guān)系并抽取建議129
7.2.5 解讀模型概要并刻畫(huà)系數130
7.2.6 邏輯斯諦回歸要點(diǎn)136
7.3 小結137
第8章 無(wú)監督方法138
8.1 聚類(lèi)分析138
8.1.1 距離139
8.1.2 準備數據 140
8.1.3 使用hclust()進(jìn)行層次聚類(lèi)142
8.1.4 k-均值算法150
8.1.5 分派新的點(diǎn)到簇154
8.1.6 聚類(lèi)要點(diǎn)156
8.2 關(guān)聯(lián)規則156
8.2.1 關(guān)聯(lián)規則概述156
8.2.2 問(wèn)題舉例157
8.2.3 使用arules程序包挖掘關(guān)聯(lián)規則158
8.2.4 關(guān)聯(lián)規則要點(diǎn)165
8.3 小結165
第9章 高級方法探索166
9.1 使用bagging和隨機森林方法減少訓練方差167
9.1.1 使用bagging方法改進(jìn)預測167
9.1.2 使用隨機森林方法進(jìn)一步改進(jìn)預測170
9.1.3 bagging和隨機森林方法要點(diǎn)173
9.2 使用廣義加性模型學(xué)習非單調關(guān)系173
9.2.1 理解GAM174
9.2.2 一維回歸示例174
9.2.3 提取非線(xiàn)性關(guān)系178
9.2.4 在真實(shí)數據上使用GAM179
9.2.5 使用GAM實(shí)現邏輯斯諦回歸182
9.2.6 GAM要點(diǎn)183
9.3 使用核方法提高數據可分性183
9.3.1 理解核函數184
9.3.2 在問(wèn)題中使用顯式核函數187
9.3.3 核方法要點(diǎn)190
9.4 使用SVM對復雜的決策邊界建模190
9.4.1 理解支持向量機190
9.4.2 在人工示例數據中使用SVM192
9.4.3 在真實(shí)數據中使用SVM195
9.4.4 支持向量機要點(diǎn)197
9.5 小結197
第三部分 結果交付
第10章 文檔編制和部署200
10.1 buzz數據集200
10.2 使用knitr產(chǎn)生里程碑文檔202
10.2.1 knitr是什么202
10.2.2 knitr 技術(shù)詳解204
10.2.3 使用knitr編寫(xiě)buzz數據文檔205
10.3 在運行時(shí)文檔編制中使用注釋和版本控制208
10.3.1 編寫(xiě)有效注釋208
10.3.2 使用版本控制記錄歷史209
10.3.3 使用版本控制探索項目213
10.3.4 使用版本控制分享工作217
10.4 模型部署220
10.4.1 將模型部署為R HTTP服務(wù)220
10.4.2 按照輸出部署模型222
10.4.3 要點(diǎn)223
10.5 小結224
第11章 有效的結果展現226
11.1 將結果展現給項目出資方227
11.1.1 概述項目目標228
11.1.2 陳述項目結果229
11.1.3 補充細節230
11.1.4 提出建議并討論未來(lái)工作231
11.1.5 向項目出資方展現的要點(diǎn)232
11.2 向最終用戶(hù)展現模型232
11.2.1 概述項目目標232
11.2.2 展現模型如何融入用戶(hù)的工作流程233
11.2.3 展現如何使用模型235
11.2.4 向最終用戶(hù)展現的要點(diǎn)236
11.3 向其他數據科學(xué)家展現你的工作236
11.3.1 介紹問(wèn)題236
11.3.2 討論相關(guān)工作237
11.3.3 討論你的方法238
11.3.4 討論結果和未來(lái)工作239
11.3.5 向其他數據科學(xué)家展現的要點(diǎn)240
11.4 小結240
附錄A 使用R和其他工具241
附錄B 重要的統計學(xué)概念263
附錄C 更多的工具和值得探索的思路292
參考文獻297
索引299
相關(guān)商品
R語(yǔ)言入門(mén)與實(shí)踐(圖靈出品)
立即搶購
R&Python數據科學(xué)與機器學(xué)習實(shí)踐 贈送全部源代碼和數據文件 chatgpt聊天機器人python數據科學(xué)實(shí)戰入門(mén)r語(yǔ)言數據分析統計分析深度學(xué)習數據預處理統計建模人工智能深度學(xué)習ai
立即搶購
R語(yǔ)言入門(mén)與實(shí)踐
立即搶購
R語(yǔ)言空間數據處理與分析實(shí)踐教程
立即搶購
R語(yǔ)言與數據挖掘最佳實(shí)踐和經(jīng)典案例
立即搶購
R語(yǔ)言醫學(xué)數據分析實(shí)踐(大數據技術(shù)叢書(shū))
立即搶購
熱門(mén)推薦文章
1
信誼寶寶起步走:貓頭鷹 蝙蝠簡(jiǎn)介,目錄書(shū)摘
2
與死對話(huà)簡(jiǎn)介,目錄書(shū)摘
3
寶貝,你好 第一輯(套裝共2冊)簡(jiǎn)介,目錄書(shū)摘
4
GPS氣象學(xué)及其應用簡(jiǎn)介,目錄書(shū)摘
5
嵌入式Linux系統開(kāi)發(fā)入門(mén)寶典:基于A(yíng)RM Cortex-A8處理器簡(jiǎn)介,目錄書(shū)摘
6
標準西班牙語(yǔ)初級(下 學(xué)生用書(shū) 附光盤(pán))簡(jiǎn)介,目錄書(shū)摘
7
冰心獎獲獎作家原創(chuàng )書(shū)系:秘密領(lǐng)地簡(jiǎn)介,目錄書(shū)摘
8
心靈的習性簡(jiǎn)介讀后感,經(jīng)典語(yǔ)錄書(shū)評
9
Linux創(chuàng )客實(shí)戰簡(jiǎn)介,目錄書(shū)摘
10
古琴曲分析簡(jiǎn)介,目錄書(shū)摘
相關(guān)優(yōu)評榜
1
杰士派
相關(guān)排行榜
1
力格仕(REnex)護發(fā)素/乳排行榜
2
電腦報原文排行榜
3
網(wǎng)上幻燈片排行榜
4
電腦機械基礎套排行榜
5
帶五筆字根鍵盤(pán)排行榜
6
計算機組成與設計硬件軟件接口排行榜
相關(guān)產(chǎn)品
1
電腦初步知識
2
信息簡(jiǎn)史
3
遂寧網(wǎng)上書(shū)店
4
信息學(xué)導論
5
panelview
6
歐陽(yáng)崢崢
7
復雜系統理論基礎
8
電腦報合訂
9
唐為 綠色
10
互聯(lián)網(wǎng)電腦
11
信息學(xué)算法
12
數值分析與算法
13
新政
14
理論入門(mén)
15
電腦手寫(xiě)機械基礎
16
proe5.0產(chǎn)品設計
17
電腦字庫
18
電腦基礎教學(xué)
19
組裝電腦知識
20
計算模型導引
21
電腦基礎英語(yǔ)
22
電腦基本知識
23
嬰兒英式童裝哪款好?嬰兒英式童裝怎么樣好用嗎?
24
瑞士機械腕表,成功男人的好幫手
25
女童夏裙韓版哪款好?女童夏裙韓版怎么樣好用嗎?
26
開(kāi)心寶貝益智貼紙書(shū):IQ常識簡(jiǎn)介,目錄書(shū)摘
27
琺資(NECALIF)乳液/面霜舒緩鎮靜,滋潤,保濕,修護,補水
28
Lee Cooper 短袖 男士T恤 T7902-白色
29
去黑眼圈蘭蔻眼霜哪款好?去黑眼圈蘭蔻眼霜怎么樣好用嗎?
30
慈靈閣平安扣哪款好?慈靈閣平安扣怎么樣好用嗎?
知識庫
排行榜
新款
價(jià)格
京東智聯(lián)云
關(guān)鍵詞
圖片
廣告熱搜
網(wǎng)站地圖
多
品類(lèi)齊全,輕松購物
快
多倉直發(fā),極速配送
好
正品行貨,精致服務(wù)
省
天天低價(jià),暢選無(wú)憂(yōu)
購物指南
購物流程
會(huì )員介紹
生活旅行/團購
常見(jiàn)問(wèn)題
大家電
聯(lián)系客服
配送方式
上門(mén)自提
211限時(shí)達
配送服務(wù)查詢(xún)
配送費收取標準
海外配送
支付方式
貨到付款
在線(xiàn)支付
分期付款
郵局匯款
公司轉賬
售后服務(wù)
售后政策
價(jià)格保護
退款說(shuō)明
返修/退換貨
取消訂單
特色服務(wù)
奪寶島
DIY裝機
延保服務(wù)
京東E卡
京東通信
京東JD+
關(guān)于我們
|
聯(lián)系我們
|
聯(lián)系客服
|
合作招商
|
商家幫助
|
營(yíng)銷(xiāo)中心
|
手機京東
|
友情鏈接
|
銷(xiāo)售聯(lián)盟
|
京東社區
|
風(fēng)險監測
|
隱私政策
|
京東公益
|
English Site
|
Media & IR
京公網(wǎng)安備 11000002000088號
| 京ICP證070359號 |
互聯(lián)網(wǎng)藥品信息服務(wù)資格證編號(京)-經(jīng)營(yíng)性-2014-0008
| 新出發(fā)京零 字第大120007號
互聯(lián)網(wǎng)出版許可證編號新出網(wǎng)證(京)字150號 |
出版物經(jīng)營(yíng)許可證
|
網(wǎng)絡(luò )文化經(jīng)營(yíng)許可證京網(wǎng)文[2014]2148-348號
| 違法和不良信息舉報電話(huà):4006561155
Copyright © 2004-2019 京東JD.com 版權所有 | 消費者維權熱線(xiàn):4006067733
經(jīng)營(yíng)證照
京東旗下網(wǎng)站:
京東支付
|
京東云
亚洲精品乱码久久久97_国产伦子一区二区三区_久久99精品久久久欧美_天天看片永久av影城网页