《R 語(yǔ)言數據分析項目精解:理論、方法、實(shí)戰》適合人群:
互聯(lián)網(wǎng)行業(yè)數據分析人員:通過(guò)閱讀《R 語(yǔ)言數據分析項目精解:理論、方法、實(shí)戰》,可以把學(xué)到的知識直接運用到生產(chǎn)實(shí)踐中。
互聯(lián)網(wǎng)產(chǎn)品運營(yíng)人員:通過(guò)閱讀《R 語(yǔ)言數據分析項目精解:理論、方法、實(shí)戰》,可以了解數據分析團隊一般是如何支持產(chǎn)品運營(yíng)人員的,以及數據分析團隊能幫助產(chǎn)品運營(yíng)人員干什么,產(chǎn)品運營(yíng)人員將來(lái)可以更好地給數據分析團隊提出分析需求。
統計專(zhuān)業(yè)高校生:《R 語(yǔ)言數據分析項目精解:理論、方法、實(shí)戰》可以作為行業(yè)實(shí)踐案例教材,在學(xué)習書(shū)本知識的同時(shí)更好地了解實(shí)際情況,親自動(dòng)手進(jìn)行實(shí)踐,提高實(shí)戰能力。
其他行業(yè)數據分析人員:可以了解互聯(lián)網(wǎng)行業(yè)是如何進(jìn)行數據分析和模型開(kāi)發(fā)的,相互交流和學(xué)習。
致力于數據分析工作的愛(ài)好者:《R 語(yǔ)言數據分析項目精解:理論、方法、實(shí)戰》可以作為數據分析從業(yè)人員相互交流、溝通的橋梁。
R語(yǔ)言愛(ài)好者:R語(yǔ)言的應用滲透到生產(chǎn)實(shí)踐的方方面面,《R 語(yǔ)言數據分析項目精解:理論、方法、實(shí)戰》既講解互聯(lián)網(wǎng)電商實(shí)際項目,又是R語(yǔ)言交流的平臺。
本書(shū)以互聯(lián)網(wǎng)電商企業(yè)為背景,抽象出工作中常見(jiàn)的數據分析問(wèn)題,利用 R 語(yǔ)言和統計學(xué)列出了詳細的解決方案和過(guò)程。本書(shū)共 9 章,前兩章分別為總論和 R 語(yǔ)言入門(mén)知識,之后各章分別介紹了運營(yíng)指標的建立、指標監控系統、假設檢驗及 AB 測試、變量篩選技術(shù)、用戶(hù)畫(huà)像系統、尋找優(yōu)質(zhì)用戶(hù)和文本挖掘等內容。本書(shū)涉及到的統計方法有:指標增長(cháng)幅度量化方法、層次分析法、時(shí)間序列模型、基于正態(tài)分布的一元離群點(diǎn)檢驗、傅里葉譜分析、假設檢驗、主成分分析、因子分析、模糊聚類(lèi)、無(wú)監督下連續型變量離散化、邏輯回歸模型和文本挖掘等。另外,本書(shū)提供了所有實(shí)例的 R 語(yǔ)言實(shí)現代碼,總計 33 個(gè)自定義函數和數千行代碼。本書(shū)適合數據分析從業(yè)人員、產(chǎn)品運營(yíng)人員、統計專(zhuān)業(yè)學(xué)生和 R 語(yǔ)言愛(ài)好者閱讀。
羅榮錦,應用統計學(xué)碩士、應用數學(xué)和國際經(jīng)濟與貿易雙學(xué)士。有8年數據分析工作經(jīng)驗,先后從事過(guò)金融數據分析、網(wǎng)絡(luò )游戲數據分析、B2B數據庫營(yíng)銷(xiāo)以及互聯(lián)網(wǎng)用戶(hù)行為數據分析?,F就職于攜程旅行網(wǎng)擔任資深數據分析師,主要從事用戶(hù)行為分析研究、統計學(xué)與數據挖掘應用等工作,擅長(cháng)統計建模,熟悉R語(yǔ)言、SAS、SPSS等數據挖掘工具。從事數據研究工作,一定要“耐得住寂寞,忍受得了孤獨”。
第 1 章 互聯(lián)網(wǎng)+統計學(xué)+R 語(yǔ)言1
1.1 互聯(lián)網(wǎng)中的統計學(xué)1
1.1.1 “互聯(lián)網(wǎng)+”的發(fā)展1
1.1.2 統計學(xué)的發(fā)展2
1.1.3 大數據時(shí)代的統計學(xué)2
1.2 R 語(yǔ)言――互聯(lián)網(wǎng)與統計學(xué)的橋梁3
1.3 本書(shū)結構 5
第 2 章 R 語(yǔ)言基礎 7
2.1 安裝 R 語(yǔ)言 7
2.1.1 獲取和安裝 R 語(yǔ)言 7
2.1.2 安裝 RStudio 9
2.1.3 R 包 10
2.1.4 幫助12
2.2 R 語(yǔ)言基本對象12
2.2.1 數據類(lèi)型12
2.2.2 向量12
2.2.3 矩陣和數組19
2.2.4 列表27
2.2.5 數據框29
2.2.6 因子32
2.2.7 數據類(lèi)型的辨別和轉換39
2.2.8 數據類(lèi)型和對象關(guān)系 39
2.3 工作空間和查看對象 40
2.3.1 工作空間和工作目錄 40
2.3.2 遍歷、創(chuàng )建、刪除文件夾 41
2.3.3 查看對象的方法 42
2.4 數據導入和導出43
2.4.1 數據導入43
2.4.2 數據導出49
2.5 操作符和函數51
2.5.1 操作符51
2.5.2 函數54
2.6 數據集操作59
2.6.1 變量操作60
2.6.2 數據集操作63
2.6.3 數據集連接67
2.6.4 數據匯總68
2.7 控制流71
2.7.1 重復和循環(huán)71
2.7.2 條件執行73
2.7.3 next 和 break 74
2.8 自定義函數75
第 3 章 互聯(lián)網(wǎng)運營(yíng)指標的建立77
3.1 項目背景、目標及方案78
3.1.1 項目背景78
3.1.2 項目目標78
3.1.3 項目方案78
3.2 項目技術(shù)理論簡(jiǎn)介78
3.2.1 骨灰級流量指標 78
3.2.2 登錄和激活80
2.2.3 訪(fǎng)問(wèn)深度和吸引力 81
3.2.4 訂單指標85
3.2.5 網(wǎng)站或 APP 性能指標86
3.2.6 轉化率87
3.2.7 層次分析法87
3.3 項目實(shí)踐 92
3.3.1 搭建運營(yíng)指標系統 92
3.3.2 制作對比型指標及趨勢線(xiàn) 97
3.3.3 創(chuàng )建用戶(hù)價(jià)值和活躍度指標 101
第 4 章 指標監控系統111
4.1 項目背景、目標及方案 111
4.1.1 項目背景111
4.1.2 項目目標111
4.1.3 項目方案112
4.2 項目技術(shù)理論簡(jiǎn)介112
4.2.1 時(shí)間序列基本統計量 112
4.2.2 數據觀(guān)測與描述性統計 113
4.2.3 隨機性115
4.2.4 周期性115
4.2.5 節假日模式識別 115
4.2.6 建模數據集的建立 118
4.2.7 指標監控方法(不含節假日)125
4.2.8 節假日指標監控方法 134
4.2.9 R 語(yǔ)言實(shí)例代碼 135
4.3 項目實(shí)踐 141
4.3.1 數據概覽142
4.3.2 節假日模式識別 145
4.3.3 模型數據集的建立 155
4.3.4 指標監控(非節假日)160
4.3.5 節假日指標監控 176
4.3.6 總結181
第 5 章 用數據驅動(dòng)業(yè)務(wù)――AB 測試 182
5.1 項目背景、目標和方案 182
5.1.1 項目背景182
5.1.2 項目目標183
5.1.3 項目方案183
5.2 項目技術(shù)理論簡(jiǎn)介183
5.2.1 自動(dòng)化分流策略 183
5.2.2 整體評估指標185
5.2.3 概率論預備知識 186
5.2.4 假設檢驗191
5.2.5 三個(gè)問(wèn)題197
5.3 項目實(shí)踐 197
第 6 章 變量篩選技術(shù)204
6.1 項目背景、目標和方案 204
6.1.1 項目背景204
6.1.2 項目目標205
6.1.3 項目方案205
6.2 項目技術(shù)理論簡(jiǎn)介205
6.2.1 變量相關(guān)性206
6.2.2 變量篩選209
6.2.3 變量降維215
6.2.4 R 語(yǔ)言實(shí)例代碼 225
6.3 項目實(shí)踐 237
6.3.1 變量篩選238
6.3.2 變量降維243
第 7 章 構建用戶(hù)畫(huà)像系統 247
7.1 項目背景、目標和方案 247
7.1.1 項目背景247
7.1.2 項目目標248
7.1.3 項目方案248
7.2 項目技術(shù)理論簡(jiǎn)介248
7.2.1 用戶(hù)畫(huà)像的基本概念 248
7.2.2 用戶(hù)畫(huà)像應用領(lǐng)域 249
7.2.3 用戶(hù)畫(huà)像分類(lèi)250
7.2.4 用戶(hù)畫(huà)像構建250
7.2.5 用戶(hù)畫(huà)像標簽的數值處理方法 254
7.3 項目實(shí)踐 256
第 8 章 從數據中尋找優(yōu)質(zhì)用戶(hù) 261
8.1 項目背景、目標和方案 261
8.1.1 項目背景261
8.1.2 項目目標262
8.1.3 項目方案262
8.2 項目技術(shù)理論簡(jiǎn)介262
8.2.1 邏輯回歸的基本概念 262
8.2.2 建模流程266
8.2.3 模型開(kāi)發(fā)階段269
8.2.4 模型驗證階段279
8.2.5 模型測試階段285
8.2.6 商業(yè)應用流程288
8.2.7 R 語(yǔ)言實(shí)例代碼 288
8.3 項目實(shí)踐 295
8.3.1 數據探索295
8.3.2 數據處理297
8.3.3 建立模型302
8.3.4 模型驗證304
8.3.5 總結308
第 9 章 文本挖掘――點(diǎn)評數據展示策略 309
9.1 項目背景、目標和方案 310
9.1.1 項目背景310
9.1.2 項目目標311
9.1.3 項目方案311
9.2 項目技術(shù)理論簡(jiǎn)介312
9.2.1 評論文本質(zhì)量量化指標模型 312
9.2.2 用戶(hù)相似度模型 313
9.2.3 情感性分析316
9.2.4 R 語(yǔ)言實(shí)例代碼 321
9.3 項目實(shí)踐 326
9.3.1 若干自定義函數 326
9.3.2 文本質(zhì)量量化指標模型 329
9.3.3 用戶(hù)相似度模型 334
9.3.4 情感性分析335
9.3.5 總結340