?? 《文本挖掘技術(shù)及其應用》??包括四個(gè)部分。第一部分包括兩章,介紹常用文本挖掘技術(shù),總結基本流程。第二部分共五章,在R軟件上詳細介紹了文本挖掘,包括R軟件的簡(jiǎn)介與安裝,文本挖掘所需的基本R包,Facebook、微博、Twitter、網(wǎng)頁(yè)等爬蟲(chóng)技術(shù)、數據預處理如斷詞、字詞處理、語(yǔ)料庫建立等,資料分析如關(guān)聯(lián)分析、集群分析、主成份分析和聚類(lèi)分析。第三部分共兩章,在MS SQL Sever上介紹如何實(shí)現文本挖掘,第一章是數據預處理技術(shù),包括怎么導入文本數據、建立字詞與詞向量、建立訓練集和測試集,第二章在MS SQL Sever上實(shí)現常用的文本數據挖掘方法,并進(jìn)行圖表分析。第四部分為顧問(wèn)公司和新聞網(wǎng)合作的案例。