本書(shū)是一本數據挖掘和機器學(xué)習領(lǐng)域入門(mén)階段的實(shí)驗教材,每章由知識要點(diǎn)和實(shí)驗兩個(gè)部分組成。知識要點(diǎn)部分給出了實(shí)驗內容對應的知識脈絡(luò ),以及對相關(guān)問(wèn)題的理解和分析方法。實(shí)驗部分以Mahout工具包為實(shí)驗平臺,針對每章的知識點(diǎn)設計了幫助讀者理解和掌握的實(shí)驗,這些實(shí)驗同時(shí)也為讀者運用Mahout工具包針對各種數據挖掘和機器學(xué)習的實(shí)際應用提供了方法和思路。
李琳,博士,武漢理工大學(xué)計算機科學(xué)與技術(shù)學(xué)院教授。近年來(lái)主要從事信息檢索與推薦系統、數據挖掘與知識管理、自然言語(yǔ)處理與機器學(xué)習等方面的研究工作,先后承擔國家863項目、國家自然科學(xué)基金、湖北省科技重大專(zhuān)項等項目20余項。主要研究方向:研究人工智能方法和大規模數據分析技術(shù),特別是互聯(lián)網(wǎng)數據挖掘、文本分析、信息檢索和推薦系統等相關(guān)問(wèn)題,致力于將數據挖掘、機器學(xué)習與知識發(fā)現技術(shù)結合。