• <em id="pai5d"></em><sup id="pai5d"></sup>
    
    

    <small id="pai5d"><rp id="pai5d"></rp></small>
    <option id="pai5d"></option>

    
    
  • <sup id="pai5d"></sup>
    <em id="pai5d"><label id="pai5d"></label></em>

  • <s id="pai5d"></s>
    當前位置 : 首頁(yè)  圖書(shū) 正文

    智能搜索引擎技術(shù)簡(jiǎn)介,目錄書(shū)摘

    2019-10-21 19:00 來(lái)源:京東 作者:京東
    搜索引擎
    智能搜索引擎技術(shù)
    暫無(wú)報價(jià)
    10評論 100%好評
    編輯推薦:
    內容簡(jiǎn)介:  《智能搜索引擎技術(shù)》以當前搜索引擎主流技術(shù)為基礎,密切關(guān)注前沿技術(shù)發(fā)展趨勢,結合當前人工智能和自然語(yǔ)言技術(shù)的發(fā)展,以深入淺出的形式介紹一套完整的大數據時(shí)代背景下的智能搜索引擎的關(guān)鍵技術(shù)。
      《智能搜索引擎技術(shù)》在吸取國內外經(jīng)典教材優(yōu)點(diǎn)的基礎上,廣泛搜集合適的實(shí)例,通過(guò)實(shí)例從多個(gè)視角對智能搜索引擎的核心技術(shù)進(jìn)行全面介紹,加深讀者對關(guān)鍵概念和核心技術(shù)的理解。
      《智能搜索引擎技術(shù)》還對開(kāi)源軟件進(jìn)行了介紹,將技術(shù)理論與應用范例結合。
      《智能搜索引擎技術(shù)》共分為10章,通過(guò)采用循序漸進(jìn)的組織方式對搜索引擎的各個(gè)組成部分和核心技術(shù)進(jìn)行了介紹。第1章引言,對搜索引擎進(jìn)行了簡(jiǎn)要概述,介紹了搜索引擎與信息檢索的關(guān)系,搜索引擎的歷史、分類(lèi)及基本架構。第2章信息采集,主要圍繞搜索系統的核心——網(wǎng)絡(luò )爬蟲(chóng)進(jìn)行介紹。第3章文本處理,對搜索引擎的文本處理功能進(jìn)行了介紹,包括文本信息的提取、自然語(yǔ)言中的統計語(yǔ)言模型、中英文分詞技術(shù)、網(wǎng)頁(yè)去重算法等。第4章搜索引擎索引構建,主要介紹搜索引擎的索引系統,包括倒排索引、建立索引的方式、索引的更新策略、分布式索引及索引壓縮算法。第5章基于文本內容的檢索模型,對搜索引擎的檢索模型進(jìn)行了介紹,包括傳統的檢索模型,如布爾模型、向量空間模型、概率檢索模型和基于統計語(yǔ)言建模的檢索模型,以及基于機器學(xué)習的排序模型。第6章基于鏈接的檢索模型,主要對基于鏈接的檢索模型和針對鏈接作弊的反作弊模型進(jìn)行了介紹。第7章查詢(xún)處理與結果展示,主要對查詢(xún)條件的糾正與過(guò)濾、查詢(xún)處理與展示的技術(shù)進(jìn)行了介紹。第8章相關(guān)反饋與查詢(xún)擴展,主要對圍繞著(zhù)相關(guān)反饋和查詢(xún)擴展的各項技術(shù)進(jìn)行了介紹,通過(guò)采用相關(guān)反饋和查詢(xún)擴展的技術(shù)理解用戶(hù)的查詢(xún)意圖。第9章分類(lèi)與聚類(lèi),主要介紹了在智能搜索引擎中用到的各種機器學(xué)習算法。第10章基于知識圖譜的搜索引擎,對未來(lái)搜索引擎的發(fā)展方向——基于知識圖譜的智能搜索引擎進(jìn)行了介紹,包括知識圖譜的構建流程、構建中的信息抽取、知識融合、知識表示與推理等關(guān)鍵技術(shù)及其在搜索引擎中的應用。
      《智能搜索引擎技術(shù)》適用于數據科學(xué)與大數據技術(shù)專(zhuān)業(yè)及其計算機相關(guān)專(zhuān)業(yè)的本科生或研究生以及從事該領(lǐng)域研究的人員。
      通過(guò)對《智能搜索引擎技術(shù)》的閱讀,可以使讀者對智能搜索引擎的相關(guān)知識有一個(gè)基本的了解,并為將來(lái)開(kāi)展研究工作打下堅實(shí)的基礎。
    作者簡(jiǎn)介:
    目錄:第1章 引言
    1.1 信息檢索與搜索引擎
    1.2 搜索引擎的歷史
    1.3 搜索引擎的分類(lèi)
    1.4 搜索引擎的基本架構
    1.4.1 主要性能需求
    1.4.2 總體架構
    1.5 搜索引擎的主要組件及其功能
    1.5.1 網(wǎng)絡(luò )爬蟲(chóng)
    1.5.2 解析器
    1.5.3 索引器
    1.5.4 檢索器
    1.5.5 用戶(hù)交互接口
    1.6 開(kāi)源搜索引擎
    本章小結
    習題

    第2章 信息采集
    2.1 網(wǎng)絡(luò )爬蟲(chóng)的概述
    2.1.1 網(wǎng)絡(luò )爬蟲(chóng)的功能特點(diǎn)
    2.1.2 網(wǎng)絡(luò )爬蟲(chóng)通用架構
    2.1.3 網(wǎng)絡(luò )爬蟲(chóng)分類(lèi)
    2.2 分布式網(wǎng)絡(luò )爬蟲(chóng)架構
    2.2.1 主從分布式結構爬蟲(chóng)(master-slave)
    2.2.2 對等分布式結構爬蟲(chóng)(peer to peer)
    2.3 信息采集涉及的協(xié)議
    2.3.1 URL規范和HTTP協(xié)議
    2.3.2 User Agent
    2.3.3 Robots協(xié)議
    2.4 頁(yè)面遍歷
    2.4.1 寬度優(yōu)先遍歷策略
    2.4.2 深度優(yōu)先遍歷策略
    2.4.3 重要度優(yōu)先遍歷策略
    2.5 頁(yè)面更新
    2.5.1 網(wǎng)頁(yè)更新策略
    2.5.2 爬蟲(chóng)更新方式
    2.6 深網(wǎng)抓取
    2.7 開(kāi)源網(wǎng)絡(luò )爬蟲(chóng)
    本章小結
    習題

    第3章 文本處理
    3.1 文本信息提取
    3.1.1 網(wǎng)頁(yè)數據獲取
    3.1.2 非網(wǎng)頁(yè)的數據獲取
    3.2 統計語(yǔ)言模型
    3.2.1 N元模型(N-gram)的基本概念
    3.2.2 數據平滑方法
    3.3 英文分詞
    3.3.1 詞素切分
    3.3.2 詞干提取
    3.3.3 去除停用詞3.4 中文分詞
    3.4.1 中文分詞概述
    3.4.2 基于詞典的機械分詞法
    3.4.3 基于統計的分詞法
    3.4.4 分詞粒度
    3.5 網(wǎng)頁(yè)去重
    3.5.1 通用去重算法流程
    3.5.2 Shingling算法
    3.5.3 SimHash算法
    本章小結
    習題

    第4章 搜索引擎索引構建
    4.1 倒排索引
    4.1.1 倒排索引基礎
    4.1.2 詞典結構
    4.1.3 倒排表結構
    4.2 建立索引方式
    4.2.1 基于內存的索引構建
    4.2.2 基于排序的索引建立
    4.2.3 基于合并法的索引構建
    4.3 索引更新
    4.4 分布式索引
    4.4.1 數據劃分
    4.4.2 冗余和容錯
    4.4.3 Elastic Search的分布式索引
    4.5 索引壓縮
    4.5.1 評價(jià)壓縮算法的指標
    4.5.2 Delta編碼(D-Gaps)
    4.5.3 無(wú)參數間距壓縮編碼
    4.5.4 參數間距壓縮
    4.5.5 高查詢(xún)性能的編碼
    本章小結
    習題

    第5章 基于文本內容的檢索模型
    5.1 檢索模型概述
    5.2 布爾模型
    5.3 向量空間模型
    5.3.1 文本表示
    5.3.2 查詢(xún)相關(guān)度計算
    5.4 概率檢索模型
    5.4.1 概率檢索模型概述
    5.4.2 二元獨立模型(binary independent model)
    5.4.3 BM25模型
    5.4.4 BM25F模型
    5.5 基于統計語(yǔ)言建模的檢索模型
    5.6 機器學(xué)習排序
    5.6.1 機器學(xué)習排序概述
    5.6.2 單文檔方法(pointwise approach)
    5.6.3 文檔對方法(pairwise approach)
    5.6.4 文檔列表方法(listwise approach)5.7 檢索質(zhì)量評價(jià)標準
    5.7.1 準確率和召回率
    5.7.2 前k個(gè)文檔的查準率(P@k)
    5.7.3 平均查準率均值(mean average precision,MAP)
    5.7.4 NDCG(normalize DCC)
    本章小結
    習題

    第6章 基于鏈接的檢索模型
    6.1 Web圖
    6.2 Page Rank算法
    6.2.1 基于簡(jiǎn)單模型的Page Rank算法
    6.2.2 基于隨機沖浪模型的Page Rank算法
    6.2.3 主題敏感的Page Rank
    6.3 HITS算法
    6.3.1 HITS算法基本思想
    6.3.2 HITS算法流程
    6.3.3 HITS的優(yōu)勢與缺陷
    6.4 SALAS算法
    6.5 通用鏈接反作弊方法
    6.5.1 鏈接作弊方法
    6.5.2 反鏈接作弊思路
    6.5.3 經(jīng)典鏈接反作弊算法
    本章小結
    習題

    第7章 查詢(xún)處理與結果展示
    7.1 查詢(xún)糾錯
    7.1.1 查詢(xún)糾錯概述
    7.1.2 英文糾錯
    7.2 搜索智能提示
    7.3 不安全信息過(guò)濾
    7.4 查詢(xún)處理
    7.4.1 “一次一文檔”
    7.4.2 “一次一詞”
    7.5 結果展示
    7.5.1 頁(yè)面摘要
    7.5.2 查詢(xún)結果聚類(lèi)
    7.6 查詢(xún)緩存機制
    本章小結
    習題

    第8章 相關(guān)反饋與查詢(xún)擴展
    8.1 相關(guān)反饋框架
    8.2 顯式相關(guān)反饋
    8.2.1 Rocchio相關(guān)反饋算法
    8.2.2 概率相關(guān)反饋
    8.2.3 相關(guān)反饋策略的評價(jià)
    8.3 偽相關(guān)反饋
    8.4 隱式反饋
    8.5 查詢(xún)擴展
    本章小結
    習題

    第9章 分類(lèi)與聚類(lèi)
    9.1 文本分類(lèi)
    9.1.1 文本分類(lèi)框架
    9.1.2 貝葉斯文檔分類(lèi)
    9.1.3 支持向量機
    9.1.4 特征選擇
    9.1.5 評價(jià)
    9.2 聚類(lèi)
    9.2.1 劃分聚類(lèi)
    9.2.2 層次聚類(lèi)
    9.2.3 評價(jià)
    本章小結
    習題

    第10章 基于知識圖譜的搜索引擎
    10.1 概述
    10.2 知識圖譜的數據獲取
    10.3 信息抽取
    10.3.1 實(shí)體抽取
    10.3.2 關(guān)系抽取
    10.3.3 屬性抽取
    10.4 知識融合
    10.4.1 實(shí)體對齊
    10.4.2 實(shí)體歧義分析
    10.5 知識表示與知識推理
    10.5.1 知識表示
    10.5.2 知識推理
    10.6 基于知識圖譜的智能搜索引擎
    10.6.1 基于知識圖譜的搜索結構
    10.6.2 查詢(xún)理解
    10.6.3 自動(dòng)問(wèn)答
    本章小結
    習題

    參考文獻
    熱門(mén)推薦文章
    相關(guān)優(yōu)評榜
    品類(lèi)齊全,輕松購物 多倉直發(fā),極速配送 正品行貨,精致服務(wù) 天天低價(jià),暢選無(wú)憂(yōu)
    購物指南
    購物流程
    會(huì )員介紹
    生活旅行/團購
    常見(jiàn)問(wèn)題
    大家電
    聯(lián)系客服
    配送方式
    上門(mén)自提
    211限時(shí)達
    配送服務(wù)查詢(xún)
    配送費收取標準
    海外配送
    支付方式
    貨到付款
    在線(xiàn)支付
    分期付款
    郵局匯款
    公司轉賬
    售后服務(wù)
    售后政策
    價(jià)格保護
    退款說(shuō)明
    返修/退換貨
    取消訂單
    特色服務(wù)
    奪寶島
    DIY裝機
    延保服務(wù)
    京東E卡
    京東通信
    京東JD+
    亚洲精品乱码久久久97_国产伦子一区二区三区_久久99精品久久久欧美_天天看片永久av影城网页
  • <em id="pai5d"></em><sup id="pai5d"></sup>
    
    

    <small id="pai5d"><rp id="pai5d"></rp></small>
    <option id="pai5d"></option>

    
    
  • <sup id="pai5d"></sup>
    <em id="pai5d"><label id="pai5d"></label></em>

  • <s id="pai5d"></s>