企業(yè)網(wǎng)站設(shè)計(jì)站內(nèi)全文檢索技術(shù)
日期 : 2019-04-28 14:31:39
隨著企業(yè)網(wǎng)站各功能模塊中信息量的逐漸增加, 如何利用關(guān)鍵詞快速地查找到所需信息也就成了網(wǎng)站要解決的關(guān)鍵問(wèn)題之一。對(duì)于小型的企業(yè)網(wǎng)站來(lái)說(shuō), 由于數(shù)據(jù)量不是太大, 采用基于數(shù)據(jù)庫(kù)的模糊檢索方式就能滿(mǎn)足要求。但這種檢索方式只適合檢索結(jié)構(gòu)化數(shù)據(jù), 無(wú)法對(duì)文本、圖片等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行檢索。而且, 在使用like查詢(xún)時(shí), 需要對(duì)數(shù)據(jù)庫(kù)表格中相關(guān)字段的內(nèi)容全部檢索一次, 在數(shù)據(jù)量較大的環(huán)境下, like查詢(xún)對(duì)系統(tǒng)性能的影響是相當(dāng)大的。
為解決傳統(tǒng)數(shù)據(jù)檢索方式存在的效率低下問(wèn)題, 以Lucene為代表的站內(nèi)全文檢索技術(shù)也就應(yīng)運(yùn)而生。Lucene的檢索過(guò)程實(shí)際上就是把模糊查詢(xún)變成可以利用索引進(jìn)行精確查詢(xún)的過(guò)程, 就如查字典, 只需要從索引目錄中找出所查字符的頁(yè)碼即可實(shí)現(xiàn)精確定位, 不需要一頁(yè)一頁(yè)的去搜尋, 極大地提升了數(shù)據(jù)檢索的效率和準(zhǔn)確性。全文檢索的實(shí)現(xiàn)過(guò)程主要分為索引創(chuàng)建和搜索索引兩個(gè)步驟。其中, 索引創(chuàng)建就是將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的特征信息提取出來(lái)并儲(chǔ)存到創(chuàng)建好的索引庫(kù)中;搜索索引就是根據(jù)用戶(hù)需要查詢(xún)的關(guān)鍵詞, 從索引庫(kù)中搜索出滿(mǎn)足條件的記錄, 然后將查詢(xún)結(jié)果返回給用戶(hù)。
為解決傳統(tǒng)數(shù)據(jù)檢索方式存在的效率低下問(wèn)題, 以Lucene為代表的站內(nèi)全文檢索技術(shù)也就應(yīng)運(yùn)而生。Lucene的檢索過(guò)程實(shí)際上就是把模糊查詢(xún)變成可以利用索引進(jìn)行精確查詢(xún)的過(guò)程, 就如查字典, 只需要從索引目錄中找出所查字符的頁(yè)碼即可實(shí)現(xiàn)精確定位, 不需要一頁(yè)一頁(yè)的去搜尋, 極大地提升了數(shù)據(jù)檢索的效率和準(zhǔn)確性。全文檢索的實(shí)現(xiàn)過(guò)程主要分為索引創(chuàng)建和搜索索引兩個(gè)步驟。其中, 索引創(chuàng)建就是將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的特征信息提取出來(lái)并儲(chǔ)存到創(chuàng)建好的索引庫(kù)中;搜索索引就是根據(jù)用戶(hù)需要查詢(xún)的關(guān)鍵詞, 從索引庫(kù)中搜索出滿(mǎn)足條件的記錄, 然后將查詢(xún)結(jié)果返回給用戶(hù)。