優(yōu)惠活動 - 12周年慶本月新客福利
優(yōu)惠活動 - 12周年慶本月新客福利
優(yōu)惠活動 - 12周年慶本月新客福利

行業(yè)動態(tài)廣度優(yōu)先搜索策略

         廣度優(yōu)先搜索策略是使用比較廣泛的一種方法,也是很多重要算法的原型。策略基本過程為,首先給定種子URL并從初始種子網(wǎng)頁開始遍歷,獲取種子網(wǎng)頁中的所有超鏈接并依次采集,然后重復(fù)上述過程對之后的鏈接層的網(wǎng)頁鏈接進(jìn)行抓取,當(dāng)網(wǎng)絡(luò)中該路徑下的所有鏈接全部遍歷完,搜索爬取停止。

         廣度優(yōu)先搜索是一種層序遍歷方法,從選定的初始種子訪問,逐層對所有鏈接進(jìn)行遍歷直到完成,遍歷時(shí)按照從淺層到深層,同一層鏈接優(yōu)先處理原則。

         當(dāng)采用廣度優(yōu)先去爬取一個特定的網(wǎng)絡(luò)站點(diǎn)或者深層結(jié)構(gòu)網(wǎng)站的網(wǎng)絡(luò)拓?fù)浼蠒r(shí),到底層時(shí)需要耗費(fèi)較長的時(shí)間。目前國內(nèi)的搜索引擎中,大多數(shù)是以廣度優(yōu)先搜索為主要的爬行策略,而那些很少被引用或者孤立的網(wǎng)站,就有可能被忽略掉,可以采用其他搜索策略來進(jìn)行彌補(bǔ),得到全面的搜索結(jié)果。

本文地址:http://m.cdrpkj.cn//article/21477.html
相關(guān)文章:
最新文章: