企業(yè)建網(wǎng)站特征知識庫的建立
日期 : 2021-09-02 21:28:28
特征知識庫的建立。機(jī)器學(xué)習(xí)中最重要的是特征選擇。只有選擇合適的特征,訓(xùn)練有素的分類器才能具有良好的分類效果。
特征集合是網(wǎng)頁掛馬特征值的集合,當(dāng)網(wǎng)頁被掛馬之后,將網(wǎng)頁源碼中一處或者多處掛馬特征提取出來,作為網(wǎng)頁漏洞的特征,加入待檢測特征知識庫便于后續(xù)模塊的檢測。
特征提取模板是整個(gè)系統(tǒng)的核心,它的實(shí)現(xiàn)由兩部分組成,分別是HTML unit和Rhino,特征提取是由Rhino模塊負(fù)責(zé)進(jìn)行提取。然后對提取到的HTML頁面中的腳本代碼進(jìn)行解析,是通過HTML unit模塊實(shí)現(xiàn)對DOM樹形結(jié)構(gòu)的訪問,將提取的待檢測網(wǎng)頁的所有特征,形成完整的特征記錄,并加入待檢測特征知識庫中,為檢測模塊提供使用。
特征集合是網(wǎng)頁掛馬特征值的集合,當(dāng)網(wǎng)頁被掛馬之后,將網(wǎng)頁源碼中一處或者多處掛馬特征提取出來,作為網(wǎng)頁漏洞的特征,加入待檢測特征知識庫便于后續(xù)模塊的檢測。
特征提取模板是整個(gè)系統(tǒng)的核心,它的實(shí)現(xiàn)由兩部分組成,分別是HTML unit和Rhino,特征提取是由Rhino模塊負(fù)責(zé)進(jìn)行提取。然后對提取到的HTML頁面中的腳本代碼進(jìn)行解析,是通過HTML unit模塊實(shí)現(xiàn)對DOM樹形結(jié)構(gòu)的訪問,將提取的待檢測網(wǎng)頁的所有特征,形成完整的特征記錄,并加入待檢測特征知識庫中,為檢測模塊提供使用。