企業(yè)做網(wǎng)站識別商品屬性信息設(shè)計(jì)
日期 : 2020-12-06 15:52:40
識別商品屬性信息設(shè)計(jì)。在電子商務(wù)網(wǎng)頁中對商品信息的描述中,包含商品的特征詞,因此結(jié)合超文本標(biāo)記語言以及統(tǒng)計(jì)學(xué)規(guī)則,可以自動識別商品屬性信息的所在位置,設(shè)計(jì)流程為:
檢索電子商務(wù)網(wǎng)頁中商品屬性特征詞典中的每一個詞匯,若找到相配詞匯,則將該詞匯所在節(jié)點(diǎn)添加到候選集合中。再對后先集合中的每一個節(jié)點(diǎn)中,查詢與其距離最近的上一級別的節(jié)點(diǎn),若未能成功找到則將該節(jié)點(diǎn)排除,若能夠找到則從上一級別的節(jié)點(diǎn)集合中將屬于該節(jié)點(diǎn)的子節(jié)點(diǎn)刪除。
利用統(tǒng)計(jì)學(xué)的規(guī)則,并結(jié)合提取規(guī)則,計(jì)算出節(jié)點(diǎn)中的表格子節(jié)點(diǎn)以及文本內(nèi)容的子節(jié)點(diǎn),并通過計(jì)算獲得其數(shù)量的所占比例,若比值大于75%,則將該節(jié)點(diǎn)加入到提取集合當(dāng)中,若小于75%,則將該節(jié)點(diǎn)排除。
檢索電子商務(wù)網(wǎng)頁中商品屬性特征詞典中的每一個詞匯,若找到相配詞匯,則將該詞匯所在節(jié)點(diǎn)添加到候選集合中。再對后先集合中的每一個節(jié)點(diǎn)中,查詢與其距離最近的上一級別的節(jié)點(diǎn),若未能成功找到則將該節(jié)點(diǎn)排除,若能夠找到則從上一級別的節(jié)點(diǎn)集合中將屬于該節(jié)點(diǎn)的子節(jié)點(diǎn)刪除。
利用統(tǒng)計(jì)學(xué)的規(guī)則,并結(jié)合提取規(guī)則,計(jì)算出節(jié)點(diǎn)中的表格子節(jié)點(diǎn)以及文本內(nèi)容的子節(jié)點(diǎn),并通過計(jì)算獲得其數(shù)量的所占比例,若比值大于75%,則將該節(jié)點(diǎn)加入到提取集合當(dāng)中,若小于75%,則將該節(jié)點(diǎn)排除。