同時能夠非??焖倬珳实奶幚硪幌盗斜容^復雜的字符串的檢索、替換和提取,具有快速匹配文本進行信息抽取的特點。普通字符,非打印字符,通用字符,原子表這些字符組成了正則的基本部分。描述和分析文本內(nèi)容可以適用正則表達式進行文本匹配,一般的文本字符都是可以通過一定的轉(zhuǎn)化為對應的正則表達式的形式。
正則表達式雖然描述能力強,但是若要實現(xiàn)匹配功能,還要進行等價轉(zhuǎn)化。復雜的正則語義邏輯會增加時間和空間的復雜度,因此,正則表示不太利于大規(guī)模集合的構(gòu)造和高速的數(shù)據(jù)流匹配。
本文地址:http://m.cdrpkj.cn//article/28160.html