正则表达式贪婪匹配模式,对于初学者,往往也很容易出错。有时候需要匹配一个段代码内容,发现匹配与想要不一致。发现原来,跟贪婪模式有关系。如下,我们看下例子:
什么是贪婪模式
字符串有: “h3>abd/h3>h3>bcd/h3>”,我们想匹配h3>…/h3>内容,正则表达式如下:
1、h3开头与结尾,”h3>待添加/h3>” h3>/h3>都作为普通字符
2、中间可以出现任意字符,个数可以是0个或者多个,正则表达式可以用:.* ,“.”代表任意字符,默认模式不匹配换行,”*” 重复前面字符0个或者多个。
3、最终我们考虑结果将是:”h3>.*/h3>” ,也可以是:”h3>.{0,}/h3>” {}代表,重复前面指定个数字符,以下用到是,正则表达式调试工具截图,软件可以看:正则表达式工具推荐(学习工具、测试工具)
2种结果都一样,这是我们不希望得到的,我们希望从左边开始,第一个出现/h3>,就开始匹配。以上这种模式,是贪婪模式,也是正则表达式默认以这个方法匹配。表示重复字符,操作符,默认都是贪婪模式,如:.*,.+,.{1,},.{0,} 都会匹配最大长度字符。正则表达式元字符,量词默认首先最大匹配字符串,这些量词有:+,*,?,{m,n} 。一开始匹配,就直接匹配到最长字符串。
什么是懒惰模式
既然上面几种,表示字符重复个数,元字符默认都是贪婪模式。如果,我们需要最小长度匹配,也就是懒惰模式,怎么样写正则表达式呢?其实,正则表达式里面通用方法是,在表示重复字符元字符,后面加多一个”?”字符即可。上面正则表达式可以写成:”h3>.*?/h3>”,或者”h3>.{0,}?/h3>” 都可以。
懒惰模式,就匹配到我们需要字符串了。
总结:正则表达式,表示字符串重复个数元字符,'?,+,*,{}' 默认都会选择贪婪模式,会最大长度匹配字符串,而要切换到懒惰模式,就只是在该元字符,后面加多一个”?” 即可切换到非贪婪模式(懒惰模式)。
您可能感兴趣的文章:- 正则表达式之 贪婪与非贪婪模式详解(概述)
- 小议正则表达式效率 贪婪、非贪婪与回溯
- 浅谈php正则表达式中的非贪婪模式匹配的使用
- [正则表达式]贪婪模式与非贪婪模式
- 正则表达式量词与贪婪的使用详解