正则表达式中最短匹配模式的用法浅析-巨人网络通讯

前言

最近有一次想用正则表达式从网页里面抓取一些东西出来，内容不复杂却出现不少问题。下面话不多说，来一起看看详细的介绍：

当我们用正则表达式去匹配一个标签的首尾的时候，比如匹配 h1>hello world/h1> 中的 h1 的开始和闭合标签

可能很多人会这样写

/.*h1>/g

但是这样真的可以吗？

因为 * 匹配符是匹配前面一个字符的零到多个，而且它是贪婪匹配的

所以你得到的就会是下面的结果了。

显然这并不是我们想要的，那么怎么把贪婪匹配换成最小匹配呢，

/.*?h1>/g

上面的写法就可以了，如下图：

其实原理应该很简单，因为 ? 也是贪婪匹配，并且只能匹配0到1个，

所以它会匹配到第一个的时候就结束了，从而阻止了 * 的匹配多个的贪婪。

PS：这里再为大家提供2款非常方便的正则表达式工具供大家参考使用：

JavaScript正则表达式在线测试工具：http://tools.jb51.net/regex/javascript

正则表达式在线生成工具：http://tools.jb51.net/regex/create_reg

更多关于JavaScript相关内容感兴趣的读者可查看本站专题：《JavaScript正则表达式技巧大全》、《JavaScript替换操作技巧总结》、《JavaScript查找算法技巧总结》、《JavaScript数据结构与算法技巧总结》、《JavaScript遍历算法与技巧总结》、《JavaScript中json操作技巧总结》、《JavaScript错误与调试技巧总结》及《JavaScript数学运算用法总结》

总结

以上就是这篇文章的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

JS中正则表达式全局匹配模式 /g用法详解
Java 正则表达式匹配模式(贪婪型、勉强型、占有型)
正则表达式惰性匹配模式(?)
正则表达式全局匹配模式(g修饰符)
正则表达式常见的4种匹配模式小结

标签：哈密凉山常州本溪海口泰安大兴安岭湖州

巨人网络通讯声明：本文标题《正则表达式中最短匹配模式的用法浅析》，本文关键词正则,表达式,中,最短,匹配,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。