Python正则表达式的七个使用范例详解-巨人网络通讯

主页 > 知识库 > Python正则表达式的七个使用范例详解

Python正则表达式的七个使用范例详解

作为一个概念而言，正则表达式对于Python来说并不是独有的。但是，Python中的正则表达式在实际使用过程中还是有一些细小的差别。

本文是一系列关于Python正则表达式文章的其中一部分。在这个系列的第一篇文章中，我们将重点讨论如何使用Python中的正则表达式并突出Python中一些独有的特性。

我们将介绍Python中对字符串进行搜索和查找的一些方法。然后我们讲讨论如何使用分组来处理我们查找到的匹配对象的子项。

我们有兴趣使用的Python中正则表达式的模块通常叫做‘re'。

>>> import re

1. Python中的原始类型字符串

Python编译器用‘\'（反斜杠）来表示字符串常量中的转义字符。

如果反斜杠后面跟着一串编译器能够识别的特殊字符，那么整个转义序列将被替换成对应的特殊字符（例如，‘n'将被编译器替换成换行符）。

但这给在Python中使用正则表达式带来了一个问题，因为在‘re'模块中也使用反斜杠来转义正则表达式中的特殊字符（比如*和+）。

这两种方式的混合意味着有时候你不得不转义转义字符本身（当特殊字符能同时被Python和正则表达式的编译器识别的时候），但在其他时候你不必这么做（如果特殊字符只能被Python编译器识别）。

与其将我们的心思放在去弄懂到底需要多少个反斜杠，我们可以使用原始字符串来替代。

原始类型字符串可以简单的通过在普通字符串的双引号前面加一个字符‘r'来创建。当一个字符串是原始类型时，Python编译器不会对其尝试做任何的替换。本质上来讲，你在告诉编译器完全不要去干涉你的字符串。

>>> string = 'This is annormal string'
>>> rawString = r'and this is anraw string'
>>> print string 
这是一个普通字符串 
>>> print rawString 
and this is anraw string 
这是一个原始类型字符串。

在Python中使用正则表达式进行查找

‘re'模块提供了几个方法对输入的字符串进行确切的查询。我们将会要讨论的方法有：

•re.match()
•re.search()
•re.findall()
每一个方法都接收一个正则表达式和一个待查找匹配的字符串。让我们更详细的查看这每一个方法从而弄明白他们是如何工作的以及他们各有什么不同。

2. 使用re.match查找 – 匹配开始

让我们先来看一下match()方法。match()方法的工作方式是只有当被搜索字符串的开头匹配模式的时候它才能查找到匹配对象。

举个例子，对字符串‘dog cat dog'调用mathch()方法，查找模式‘dog'将会匹配：

>>> re.match(r'dog', 'dog cat dog') 
_sre.SRE_Match object at 0xb743e720 
>>> match = re.match(r'dog', 'dog cat dog') 
>>> match.group(0) 
'dog'

我们稍后将更多的讨论group()方法。现在，我们只需要知道我们用0作为它的参数调用了它，group()方法返回查找到的匹配的模式。

我还暂且略过了返回的SRE_Match对象，我们很快也将会讨论到它。

但是，如果我们对同一个字符串调用math()方法，查找模式‘cat'，则不会找到匹配。

>>> re.match(r'cat', 'dog cat dog') 
>>>

3. 使用re.search查找 – 匹配任意位置

search()方法和match()类似，不过search()方法不会限制我们只从字符串的开头查找匹配，因此在我们的示例字符串中查找‘cat'会查找到一个匹配：

search(r'cat', 'dog cat dog') 
>>> match.group(0) 
'cat'

然而search()方法会在它查找到一个匹配项之后停止继续查找，因此在我们的示例字符串中用searc()方法查找‘dog'只找到其首次出现的位置。

>>> match = re.search(r'dog', 'dog cat dog') 
>>> match.group(0) 
'dog'

4. 使用 re.findall – 所有匹配对象

目前为止在Python中我使用的最多的查找方法是findall()方法。当我们调用findall()方法，我们可以非常简单的得到一个所有匹配模式的列表，而不是得到match的对象（我们会在接下来更多的讨论match对象）。对我而言这更加简单。对示例字符串调用findall()方法我们得到：

['dog', 'dog'] 
>>> re.findall(r'cat', 'dog cat dog') 
['cat']

5. 使用 match.start 和 match.end 方法

那么，先前search()和match()方法先前返回给我们的‘match'对象”到底是什么呢？

和只简单的返回字符串的匹配部分不同，search()和match()返回的“匹配对象”，实际上是一个关于匹配子串的包装类。

先前你看到我可以通过调用group()方法得到匹配的子串，（我们将在下一个部分看到，事实上匹配对象在处理分组问题时非常有用），但是匹配对象还包含了更多关于匹配子串的信息。

例如，match对象可以告诉我们匹配的内容在原始字符串中的开始和结束位置：

>>> match = re.search(r'dog', 'dog cat dog') 
>>> match.start() 
0
>>> match.end() 
3

知道这些信息有时候非常有用。

6. 使用 mathch.group 通过数字分组

就像我之前提到的，匹配对象在处理分组时非常得心应手。

分组是对整个正则表达式的特定子串进行定位的能力。我们可以定义一个分组做为整个正则表达式的一部分，然后单独的对这部分对应匹配到的内容定位。

让我们来看一下它是怎么工作的：

>>> contactInfo = 'Doe, John: 555-1212'

我刚才创建的字符串类似一个从某人的地址本里取出来的一个片段。我们可以通过这样一个正则表达式来匹配这一行：

>>> re.search(r'w+, w+: S+', contactInfo) 
_sre.SRE_Match object at 0xb74e1ad8

通过用圆括号来（字符‘('和‘)'）包围正则表达式的特定部分，我们可以对内容进行分组然后对这些子组做单独处理。

>>> match = re.search(r'(w+), (w+): (S+)', contactInfo)

这些分组可以通过用分组对象的group()方法得到。它们可以通过其在正则表达式中从左到右出现的数字顺序来定位（从1开始）：

>>> match.group(1) 
'Doe'
>>> match.group(2) 
'John'
>>> match.group(3) 
'555-1212'

组的序数从1开始的原因是因为第0个组被预留来存放所有匹配对象（我们在之前学习match()方法和search()方法到时候看到过）。

>>> match.group(0) 
'Doe, John: 555-1212'

7. 使用 match.group 通过别名来分组

有时候，特别是当一个正则表达式有很多分组的时候，通过组的出现次序来定位就会变的不现实。Python还允许你通过下面的语句来指定一个组名：

>>> match = re.search(r'(?Plast>w+), (?Pfirst>w+): (?Pphone>S+)', contactInfo)

我们还是可以用group()方法获取分组的内容，但这时候我们要用我们所指定的组名而不是之前所使用的组的所在位数。

>>> match.group('last') 
'Doe'
>>> match.group('first') 
'John'
>>> match.group('phone') 
'555-1212'

这大大加强了代码的明确性和可读性。你可以想像当正则表达式变得越来越复杂，去弄懂一个分组到捕获了什么内容将会变得越来越困难。给你的分组命名将明确的告诉了你和你的读者你的意图。

尽管findall()方法不返回分组对象，它也可以使用分组。类似的，findall()方法将返回一个元组的集合，其中每个元组中的第N个元素对应了正则表达式中的第N个分组。

>>> re.findall(r'(w+), (w+): (S+)', contactInfo) 
[('Doe', 'John', '555-1212')]

但是，给分组命名并不适用于findall()方法。

在本文中我们介绍了Python中使用正则表达式的一些基础。我们学习了原始字符串类型（还有它能帮你解决的在使用正则表达式中一些头痛的问题）。我们还学习了如何适使用match(), search(), and findall()方法进行基本的查询，以及如何使用分组来处理匹配对象的子组件。

和往常一样，如果想查看更多关于这个主题的内容，re模块的Python官方文档是一个非常好的资源。

在以后的文章中，我们将更深入的讨论Python中正则表达式的应用。我们将更加全面的学习匹配对象，学习如何使用它们在字符串中做替换，甚至使用它们从文本文件中去解析Python数据结构。

本文由伯乐在线 - 左手的灵魂翻译自 thegeekstuff。

您可能感兴趣的文章:

Python使用中文正则表达式匹配指定中文字符串的方法示例
python使用正则表达式提取网页URL的方法
Python使用正则匹配实现抓图代码分享
python使用正则表达式分析网页中的图片并进行替换的方法
python中正则表达式的使用详解
python使用正则搜索字符串或文件中的浮点数代码实例
python正则表达式的使用

标签：梅州咸阳恩施三亚鞍山六安绵阳池州

巨人网络通讯声明：本文标题《Python正则表达式的七个使用范例详解》，本文关键词 Python,正则,表达式,的,七个,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《Python正则表达式的七个使用范例详解》相关的同类信息！

Python正则表达式的七个使用范例详解

作为一个概念而言，正则表达式对于Python来说并不是独有的。但是，Python中的正则表达式在实际使用过程中还是有一些细小的差别。本文是一系列关于Python正则表达式文章的其中一部分...

10-18

沈阳外呼防封系统怎么样（沈阳外呼系统哪家公司做得好）

本文目录一览： 1、防封号外呼软件好不好呢？2、防封号外呼软件真的不会封号吗？3、外呼体系真的能够做到不封号吗?防封...

11-28

上海传媒防封号系统哪里有-快讯！

上海传媒防封号系统哪里有也许呼叫中心系统电话线路的日常工作是如此。电销系统不单单进步了工做人员的工做效率，同时...

01-16

阿里和Alphabet等10亿美元押宝AR/VR的真正原因

腾讯科技讯据外媒报道，据投资银行Digi-Capital的陈诉显示，尽管 12 月才刚刚开始，，但是阿里巴巴、谷歌母公司Alphabet、S...

10-15

上海白名单电销卡去哪办理

上海白名单电销卡去哪办理首先，所谓电话营销，是指利用打电话的方式吸引新客户，联系老客户，询问他们是否有合作的...

12-15

外呼系统被投诉多久恢复（外呼系统封号）

本篇文章给大家谈谈外呼系统被投诉多久恢复，以及外呼系统封号对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

08-28

中国电信400电话介绍（中国电信400电话多少）

中国电信4008、4009功能 400电话只需设定一个呼转号码，即可接听全国所有呼叫到400的电话，并可以绑定多部转接电话，无需另...

对于买衣服的商标来说，任何一个用户都是希望自己更快的使用到商标，那么有什么方法可以快速使用呢？交易平台购买...

10-23

电信火神卡怎么办理，中国电信火神卡19元套餐怎么样

现在的消费者对于流量卡的需要越来越高，要求也越来越高，不仅要资费低的，还要求流量多的，正好，现在中国电信推出了...

10-13

重庆软件与服务外包国际培训学校动工

重庆晨报讯 (记者宋岩)重庆要大力发展软件和服务外包人才，不过人才却是短腿。昨日，重庆软件与服务外包国际培训学校...

10-22

石景山区电话机器人（石头机器人客服热线）

今天给各位分享石景山区电话机器人的知识，其中也会对石头机器人客服热线进行解释，如果能碰巧解决你现在面临的问题，...

11-06

400电话在线办理，提高客户服务效率的新方式

在今天的市场竞争中，提供高效、便捷的客户服务已成为企业赢得竞争优势的关键因素。400电话作为专业的客服服务号码，是...

07-21

高德地图怎样修改店铺名字？高德地图怎样修改名字？

高德地图的店铺怎样修改营业时间？高德地图里面是没有店铺的，更不能去修改营业时间了，高德地图只能是导航用的软件...

11-26

台州高频电销卡办理

台州高频电销卡办理台州高频电销卡办理,台州电销卡办理,台州高频电销卡,台州电销卡一个高效的销售员每天要打出上百通...

06-24

400电话要怎么申请选择400电话申请平台哪些事情必须要考虑

现阶段我们都能够发现400电话已经是在各行各业遍地开花，其主要的目的都是为了宣传好单位的具体形象以及其实力，不过，...

01-13

徐州电话机器人如何（电话机器人教程）

本文目录一览：1、机器人打电话优势劣势2、电销机器人和人工相比哪个更好用3、智能电话机器人怎么样?4、现在电销机器人...

07-04

400开头的是什么电话，开头是区号吗（400开头是哪个地区的号码）

【400开头的是什么电话，开头是区号吗】生活中，相信很多人都接到过400开头的电话，有些人对此号码不够了解，觉得前面的...

11-07

食醋行业无序竞争愈演愈烈非一线品牌该如何摆脱困境？

近几年来，随着人们的生活水平不断提高和健康饮食观念的深入人心，调味品受到越来越大的关注，在餐桌文化中扮演着越来...

10-19

400电话总代理自己办理400电话比较好，还是找代理平台申请400电话好？

上海通科技是中国电力上海通和移动400电话的一级代理商，负责申请和办理全国400电话业务。是国内最早的400电话服务商，...

01-12

企业在处理400电话前应该知道什么？

企业在处理400电话前应该知道什么？ 400电话是现在企业必备的客服热线。 400电话作为企业唯一的外接电话，品牌统一，来电...

08-14

长沙crm外呼系统平台（crm客户外呼系统）

今天给各位分享长沙crm外呼系统平台的知识，其中也会对crm客户外呼系统进行解释，如果能碰巧解决你现在面临的问题，别忘...

11-06

800电话和400电话的区别，400电话在哪里办理

800电话和400电话的区别，400电话在哪里办理400电话代理商为你解答。 400是主被叫分摊付费业务，800是受话人集中付费业务4...

07-20

Lua中的变量类型与语句学习总结

1. Lua类型 1.1 基本类型 Lua是一种动态类型语言，没有类型定义的语法。Lua一共有8种基础类型：nil（空）、boolean（布尔）、...

10-18

物联卡应用_直击Chinajoy：感受5G+WiFi的游戏....

2022年，物联网领域突破万亿市场。各种工业级和民用级智能设备层出不穷。物联网卡在物联网设备中起着重要作用，需求也...

11-07

认真只能电话机器人（全自动电话机器人）

今日给各位共享仔细只能电话机器人的常识，其间也会对全主动电话机器人进行解说，假如能可巧处理你现在面对的问题，别...

11-06

天津电销外呼系统哪家强（天津电销公司）

今天给各位分享天津电销外呼系统哪家强的知识，其中也会对天津电销公司进行解释，如果能碰巧解决你现在面临的问题，别...

08-27

济南教育呼叫系统费用-信誉保证

济南教育呼叫系统费用所以这就会影响公司的销量，失去掉一些潜在的客户。不过智能电销机器人就不会出现这种问题，它会...

01-16

重庆400电话代理商哪家比较靠谱如何代办400，代办400电话靠谱吗？

现在，当企业申请400电话时，他们中的大多数人将处理服务提供商或代理。如果重庆的企业想要处理，可以直接找到可靠的...

01-12

济南白名单电销卡

济南白名单电销卡 , 办理济南白名单电销卡 ,济南白名单电销卡如何办理龙腾通讯成立于2010年，公司成立9年来一直深耕于...

11-23

简析Win8下虚拟内存的必要性

现在的内存白菜价啊，4G的也就100来块，主流配置都是8G，16G内存，加上新的 Win8 系统，当然是各种给力啊！不少用户就会想...

10-20

六安朗玛电销卡（六安朗玛电销卡在哪办）

本文目录一览：1、电话营销用什么卡不封号?2、朗玛移动卡实名后做电销有什么风险吗3、朗玛移动电销卡周日能正常使用吗...

07-10

400电话申请服务商选什么400电话服务商

400电话业务由国家电信部门统一管理。目前只有电信、中国移动、中国联通三400电话代理大运营商拥有运营权限。但是企业...

01-12

ofo无门槛发送“免费骑行月卡” 行业第一优势进一步巩固

随着橙黄大战进入白热化阶段，行业头部企业ofo小黄车与摩拜单车进行了从性能、车型、押金，到供应链、品牌、运维等多维...

10-16

电销人工智能机器人的（智能电销机器人好吗）

本文目录一览： 1、电销板滞人是什么？ 2、电销板滞人有什么用？ 3、电销AI板滞人是什么？ 4、人工智能客服板滞人有什么...

11-26

合肥剑夆电销系统哪种好

合肥剑夆电销系统哪种好防封性能强，很多人们都知道电销卡，那么电销卡是什么卡呢？其实电销卡相对于其他的手机卡来...

12-16

太原不封号电销卡渠道

太原不封号电销卡渠道太原不封号电销卡渠道,太原电销卡渠道,太原不封号电销卡,太原电销卡电销企业往往需要打电话邀请...

06-24

青岛人工外呼系统哪家强（青岛客服外包）

本篇文章给大家谈谈青岛人工外呼系统哪家强，以及青岛客服外包对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

05-17

400服务电话申请：详尽步骤及注意事项

400服务电话申请：详尽步骤及注意事项在现代社会，随着互联网的快速发展，更多的企业、政府甚至个人都选择了建立400服...

08-14

杭州电销公司用什么防封卡

杭州电销公司用什么防封卡？杭州防封电销卡,已加入白名单，支持高频呼叫，可以有效解决高频锁卡情况。支持定制套餐，...

11-18

电销外呼系统哪个好？小型电销中心外呼软件

电销外呼系统哪个好？小型电销中心外呼软件电销外呼系统哪个好？针对传统式电话营销而言，其不仅拥有十分猛烈的...

10-26

泸州百家号代运营

其实现在大家应该都清楚运营，但是对于运营来讲也是有好有坏的，也不是每个公司都可以做的很好，随着自媒体的发展，现...

03-01

通过全渠道联络中心的下一代客户体验

老秦夜译 CTI论坛(ctiforum.com)（编译/老秦）:弗兰克福尔摩斯（FrankSherlock）解释了为什么全渠道不再是一个流行词以及它是如何...

10-21

铜川朗玛电销卡（朗玛电话卡哪里有卖）

本文目录一览：1、虚拟运营商号码是什么人打的呢?2、电话营销用什么卡不封号?3、朗玛移动卡号无服务4、做电话营销,有没...

07-10

苏州电销AXB防封系统怎么样

苏州电销AXB防封系统怎么样 AXB系统通过中间号实现的是间接通话，非直接拨打，从而实现避免高频检测：拨打方式是A号（自...

11-15

ORACLE应用经验(1)

正在看的ORACLE教程是:ORACLE应用经验(1)。 JAN-1(January) FEB-2(February) MAR-3(March) APR-4(April) MAY-5(May) JUN-6(June) JUL-7(July) AUG-8(August) SE...

10-18

Win10提示无法保存IP设置该如何解决

现在修改IP设置已经可以在Windows设置中操作啦，但是有用户说自己保存一些需要手动设置IP地址的地方时，会出现提示无法保...

10-19

哈尔滨市出台政策促大学生就业三支一扶年增100岗位

东北网3月28日讯据新晚报报道，数据显示，今年哈市户籍未就业高校毕业生达1万人，此外，哈市户籍2008年结转未就业高校毕...

10-22

包含商丘电销卡外呼系统线路的词条

今日给各位共享商丘电销卡外呼体系线路的常识，其间也会对进行解说，假如能可巧处理你现在面对的问题，别忘了重视本站...

11-07

济南高居山东省服务外包总量首位

本报讯山东省商务厅日前通报了全省服务外包产业发展情况，作为山东省唯一的国家级服务外包示范城市，济南市在服务外包...

10-22

淄博电销获客数据系统（淄博电销招聘）

本篇文章给大家谈谈淄博电销获客数据系统，以及淄博电销招聘对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。...

08-28

Python正则表达式的七个使用范例详解

10-18

本页收集关于Python正则表达式的七个使用范例详解的相关信息资讯供网民参考！

四合一精品企业网站建设

多一个网站就为企业多增加一条营销渠道

¥888元限时抢购

立即咨询 快速购买

企业400电话

智能AI客服机器人
￥15000

在线订购

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

推荐文章

上一篇：浅谈正则表达式(Regular Expression)

下一篇：常用的正则表达式集锦

一起分享吧

Python正则表达式的七个使用范例详解

四合一精品企业网站建设

¥888元限时抢购

立即咨询快速购买

企业400电话

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

在线咨询