Python正则表达式之基础篇-巨人网络通讯

主页 > 知识库 > Python正则表达式之基础篇

Python正则表达式之基础篇

正则表达式是用于处理字符串的强大工具，它并不是Python的一部分。

其他编程语言中也有正则表达式的概念，区别只在于不同的编程语言实现支持的语法数量不同。

它拥有自己独特的语法以及一个独立的处理引擎，在提供了正则表达式的语言里，正则表达式的语法都是一样的。

下图展示了使用正则表达式进行匹配的流程：

1.1介绍

　　正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。

　　正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。

1.2要知道的各种用法

　模式字符串使用特殊的语法来表示一个正则表达式：

　　字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。多数字母和数字前加一个反斜杠时会拥有不同的含义。标点符号只有被转义时才匹配自身，否则它们表示特殊的含义。反斜杠本身需要使用反斜杠转义。

　　由于正则表达式通常都包含反斜杠，所以你最好使用原始字符串来表示它们。模式元素(如 r'/t'，等价于'//t')匹配相应的特殊字符。

　　下表列出了正则表达式模式语法中的特殊元素。如果你使用模式的同时提供了可选的标志参数，某些模式元素的含义会改变。

　　当然这些用法很多，待会会给出经常使用到的用法，多试试就能理解了。

模式

模式	描述
^	匹配字符串的开头
$	匹配字符串的末尾。
.	匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。
[...]	用来表示一组字符,单独列出：[amk] 匹配 'a'，'m'或'k'
[^...]	不在[]中的字符：[^abc] 匹配除了a,b,c之外的字符。
re*	匹配0个或多个的表达式。
re+	匹配1个或多个的表达式。
re?	匹配0个或1个由前面的正则表达式定义的片段，非贪婪方式
re{ n}
re{ n,}	精确匹配n个前面表达式。
re{ n, m}	匹配 n 到 m 次由前面的正则表达式定义的片段，贪婪方式
a\| b	匹配a或b
(re)	G匹配括号内的表达式，也表示一个组
(?imx)	正则表达式包含三种可选标志：i, m, 或 x 。只影响括号中的区域。
(?-imx)	正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
(?: re)	类似 (...), 但是不表示一个组
(?imx: re)	在括号中使用i, m, 或 x 可选标志
(?-imx: re)	在括号中不使用i, m, 或 x 可选标志
(?#...)	注释.
(?= re)	前向肯定界定符。如果所含正则表达式，以 ... 表示，在当前位置成功匹配时成功，否则失败。但一旦所含表达式已经尝试，匹配引擎根本没有提高；模式的剩余部分还要尝试界定符的右边。
(?! re)	前向否定界定符。与肯定界定符相反；当所含表达式不能在字符串当前位置匹配时成功
(?> re)	匹配的独立模式，省去回溯。
\w	匹配字母数字
\W	匹配非字母数字
\s	匹配任意空白字符，等价于 [\t\n\r\f].
\S	匹配任意非空字符
\d	匹配任意数字，等价于 [0-9].
\D	匹配任意非数字
\A	匹配字符串开始
\Z	匹配字符串结束，如果是存在换行，只匹配到换行前的结束字符串。c
\z	匹配字符串结束
\G	匹配最后匹配完成的位置。
\b	匹配一个单词边界，也就是指单词和空格间的位置。例如， 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。
\B	匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。
\n, \t, 等.	匹配一个换行符。匹配一个制表符。等
\1...\9	匹配第n个分组的子表达式。
\10	匹配第n个分组的子表达式，如果它经匹配。否则指的是八进制字符码的表达式。

字符类

实例	描述
[Pp]ython	匹配 "Python" 或 "python"
rub[ye]	匹配 "ruby" 或 "rube"
[aeiou]	匹配中括号内的任意一个字母
[0-9]	匹配任何数字。类似于 [0123456789]
[a-z]	匹配任何小写字母
[A-Z]	匹配任何大写字母
[a-zA-Z0-9]	匹配任何字母及数字
[^aeiou]	除了aeiou字母以外的所有字符
[^0-9]	匹配除了数字外的字符

特殊字符类

实例	描述
.	匹配除 "\n" 之外的任何单个字符。要匹配包括 '\n' 在内的任何字符，请使用象 '[.\n]' 的模式。
\d	匹配一个数字字符。等价于 [0-9]。
\D	匹配一个非数字字符。等价于 [^0-9]。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\w	匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。
\W	匹配任何非单词字符。等价于 '[^A-Za-z0-9_]'。

1.3re.match函数

　　re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。

　　re.match(pattern, string, flags = 0)

　　pattern 正则表达式

　　string 匹配的字符串

　　flags 标志位，用来控制匹配方式，下文会讲

　　直接上程序：

import string,re
r = "abc" #正则表达式
if re.match(r,"abc"): #匹配
print 'done' 
else:
print 'defeat'

结果:

　　done

可以根据上面各表给出的用法，多练练：

import string,re
r = "a.c" #正则表达式 . 匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。
if re.match(r,"abc"): 
print re.match(r,"abc")
print 'done' 
else:
print 'defeat'

结果：

_sre.SRE_Match object at 0x01dd6158>

done

　　注意这里不是显示匹配成功的字符串,re.match() 返回的是一个对象，不成功返回的是none.

　　我们可以通过group(num)或groups()匹配对象函数来获取匹配表达式。　

匹配对象方法	描述
group(num=0)	匹配的整个表达式的字符串，group() 可以一次输入多个组号，在这种情况下它将返回一个包含那些组所对应值的元组。
groups()	返回一个包含所有小组字符串的元组，从 1 到所含的小组号。

程序：　　　

 import string,re
 r = "a.c" 
 if re.match(r,"abc"): 
 line = re.match(r,"abc")
 print line.group()
 else:
 print 'defeat'

结果：

　　abc

1.3re.search函数

re.search() 扫描整个字符串并返回第一个成功的匹配

　　re.search(pattern, string, flags=0)

　　pattern 正则表达式

　　string 匹配的字符串

　　flags 标志位，用于控制匹配方式

　　和re.match()一样，匹配成功re.search方法返回一个匹配的对象，否则返回None。

　　直接上程序：

import string,re
r = "abc" 
s = 'aacawcabc'
if re.search(r,s): 
line = re.search(r,s)
print line.group()

结果：

abc

注意：

re.match()和re.search()的区别：

　　re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到一个匹配。

1.4re.sub函数

　　re.sub（）函数用于替换匹配项。

　　re.sub(pattern,repl,string,max = 0)

　　pattern 正则表达式

　　repl 替换项

　　string 匹配的字符串

　　count 替换的最大次数缺省值是0 表示替换所有的匹配

　　返回的字符串是在字符串中用 RE 最左边不重复的匹配来替换。如果模式没有发现，字符将被没有改变地返回。

　　程序：

import string,re
pattern = '\d' 
repl = "!" 
s = 'abcdefg' 
line = re.sub(pattern,repl,s)
print line

结果：

!!!!!!!!!abcdefg

1.5正则表达式修饰符 - 可选标志

我们来说说什么是标志位：

正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位 OR(|) 它们来指定。如 re.I | re.M 被设置成 I 和 M 标志：

修饰符	描述
re.I	使匹配对大小写不敏感
re.L	做本地化识别（locale-aware）匹配
re.M	多行匹配，影响 ^ 和 $
re.S	使 . 匹配包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X	该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

程序：　

import string,re
pattern = '[Aa][Bb][Cc][Dd]' 
s = 'AbCd' 
if re.match(pattern,s):
line = re.match(pattern,s)
print line.group()

结果：

AbCd

上面程序可以通过选择标志位来实现：

import string,re
pattern = 'abcd' 
s = 'AbCd' 
if re.match(pattern,s,re.I):
line = re.match(pattern,s,re.I)
print line.group()

结果;

AbCd

1.6re.compile函数

　　使用re的一般步骤是先使用re.compile()函数，将正则表达式的字符串形式编译为Pattern实例，然后使用Pattern实例处理文本并获得匹配结果（一个Match实例），最后使用Match实例获得信息，进行其他的操作。

程序：

import string,re
pattern = re.compile('\d+') 
s = 'aabbccdd' 
if pattern.match(s):
line = pattern.match(s)
print line.group()

结果：

11223344

您可能感兴趣的文章:

零基础写python爬虫之爬虫编写全记录
Python类的基础入门知识
Python3基础之list列表实例解析
Python学习笔记（一）(基础入门之环境搭建)
python基础教程之基本数据类型和变量声明介绍
python基础教程之lambda表达式使用方法
Python3基础之函数用法
python3爬虫之入门基础和正则表达式
Python2.5/2.6实用教程入门基础篇
Python中一些不为人知的基础技巧总结

标签：鞍山三亚梅州六安咸阳恩施绵阳池州

巨人网络通讯声明：本文标题《Python正则表达式之基础篇》，本文关键词 Python,正则,表达式,之,基础,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《Python正则表达式之基础篇》相关的同类信息！

Python正则表达式之基础篇

正则表达式是用于处理字符串的强大工具，它并不是Python的一部分。其他编程语言中也有正则表达式的概念，区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的...

10-18

800电话和400电话的区别，400电话在哪里办理

800电话和400电话的区别，400电话在哪里办理400电话代理商为你解答。 400是主被叫分摊付费业务，800是受话人集中付费业务4...

07-20

外呼系统被投诉多久恢复（外呼系统封号）

本篇文章给大家谈谈外呼系统被投诉多久恢复，以及外呼系统封号对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

08-28

认真只能电话机器人（全自动电话机器人）

今日给各位共享仔细只能电话机器人的常识，其间也会对全主动电话机器人进行解说，假如能可巧处理你现在面对的问题，别...

11-06

食醋行业无序竞争愈演愈烈非一线品牌该如何摆脱困境？

近几年来，随着人们的生活水平不断提高和健康饮食观念的深入人心，调味品受到越来越大的关注，在餐桌文化中扮演着越来...

10-19

济南教育呼叫系统费用-信誉保证

济南教育呼叫系统费用所以这就会影响公司的销量，失去掉一些潜在的客户。不过智能电销机器人就不会出现这种问题，它会...

01-16

通过全渠道联络中心的下一代客户体验

老秦夜译 CTI论坛(ctiforum.com)（编译/老秦）:弗兰克福尔摩斯（FrankSherlock）解释了为什么全渠道不再是一个流行词以及它是如何...

10-21

400开头的是什么电话，开头是区号吗（400开头是哪个地区的号码）

【400开头的是什么电话，开头是区号吗】生活中，相信很多人都接到过400开头的电话，有些人对此号码不够了解，觉得前面的...

11-07

长沙crm外呼系统平台（crm客户外呼系统）

今天给各位分享长沙crm外呼系统平台的知识，其中也会对crm客户外呼系统进行解释，如果能碰巧解决你现在面临的问题，别忘...

11-06

台州高频电销卡办理

台州高频电销卡办理台州高频电销卡办理,台州电销卡办理,台州高频电销卡,台州电销卡一个高效的销售员每天要打出上百通...

06-24

400电话在线办理，提高客户服务效率的新方式

在今天的市场竞争中，提供高效、便捷的客户服务已成为企业赢得竞争优势的关键因素。400电话作为专业的客服服务号码，是...

07-21

阿里和Alphabet等10亿美元押宝AR/VR的真正原因

腾讯科技讯据外媒报道，据投资银行Digi-Capital的陈诉显示，尽管 12 月才刚刚开始，，但是阿里巴巴、谷歌母公司Alphabet、S...

10-15

济南白名单电销卡

济南白名单电销卡 , 办理济南白名单电销卡 ,济南白名单电销卡如何办理龙腾通讯成立于2010年，公司成立9年来一直深耕于...

11-23

重庆400电话代理商哪家比较靠谱如何代办400，代办400电话靠谱吗？

现在，当企业申请400电话时，他们中的大多数人将处理服务提供商或代理。如果重庆的企业想要处理，可以直接找到可靠的...

01-12

济南高居山东省服务外包总量首位

本报讯山东省商务厅日前通报了全省服务外包产业发展情况，作为山东省唯一的国家级服务外包示范城市，济南市在服务外包...

10-22

高德地图怎样修改店铺名字？高德地图怎样修改名字？

高德地图的店铺怎样修改营业时间？高德地图里面是没有店铺的，更不能去修改营业时间了，高德地图只能是导航用的软件...

11-26

Win10提示无法保存IP设置该如何解决

现在修改IP设置已经可以在Windows设置中操作啦，但是有用户说自己保存一些需要手动设置IP地址的地方时，会出现提示无法保...

10-19

沈阳外呼防封系统怎么样（沈阳外呼系统哪家公司做得好）

本文目录一览： 1、防封号外呼软件好不好呢？2、防封号外呼软件真的不会封号吗？3、外呼体系真的能够做到不封号吗?防封...

11-28

电销人工智能机器人的（智能电销机器人好吗）

本文目录一览： 1、电销板滞人是什么？ 2、电销板滞人有什么用？ 3、电销AI板滞人是什么？ 4、人工智能客服板滞人有什么...

11-26

太原不封号电销卡渠道

太原不封号电销卡渠道太原不封号电销卡渠道,太原电销卡渠道,太原不封号电销卡,太原电销卡电销企业往往需要打电话邀请...

06-24

徐州电话机器人如何（电话机器人教程）

本文目录一览：1、机器人打电话优势劣势2、电销机器人和人工相比哪个更好用3、智能电话机器人怎么样?4、现在电销机器人...

07-04

淄博电销获客数据系统（淄博电销招聘）

本篇文章给大家谈谈淄博电销获客数据系统，以及淄博电销招聘对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。...

08-28

青岛人工外呼系统哪家强（青岛客服外包）

本篇文章给大家谈谈青岛人工外呼系统哪家强，以及青岛客服外包对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

05-17

ofo无门槛发送“免费骑行月卡” 行业第一优势进一步巩固

随着橙黄大战进入白热化阶段，行业头部企业ofo小黄车与摩拜单车进行了从性能、车型、押金，到供应链、品牌、运维等多维...

10-16

泸州百家号代运营

其实现在大家应该都清楚运营，但是对于运营来讲也是有好有坏的，也不是每个公司都可以做的很好，随着自媒体的发展，现...

03-01

石景山区电话机器人（石头机器人客服热线）

今天给各位分享石景山区电话机器人的知识，其中也会对石头机器人客服热线进行解释，如果能碰巧解决你现在面临的问题，...

11-06

400电话总代理自己办理400电话比较好，还是找代理平台申请400电话好？

上海通科技是中国电力上海通和移动400电话的一级代理商，负责申请和办理全国400电话业务。是国内最早的400电话服务商，...

01-12

企业在处理400电话前应该知道什么？

企业在处理400电话前应该知道什么？ 400电话是现在企业必备的客服热线。 400电话作为企业唯一的外接电话，品牌统一，来电...

08-14

上海传媒防封号系统哪里有-快讯！

上海传媒防封号系统哪里有也许呼叫中心系统电话线路的日常工作是如此。电销系统不单单进步了工做人员的工做效率，同时...

01-16

400服务电话申请：详尽步骤及注意事项

400服务电话申请：详尽步骤及注意事项在现代社会，随着互联网的快速发展，更多的企业、政府甚至个人都选择了建立400服...

08-14

物联卡应用_直击Chinajoy：感受5G+WiFi的游戏....

2022年，物联网领域突破万亿市场。各种工业级和民用级智能设备层出不穷。物联网卡在物联网设备中起着重要作用，需求也...

11-07

六安朗玛电销卡（六安朗玛电销卡在哪办）

本文目录一览：1、电话营销用什么卡不封号?2、朗玛移动卡实名后做电销有什么风险吗3、朗玛移动电销卡周日能正常使用吗...

07-10

ORACLE应用经验(1)

正在看的ORACLE教程是:ORACLE应用经验(1)。 JAN-1(January) FEB-2(February) MAR-3(March) APR-4(April) MAY-5(May) JUN-6(June) JUL-7(July) AUG-8(August) SE...

10-18

重庆软件与服务外包国际培训学校动工

重庆晨报讯 (记者宋岩)重庆要大力发展软件和服务外包人才，不过人才却是短腿。昨日，重庆软件与服务外包国际培训学校...

10-22

中国电信400电话介绍（中国电信400电话多少）

中国电信4008、4009功能 400电话只需设定一个呼转号码，即可接听全国所有呼叫到400的电话，并可以绑定多部转接电话，无需另...

11-07

铜川朗玛电销卡（朗玛电话卡哪里有卖）

本文目录一览：1、虚拟运营商号码是什么人打的呢?2、电话营销用什么卡不封号?3、朗玛移动卡号无服务4、做电话营销,有没...

对于买衣服的商标来说，任何一个用户都是希望自己更快的使用到商标，那么有什么方法可以快速使用呢？交易平台购买...

10-23

电信火神卡怎么办理，中国电信火神卡19元套餐怎么样

现在的消费者对于流量卡的需要越来越高，要求也越来越高，不仅要资费低的，还要求流量多的，正好，现在中国电信推出了...

10-13

Lua中的变量类型与语句学习总结

1. Lua类型 1.1 基本类型 Lua是一种动态类型语言，没有类型定义的语法。Lua一共有8种基础类型：nil（空）、boolean（布尔）、...

10-18

电销外呼系统哪个好？小型电销中心外呼软件

电销外呼系统哪个好？小型电销中心外呼软件电销外呼系统哪个好？针对传统式电话营销而言，其不仅拥有十分猛烈的...

10-26

简析Win8下虚拟内存的必要性

现在的内存白菜价啊，4G的也就100来块，主流配置都是8G，16G内存，加上新的 Win8 系统，当然是各种给力啊！不少用户就会想...

10-20

上海白名单电销卡去哪办理

上海白名单电销卡去哪办理首先，所谓电话营销，是指利用打电话的方式吸引新客户，联系老客户，询问他们是否有合作的...

12-15

苏州电销AXB防封系统怎么样

苏州电销AXB防封系统怎么样 AXB系统通过中间号实现的是间接通话，非直接拨打，从而实现避免高频检测：拨打方式是A号（自...

11-15

天津电销外呼系统哪家强（天津电销公司）

今天给各位分享天津电销外呼系统哪家强的知识，其中也会对天津电销公司进行解释，如果能碰巧解决你现在面临的问题，别...

08-27

合肥剑夆电销系统哪种好

合肥剑夆电销系统哪种好防封性能强，很多人们都知道电销卡，那么电销卡是什么卡呢？其实电销卡相对于其他的手机卡来...

12-16

400电话申请服务商选什么400电话服务商

400电话业务由国家电信部门统一管理。目前只有电信、中国移动、中国联通三400电话代理大运营商拥有运营权限。但是企业...

01-12

包含商丘电销卡外呼系统线路的词条

今日给各位共享商丘电销卡外呼体系线路的常识，其间也会对进行解说，假如能可巧处理你现在面对的问题，别忘了重视本站...

11-07

杭州电销公司用什么防封卡

杭州电销公司用什么防封卡？杭州防封电销卡,已加入白名单，支持高频呼叫，可以有效解决高频锁卡情况。支持定制套餐，...

11-18

哈尔滨市出台政策促大学生就业三支一扶年增100岗位

东北网3月28日讯据新晚报报道，数据显示，今年哈市户籍未就业高校毕业生达1万人，此外，哈市户籍2008年结转未就业高校毕...

10-22

400电话要怎么申请选择400电话申请平台哪些事情必须要考虑

现阶段我们都能够发现400电话已经是在各行各业遍地开花，其主要的目的都是为了宣传好单位的具体形象以及其实力，不过，...

01-13

Python正则表达式之基础篇

10-18

本页收集关于Python正则表达式之基础篇的相关信息资讯供网民参考！

推荐文章

上一篇：正则表达式限制账号密码邮箱身份证手机号的相关代码

下一篇：Java正则表达式提取字符的方法实例

一起分享吧