Python爬虫正则表达式常用符号和方法-巨人网络通讯

主页 > 知识库 > Python爬虫正则表达式常用符号和方法

Python爬虫正则表达式常用符号和方法

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。

1、常用符号

. ：匹配任意字符，换行符 \n 除外

：匹配前一个字符0次或无限次
? ：匹配前一个字符0次或1次

.* ：贪心算法，尽可能的匹配多的字符

.*? ：非贪心算法

() ：括号内的数据作为结果返回

2、常用方法

findall：匹配所有符合规律的内容，返回包含结果的列表

Search：匹配并提取第一个符合规律的内容，返回一个正则表达式对象

Sub：替换符合规律的内容，返回替换后的值

3、使用示例

（1）. 的使用举例，匹配任意字符，换行符 \n 除外

import re #导入re库文件

a = 'xy123'

b = re.findall('x..',a)

print b

打印的结果为：['xy1'] ，每个 . 表示一个占位符

（2） * 的使用举例，匹配前一个字符0次或无限次

a = 'xyxy123'

b = re.findall('x*',a)

print b

打印的结果为：['x', '', 'x', '', '', '', '', '']

（3） ? 的使用举例，匹配前一个字符0次或1次

a = 'xy123'

b = re.findall('x?',a)

print b

打印的结果为：['x', '', '', '', '', '']

（4） .* 的使用举例

secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'

b = re.findall('xx.*xx',secret_code)

print b

打印的结果为：['xxIxxfasdjifja134xxlovexx23345sdfxxyouxx']

（5）.*？的使用举例

secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'

c = re.findall('xx.*?xx',secret_code)

print c

打印的结果为：['xxIxx', 'xxlovexx', 'xxyouxx']

（6） ()的使用举例

secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'

d = re.findall('xx(.*?)xx',secret_code)

print d

打印的结果为：['I', 'love', 'you'] ，括号内的数据作为返回的结果

（7） re.S的使用举例

s = '''sdfxxhello

xxfsdfxxworldxxasdf'''

d = re.findall('xx(.*?)xx',s,re.S)

print d

打印的结果为：['hello\n', 'world'] ，re.S的作用是使 . 在匹配时包括 \n

（8） findall的使用举例

s2 = 'asdfxxIxx123xxlovexxdfd'

f2 = re.findall('xx(. ?)xx123xx(. ?)xx',s2)

print f20

打印的结果为：love

这时f2为含有一个元组的列表，该元组包含两个元素，该元组中的两个元素为两个()匹配到的内容，如果s2包含多个'xx(. ?)xx123xx(. ?)xx'这样的子串，则f2包含多个元组；

（9） search的使用举例

s2 = 'asdfxxIxx123xxlovexxdfd'

f = re.search('xx(. ?)xx123xx(. ?)xx',s2).group(2)

print f

打印的结果为：love

.group(2) 表示返回第二个括号匹配到的内容，如果是 .group(1), 则打印的就是：I

（10）sub的使用举例

s = '123rrrrr123'

output = re.sub('123(.*?)123','123%d123'%789,s)

print output

打印的结果为：123789123

其中的%d类似于C语言中的%d，如果 output=re.sub('123(.*?)123','123789123',s)，输出结果也为： 123789123

（11） \d 的使用举例，用于匹配数字

a = 'asdfasf1234567fasd555fas'

b = re.findall('(\d+)',a)

print b

打印的结果为：['1234567', '555'] ， \d+ 可以匹配数字字符串；

以上就是python爬虫正则表达式的一些常用符号和语法，希望对python初学者学习有所帮助。

您可能感兴趣的文章:

零基础写python爬虫之神器正则表达式
Python的爬虫包Beautiful Soup中用正则表达式来搜索
python3爬虫之入门基础和正则表达式
python爬虫正则表达式使用技巧及爬取个人博客的实例讲解
python爬虫正则表达式之处理换行符
玩转python爬虫之正则表达式
Python爬虫之正则表达式基本用法实例分析
Python 爬虫学习笔记之正则表达式
Python爬虫之正则表达式的使用教程详解
Python爬虫教程之利用正则表达式匹配网页内容

标签：咸阳三亚绵阳池州梅州六安鞍山恩施

巨人网络通讯声明：本文标题《Python爬虫正则表达式常用符号和方法》，本文关键词 Python,爬虫,正则,表达式,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《Python爬虫正则表达式常用符号和方法》相关的同类信息！

Python爬虫正则表达式常用符号和方法

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这...

10-18

中国电信400电话介绍（中国电信400电话多少）

中国电信4008、4009功能 400电话只需设定一个呼转号码，即可接听全国所有呼叫到400的电话，并可以绑定多部转接电话，无需另...

11-07

天津电销外呼系统哪家强（天津电销公司）

今天给各位分享天津电销外呼系统哪家强的知识，其中也会对天津电销公司进行解释，如果能碰巧解决你现在面临的问题，别...

08-27

高德地图怎样修改店铺名字？高德地图怎样修改名字？

高德地图的店铺怎样修改营业时间？高德地图里面是没有店铺的，更不能去修改营业时间了，高德地图只能是导航用的软件...

11-26

400电话在线办理，提高客户服务效率的新方式

在今天的市场竞争中，提供高效、便捷的客户服务已成为企业赢得竞争优势的关键因素。400电话作为专业的客服服务号码，是...

07-21

上海白名单电销卡去哪办理

上海白名单电销卡去哪办理首先，所谓电话营销，是指利用打电话的方式吸引新客户，联系老客户，询问他们是否有合作的...

12-15

重庆软件与服务外包国际培训学校动工

重庆晨报讯 (记者宋岩)重庆要大力发展软件和服务外包人才，不过人才却是短腿。昨日，重庆软件与服务外包国际培训学校...

10-22

青岛人工外呼系统哪家强（青岛客服外包）

本篇文章给大家谈谈青岛人工外呼系统哪家强，以及青岛客服外包对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

05-17

合肥剑夆电销系统哪种好

合肥剑夆电销系统哪种好防封性能强，很多人们都知道电销卡，那么电销卡是什么卡呢？其实电销卡相对于其他的手机卡来...

12-16

苏州电销AXB防封系统怎么样

苏州电销AXB防封系统怎么样 AXB系统通过中间号实现的是间接通话，非直接拨打，从而实现避免高频检测：拨打方式是A号（自...

11-15

太原不封号电销卡渠道

太原不封号电销卡渠道太原不封号电销卡渠道,太原电销卡渠道,太原不封号电销卡,太原电销卡电销企业往往需要打电话邀请...

06-24

400电话申请服务商选什么400电话服务商

400电话业务由国家电信部门统一管理。目前只有电信、中国移动、中国联通三400电话代理大运营商拥有运营权限。但是企业...

01-12

电销人工智能机器人的（智能电销机器人好吗）

本文目录一览： 1、电销板滞人是什么？ 2、电销板滞人有什么用？ 3、电销AI板滞人是什么？ 4、人工智能客服板滞人有什么...

11-26

简析Win8下虚拟内存的必要性

现在的内存白菜价啊，4G的也就100来块，主流配置都是8G，16G内存，加上新的 Win8 系统，当然是各种给力啊！不少用户就会想...

10-20

徐州电话机器人如何（电话机器人教程）

本文目录一览：1、机器人打电话优势劣势2、电销机器人和人工相比哪个更好用3、智能电话机器人怎么样?4、现在电销机器人...

07-04

电信火神卡怎么办理，中国电信火神卡19元套餐怎么样

现在的消费者对于流量卡的需要越来越高，要求也越来越高，不仅要资费低的，还要求流量多的，正好，现在中国电信推出了...

10-13

800电话和400电话的区别，400电话在哪里办理

800电话和400电话的区别，400电话在哪里办理400电话代理商为你解答。 400是主被叫分摊付费业务，800是受话人集中付费业务4...

07-20

企业在处理400电话前应该知道什么？

企业在处理400电话前应该知道什么？ 400电话是现在企业必备的客服热线。 400电话作为企业唯一的外接电话，品牌统一，来电...

08-14

外呼系统被投诉多久恢复（外呼系统封号）

本篇文章给大家谈谈外呼系统被投诉多久恢复，以及外呼系统封号对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

08-28

上海传媒防封号系统哪里有-快讯！

上海传媒防封号系统哪里有也许呼叫中心系统电话线路的日常工作是如此。电销系统不单单进步了工做人员的工做效率，同时...

01-16

济南教育呼叫系统费用-信誉保证

济南教育呼叫系统费用所以这就会影响公司的销量，失去掉一些潜在的客户。不过智能电销机器人就不会出现这种问题，它会...

01-16

电销外呼系统哪个好？小型电销中心外呼软件

电销外呼系统哪个好？小型电销中心外呼软件电销外呼系统哪个好？针对传统式电话营销而言，其不仅拥有十分猛烈的...

10-26

ofo无门槛发送“免费骑行月卡” 行业第一优势进一步巩固

随着橙黄大战进入白热化阶段，行业头部企业ofo小黄车与摩拜单车进行了从性能、车型、押金，到供应链、品牌、运维等多维...

10-16

400电话要怎么申请选择400电话申请平台哪些事情必须要考虑

现阶段我们都能够发现400电话已经是在各行各业遍地开花，其主要的目的都是为了宣传好单位的具体形象以及其实力，不过，...

01-13

长沙crm外呼系统平台（crm客户外呼系统）

今天给各位分享长沙crm外呼系统平台的知识，其中也会对crm客户外呼系统进行解释，如果能碰巧解决你现在面临的问题，别忘...

11-06

ORACLE应用经验(1)

正在看的ORACLE教程是:ORACLE应用经验(1)。 JAN-1(January) FEB-2(February) MAR-3(March) APR-4(April) MAY-5(May) JUN-6(June) JUL-7(July) AUG-8(August) SE...

10-18

石景山区电话机器人（石头机器人客服热线）

今天给各位分享石景山区电话机器人的知识，其中也会对石头机器人客服热线进行解释，如果能碰巧解决你现在面临的问题，...

11-06

淄博电销获客数据系统（淄博电销招聘）

本篇文章给大家谈谈淄博电销获客数据系统，以及淄博电销招聘对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。...

08-28

阿里和Alphabet等10亿美元押宝AR/VR的真正原因

腾讯科技讯据外媒报道，据投资银行Digi-Capital的陈诉显示，尽管 12 月才刚刚开始，，但是阿里巴巴、谷歌母公司Alphabet、S...

10-15

400电话总代理自己办理400电话比较好，还是找代理平台申请400电话好？

上海通科技是中国电力上海通和移动400电话的一级代理商，负责申请和办理全国400电话业务。是国内最早的400电话服务商，...

01-12

台州高频电销卡办理

台州高频电销卡办理台州高频电销卡办理,台州电销卡办理,台州高频电销卡,台州电销卡一个高效的销售员每天要打出上百通...

06-24

Lua中的变量类型与语句学习总结

1. Lua类型 1.1 基本类型 Lua是一种动态类型语言，没有类型定义的语法。Lua一共有8种基础类型：nil（空）、boolean（布尔）、...

10-18

400服务电话申请：详尽步骤及注意事项

400服务电话申请：详尽步骤及注意事项在现代社会，随着互联网的快速发展，更多的企业、政府甚至个人都选择了建立400服...

08-14

买衣服的商标有什么方法可以快速使用呢？

对于买衣服的商标来说，任何一个用户都是希望自己更快的使用到商标，那么有什么方法可以快速使用呢？交易平台购买...

10-23

400开头的是什么电话，开头是区号吗（400开头是哪个地区的号码）

【400开头的是什么电话，开头是区号吗】生活中，相信很多人都接到过400开头的电话，有些人对此号码不够了解，觉得前面的...

11-07

重庆400电话代理商哪家比较靠谱如何代办400，代办400电话靠谱吗？

现在，当企业申请400电话时，他们中的大多数人将处理服务提供商或代理。如果重庆的企业想要处理，可以直接找到可靠的...

01-12

认真只能电话机器人（全自动电话机器人）

今日给各位共享仔细只能电话机器人的常识，其间也会对全主动电话机器人进行解说，假如能可巧处理你现在面对的问题，别...

11-06

济南高居山东省服务外包总量首位

本报讯山东省商务厅日前通报了全省服务外包产业发展情况，作为山东省唯一的国家级服务外包示范城市，济南市在服务外包...

10-22

食醋行业无序竞争愈演愈烈非一线品牌该如何摆脱困境？

近几年来，随着人们的生活水平不断提高和健康饮食观念的深入人心，调味品受到越来越大的关注，在餐桌文化中扮演着越来...

10-19

杭州电销公司用什么防封卡

杭州电销公司用什么防封卡？杭州防封电销卡,已加入白名单，支持高频呼叫，可以有效解决高频锁卡情况。支持定制套餐，...

11-18

物联卡应用_直击Chinajoy：感受5G+WiFi的游戏....

2022年，物联网领域突破万亿市场。各种工业级和民用级智能设备层出不穷。物联网卡在物联网设备中起着重要作用，需求也...

11-07

泸州百家号代运营

其实现在大家应该都清楚运营，但是对于运营来讲也是有好有坏的，也不是每个公司都可以做的很好，随着自媒体的发展，现...

03-01

通过全渠道联络中心的下一代客户体验

老秦夜译 CTI论坛(ctiforum.com)（编译/老秦）:弗兰克福尔摩斯（FrankSherlock）解释了为什么全渠道不再是一个流行词以及它是如何...

10-21

沈阳外呼防封系统怎么样（沈阳外呼系统哪家公司做得好）

本文目录一览： 1、防封号外呼软件好不好呢？2、防封号外呼软件真的不会封号吗？3、外呼体系真的能够做到不封号吗?防封...

11-28

哈尔滨市出台政策促大学生就业三支一扶年增100岗位

东北网3月28日讯据新晚报报道，数据显示，今年哈市户籍未就业高校毕业生达1万人，此外，哈市户籍2008年结转未就业高校毕...

10-22

济南白名单电销卡

济南白名单电销卡 , 办理济南白名单电销卡 ,济南白名单电销卡如何办理龙腾通讯成立于2010年，公司成立9年来一直深耕于...

11-23

六安朗玛电销卡（六安朗玛电销卡在哪办）

本文目录一览：1、电话营销用什么卡不封号?2、朗玛移动卡实名后做电销有什么风险吗3、朗玛移动电销卡周日能正常使用吗...

07-10

Win10提示无法保存IP设置该如何解决

现在修改IP设置已经可以在Windows设置中操作啦，但是有用户说自己保存一些需要手动设置IP地址的地方时，会出现提示无法保...

今日给各位共享商丘电销卡外呼体系线路的常识，其间也会对进行解说，假如能可巧处理你现在面对的问题，别忘了重视本站...

11-07

铜川朗玛电销卡（朗玛电话卡哪里有卖）

本文目录一览：1、虚拟运营商号码是什么人打的呢?2、电话营销用什么卡不封号?3、朗玛移动卡号无服务4、做电话营销,有没...

07-10

Python爬虫正则表达式常用符号和方法

10-18

本页收集关于Python爬虫正则表达式常用符号和方法的相关信息资讯供网民参考！

推荐文章

上一篇：正则表达式断言、巡视（Assertions）、正向断言、反向断言介绍

下一篇：基于Python正则表达式提取搜索结果中的站点地址

一起分享吧