Python模块学习 ---- re正则表达式

知行编程网 2022-01-04 18:09 知行编程网 | 隐藏边栏 | 抢沙发 | 4 0

文章评分 0 次，平均分 0.0 ：

re模块

Python自带了匹配字符串的模块re，我们可以通过该模块对字符串进行（模糊）匹配，提取出我们需要的内容。

re模块中很多功能都是基于正则表达式实现的。正则表达式是一种特殊的字符序列，它能帮助我们去检查字符串是否与某种模式相匹配。

将正则表达式编译成正则对象，搭配match、search、findall等等进行匹配。

从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。

扫描整个字符串，返回第一个成功的匹配，如果匹配失败，返回None。

以string列表形式返回string中pattern的所有非重叠匹配项。从左到右扫描该字符串，并以找到的顺序返回匹配项。如果该模式中存在一个或多个组，则返回一个组列表；否则，返回一个列表。如果模式包含多个组，则这将是一个元组列表。空匹配项包含在结果中。

import re
# 匹配包含所有带有o的单次
r= re.findall('wow+', 'how are you')
print(r) # ['how', 'you']
# * 前的字符可以是0个或者多个。返回list
r = re.findall('好*', '你好吗？我很好。你好才是真的好。你好好了')
print(r) # ['', '好', '', '', '', '', '好', '', '', '好', '', '', '', '', '好', '', '', '好好', '', '']
r = re.findall('你好*', '你好吗？我很好。你好才是真的好。你好好了')
print(r) # ['你好', '你好', '你好好']
# + 用于匹配字符一次或者多次
r = re.findall('好+', '你好吗？我很好。你好才是真的好。你好好了')
print(r) # ['好', '好', '好', '好', '好好']
r = re.findall('你好+', '你好吗？我很好。你好才是真的好。你好好了')
print(r) # ['你好', '你好', '你好好']
# $ 用来匹配结尾
r = re.findall('测试$', '测试小姐姐还没对象')
print(r) # []
r = re.findall('测试$', '小姐姐我的代码还没测试')
print(r) # ['测试']
# ^ 用来匹配开始
r = re.findall('^小姐姐', '小姐姐我的代码还没测试')
print(r) # ['小姐姐']
# ^ 用于字符集中表示取反
# 匹配所有除字母外的字符
r = re.findall('[^a-z]', '123abcde789')
print(r) # ['1', '2', '3', '7', '8', '9']

split能够按照所能匹配的字串将字符串进行切分，返回切分后的字符串列表

以上仅演示了部分正则的语法，更多正则语法可以参考下表。

本文为原创文章，版权归知行编程网所有，欢迎分享本文，转载请保留出处！

知行编程网关注：1 粉丝：1

这个人很懒，什么都没写