Python 正则表达式常用方法示例汇总

RE 模块的方法

RE 正则表达式写法（词组整体出现次数的写法）

相比常规的正则表达式，词组的写法是添加?:这个特殊标志
最外围（）是需要截取的字符串
此问题参考网站

>>>pattern_index=re.compile(r'((?:qsyn\-)?logstash[\-a-z0-9\.]+)') ### 用来匹配带有qsyn- 和不带qsyn- 的字符串
>>>pattern_index.findall("green  open   qsyn-logstash-logs-2018.12.20     zdmqszKURqGmnfUxr6CkwQ   ")
['qsyn-logstash-logs-2018.12.20']
>>>pattern_index.findall("green  open   logstash-logs-2018.12.20     zdmqszKURqGmnfUxr6CkwQ   ")
['logstash-logs-2018.12.20']
>>>pattern_index=re.compile(r'((?:qsyn\-)?logstash[\-a-z0-9\.]+)0')
>>>pattern_index.findall("green  open   logstash-logs-2018.12.20     zdmqszKURqGmnfUxr6CkwQ   ")
['logstash-logs-2018.12.2']  ####  注意表达式的区别，并且外围（） 的区别

re.compile(pattern) ## 将正则表达式pattern 编译成 pattern对象
parttern=re.compile(r'[0-9]+\.com$')

## match (默认从头部开始匹配，除非特殊指定起始位置)返回 字符串对象
a=parttern.match('123.com') ## match 匹配以后返回 字符串对象
print a
<_sre.SRE_Match object at 0x10cd838b8>
a.group()
'123.com'
## 不区分大小写 和 分组示例
pattern=re.compile(r"([a-z]+) ([a-z]+)",re.I) ### 不区分大小写；分组
m=pattern.match("hello wWWWd")
m.group()
'hello wWWWd'
m.group(1)
'hello'
m.group(2)
'wWWWd'
m.span(0)    # 返回匹配成功的整个子串的索引
(0, 11)


## search 较match比较，可以匹配任意位置，匹配一次成功后则完成;注意以下区别
m=pattern.match("123hello worLD")
print m
None
m=pattern.search("123hello worLD")
print m
<_sre.SRE_Match object at 0x10d038250>

findall 方法：以列表形式查找所有匹配的结果，如果有则返回列表

finditer 方法：类似于 findall，不过返回的是 iter 迭代对象

m=pattern.findall("123hello worLD 23423ECH WORLDBEST")
print m
[('hello', 'worLD'), ('ECH', 'WORLDBEST')
pattern2=re.compile(r"[a-z]+",re.I)
n=pattern2.findall("123hello worLD 23423ECH WORLDBES")
print n
['hello', 'worLD', 'ECH', 'WORLDBES']
### find iter
t=pattern2.finditer("123hello worLD 23423ECH WORLDBES")
for i in t:
    print i.group()
    
hello
worLD
ECH
WORLDBES

t=pattern2.finditer("123hello worLD 23423ECH WORLDBES")
for i in t:
    print i
    
<_sre.SRE_Match object at 0x10cd83988>
<_sre.SRE_Match object at 0x10cd839f0>
<_sre.SRE_Match object at 0x10cd83988>
<_sre.SRE_Match object at 0x10cd839f0>

split 方法：可以理解成取反，即将匹配到的字符串的分隔符（分割字符串）以列表的形式返回.常用于多个分隔符分割字符串时使用。

p=pattern2.split("123hello worLD 23423ECH WORLDBES")
print p
['123', ' ', ' 23423', ' ', '']
n=pattern2.findall("123hello worLD 23423ECH WORLDBES")
print n
['hello', 'worLD', 'ECH', 'WORLDBES'
>>>print test
a-b-c.d.e.f.g
>>>print re.split(r"[.\-]",test)
['a', 'b', 'c', 'd', 'e', 'f', 'g']

sub 方法：用于替换，shell 中的 sed

sub(repl, string[, count]) :

pattern3=re.compile(r"[0-9]+")
s="hello123world456"
p=pattern3.sub("AAAAAA",s) ## 用AAAAAA 替换所有匹配到的
print p
helloAAAAAAworldAAAAAA
def fun(m):
    return "hi"+m.group()
p=pattern3.sub(fun,s)  ## 利用def 的 fun函数将匹配到的结果进行处理后替换。注意group() 的使用
print p
hellohi123worldhi456
p=pattern3.sub(fun,s,1)  ## 只匹配一次
print p
hellohi123world456

subn 方法：与 sub 的方法行为类似，也用于替换:返回一个元组（字符串，匹配次数）

p=pattern3.subn("AAAAAA",s)
print p
('helloAAAAAAworldAAAAAA', 2)
p=pattern3.subn(fun,s)
print p
('hellohi123worldhi456', 2)
p=pattern3.subn(fun,s,1)
print p
('hellohi123world456', 1)

DUTCTF 2015 RE50

实验吧平台升级维护中从 FLAG 上来看，应该是 DUTCTF 的原题，中等难度。50 分也不高。 [图片] 首先搜索字符串，找到 flag 字样，然后上溯到函数头。之后对这段汇编代码进行分析，等效的伪代码是： char str1[0x32]; //ebp - 0x64 char str2[0x32] = 'kow' ..

Python 知识总结

[图片] python 知识总结--简介 - 问尤龙の时光 (wenyoulong.com) python 知识总结--基础语法 - 问尤龙の时光 (wenyoulong.com) python 知识总结--常用数据结构 - 问尤龙の时光 (wenyoulong.com) Python 知识总结--高级 - 问尤龙の时 ..

python 基础 3- 函数

函数函数可以认为是提供一种功能，当我们需要使用该功能时，就可以来调用该函数。 Python 中，函数可以分为两种：内建函数：可以直接去访问的函数，例如 print,input,id,len 等自定义函数：当我们需要的功能，Python 没有提供给我们时，我们可以自行来实现。为什么使用函数：我们要实现的功能，未必 ..

安装 Python 3.11 在 Ubuntu 20.04 中

python3.11 版本说明 Python 3.11 是开源编程语言 Python 的最新主要版本之一。相比之前的 Python 3.10，它引入了各种新特性、增强功能和 Bug 修复。Python 以易用性、语言清晰度和适应性而闻名。因此，它一直是 Web 开发、科学计算、数据分析和人工智能等领域的首要选项。以下 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

Python 正则表达式常用方法示例汇总

RE 模块的方法

RE 正则表达式写法（词组整体出现次数的写法）

findall 方法：以列表形式查找所有匹配的结果，如果有则返回列表

finditer 方法：类似于 findall，不过返回的是 iter 迭代对象

split 方法：可以理解成取反，即将匹配到的字符串的分隔符（分割字符串）以列表的形式返回.常用于多个分隔符分割字符串时使用。

sub 方法：用于替换，shell 中的 sed

sub(repl, string[, count]) :

subn 方法：与 sub 的方法行为类似，也用于替换:返回一个元组（字符串，匹配次数）

相关帖子

DUTCTF 2015 RE50

Python 知识总结

Pyinstaller 的使用指南

python 基础 3- 函数

安装 Python 3.11 在 Ubuntu 20.04 中

混合精度方法

改动

欢迎来到这里！

Python 正则表达式常用方法示例汇总

RE 模块的方法

RE 正则表达式 写法（词组整体出现次数的写法）

findall 方法： 以列表形式查找所有匹配的结果，如果有则返回列表

finditer 方法：类似于 findall，不过返回的是 iter 迭代对象

split 方法： 可以理解成取反，即将匹配到的字符串的分隔符（分割字符串）以列表的形式返回.常用于多个分隔符分割字符串时使用。

sub 方法： 用于替换，shell 中的 sed

sub(repl, string[, count]) :

subn 方法：与 sub 的方法行为类似，也用于替换:返回一个元组（字符串，匹配次数）

相关帖子

DUTCTF 2015 RE50

Python 知识总结

Pyinstaller 的使用指南

python 基础 3- 函数

安装 Python 3.11 在 Ubuntu 20.04 中

混合精度方法

改动

欢迎来到这里！

RE 正则表达式写法（词组整体出现次数的写法）

findall 方法：以列表形式查找所有匹配的结果，如果有则返回列表

split 方法：可以理解成取反，即将匹配到的字符串的分隔符（分割字符串）以列表的形式返回.常用于多个分隔符分割字符串时使用。

sub 方法：用于替换，shell 中的 sed