【Python基础知识】常用内建模块-re

发布 : 优就业IT培训      来源:

2021-10-29 14:50:16

编程语言中的正则表达式用于描述搜索模式的特殊文本字符串。这对于从文本(如代码、日志、文档、电子表格等)中提取信息非常有用。使用正则表达式时,首先要认识到的是,所有内容本质上都是一个字符。ASCII或拉丁字母是键盘上的字母,Unicode用于匹配外来文本,它包括数字和标点符号以及所有特殊字符,如$、#、@、!、%等。

例如,正则表达式可以告诉程序从字符串中搜索特定文本,然后相应地打印出结果。正则表达式可以包括文字匹配、重复、分支、模式组成等。

在Python中,正则表达式通过re模块导入。元字符是具有特殊含义的字符,用来匹配特定文本。常用的元字符如表所示。

re模块中定义了一些函数,分别对应不同的匹配模式。

findall()函数用于返回包含所有匹配项的字符串列表:

  1. >>> import re # 导入re模块,以下示例都将省略这行代码
  2. >>> s = 'hello 12 hi 89. How 34'
  3. >>> pattern = '\d+' # 匹配数字
  4. >>> result = re.findall(pattern, s)
  5. >>> print(result)
  6. ['12', '89', '34']

split()函数用于在存在匹配项的情况下拆分字符串,并返回发生拆分的字符串列表:

  1. >>> s = 'python:234, java 90' # 将数字作为分隔符
  2. >>> pattern = '\d+'
  3. >>> result = re.split(pattern, s)
  4. >>> print(result)
  5. ['python:', ', java ', '']

如果不存在匹配项,那么split()函数返回一个包含空字符串的列表。可以将maxsplit参数传递给split()函数,maxsplit代表最大拆分次数:

  1. >>> s = 'python:234, java 90'
  2. >>> pattern = '\d+'
  3. >>> result = re.split(pattern, s, 1) # 分割最大值是1,即拆成两份
  4. >>> print(result)
  5. ['python:', ', java 90']

sub()函数用于返回一个字符串,其中匹配到的匹配项被替换变量的内容替换:

  1. >>> s = 'abc 12\
  2. ... de 23 \n f45 6'
  3. >>> pattern = '\s+' # 匹配空白字符
  4. >>> replace = '' # 用空字符串替换匹配项
  5. >>> new_string = re.sub(pattern, replace, s)
  6. >>> print(new_string) # 完成替换
  7. abc12de23f456

如果不存在匹配项,那么sub()函数返回原始字符串。

subn()函数与sub()函数类似,只不过subn()函数返回一个包含2个项的元组,其中包含新字符串和进行替换的次数:

  1. >>> s = 'abc 12\
  2. ... de 23 \n f45 6'
  3. >>> pattern = '\s+'
  4. >>> replace = ''
  5. >>> new_string = re.subn(pattern, replace, s)
  6. >>> print(new_string)
  7. ('abc12de23f456', 4)

search()函数采用两个参数,分别是匹配模式和字符串。该函数查找正则表达式模式与字符串匹配的第一个位置。如果匹配成功,那么search()函数返回一个match对象;否则返回None:

  1. >>> s = 'Python is fun'
  2. >>> match = re.search('\APython', s) # 检查'Python'是否在开头
  3. >>> print(match) # 返回一个对象
  4. <_sre.SRE_Match object; span=(0, 6), match=&#39;Python&#39;>

上面的match变量包含着match对象,match对象的re属性返回一个正则表达式对象,string属性返回传递的字符串:

  1. >>> match.re
  2. re.compile(&#39;\\APython&#39;)
  3. >>> match.string
  4. &#39;Python is fun&#39;

THE END  

声明:本站稿件版权均属中公教育优就业所有,未经许可不得擅自转载。

领取零基础自学IT资源

涉及方向有Java、Web前端、UI设计、软件测试、python等科目,内容包含学习路线、视频、源码等

点击申请领取资料

点击查看资料详情 

收起 


 相关推荐

问题解答专区
返回顶部