Django 用户认证 用户 邮箱登录 邮箱注册 ORM or,and,not form.py FORM ModelForm Paginator 分页 HTMl JQuery 定位元素 ajax django切片 restfulapi 跨域 Ubantu Python Mysql Scrapy 爬虫 导出 Python读写 Pycharm 破解 session re sqlit3 生成式 其他 Prism 富文本 CSS Nginx 部署 请求头 抓包 协议 selenium Ubuntu 宝塔 AI Comfy-ui ollama dify open-webui Git docker
正则表达式常用函数
张建行 2020年6月2日 13:04 39 文章标签: 爬虫 re

正则表达式常用函数

match():

是以字符串的开头位置进行匹配,仅限于开头位置,匹配成功返回match对象,否则返回的None

 obj = re.compile('(a?)')
 res = re.match(obj, 'abcdefg')
 print(res.group(1))

search():

从目标字符串的任意位置开始匹配数据,仅匹配成功一次,如果目标字符串有多个符合要求的结构,也只能匹配一个

 obj = re.compile('my')
 res = re.search(obj, 'hahahamyhehiehiehiemy')
 print(res[0])

findall():

搜索整个目标字符串,会将所有匹配成功的字符串返回出来,返回的数据是列表类型

 obj = re.compile('my')
 res = re.findall(obj, 'hahahamyheiheiheimy1111my2222my')
 print('-----', res[0])
 print('+++++', res[1])
 print('=====', res[2])
 print('=====', res[3])

split():

以匹配到的符合要求的字符串为分隔符,将目标字符串隔成一个列表

 obj = re.compile('my')
 res = re.split(obj, 'hahahamyheiheiheimy1111my2222')
 print(res)

sub():

使用一个新的字符来替换目标字符串中符合匹配要求的字符

 obj = re.compile('-')
 res = re.sub(obj, '+', 'a-b-c-d')
 print('替换好的结果:', res)