旗下产业: A产业/ A实习/ A计划
全国统一咨询热线:010-5367 2995
首页 > 热门文章 > 大数据分析 > 大数据分析Python正则表达式有哪些

大数据分析Python正则表达式有哪些

时间:2020-09-22来源:www.aaa-cg.com.cn点击量:作者:Sissi
时间:2020-09-22点击量:作者:Sissi



  学习大数据分析的难点在于记住所有语法。在AAA教育时,我们提倡习惯于查阅Python文档,有时可以得到方便的PDF参考,这很好,因此我们整理了此Python正则表达式(regex)备忘单,为您提供帮助!
 

  此正则表达式备忘单基于Python 3的正则表达式文档。
 

  如果您对学习Python感兴趣,我们可以免费提供交互式的初学者和中级Python编程课程。
 

  大数据分析的正则表达式(PDF)

大数据分析Python正则表达式有哪些
 

  特殊的角色
 

  ^| 在字符串的开头匹配表达式右侧。它匹配\n字符串中每个这样的实例。
 

  $| 将表达式匹配到字符串末尾的左侧。它匹配\n字符串中每个这样的实例。
 

  .| 匹配除行终止符(如)以外的任何字符\n。
 

  \| 转义特殊字符或表示字符类。
 

  A|B| 匹配表达式A或B。如果A先匹配,B则不试。
 

  +| 贪婪地匹配表达式左侧1次或多次。
 

  *| 贪婪地将表达式左对齐0次或多次。
 

  ?| 贪婪地将表达式左对齐0或1次。但是,如果?将其添加到限定词(+,*和?本身)中,它将以非贪婪的方式执行匹配。
 

  {m}| 将表达式匹配到其剩余m时间,且不少于该时间。
 

  {m,n}| 将表达式的左边m与n时间匹配,而不是更少。
 

  {m,n}?| 将表达式匹配到其剩余m时间,并忽略n。见?上文。
 

  字符类(又名特殊序列)
 

  \w| 匹配字母数字字符,该装置a-z,A-Z和0-9。它还与下划线匹配_。
 

  \d| 匹配数字,表示0-9。
 

  \D| 匹配任何非数字。
 

  \s| 匹配空白字符,其中包括\t,\n,\r,和空格字符。
 

  \S| 匹配非空格字符。
 

  \b| 在单词的开头和结尾(即\w和之间)匹配边界(或空字符串)\W。
 

  \B| 匹配\b不匹配的地方,即\w字符的边界。
 

  \A| 无论是单行还是多行模式,都在字符串的绝对开头处将表达式与右侧匹配。
 

  \Z| 无论是单行还是多行模式,都将表达式与字符串的绝对结尾处的左侧匹配。
 

  套装
 

  [ ]| 包含一组要匹配的字符。
 

  [amk]| 匹配要么a,m或k。不匹配amk。
 

  [a-z]| 匹配从a到的任何字母z。
 

  [a\-z]| 匹配a,-或z。-之所以匹配是因为\逃脱了它。
 

  [a-]| 与a或匹配-,因为-未用于表示一系列字符。
 

  [-a]| 如上所述,匹配a或-。
 

  [a-z0-9]| 从匹配的字符a来z,也从0到9。
 

  [(+*)]| 特殊字符集内成为常量,因此本场比赛(,+,*,和)。
 

  [^ab5]| 添加^不包括集合中的任何字符。在这里,它匹配不在字符a,b或5。
 

  团体
 

  ( )| 匹配括号内的表达式并将其分组。
 

  (? )| 这样的括号内,?作为扩展符号。其含义取决于其右边的字符。
 

  (?PAB)| 匹配表达式AB,并且可以使用组名进行访问。
 

  (?aiLmsux)| 这里a,i,L,m,s,u,和x一些标志:
 

  1)a —仅匹配ASCII

  2)i —忽略大小写

  3)L —取决于语言环境

  4)m —多线

  5)s —全部匹配

  6)u —匹配unicode

  7)x —详细
 

  (?:A)| 匹配由表示的表达式A,但与不同的是(?PAB),以后无法检索它。
 

  (?#...)| 一条评论。内容供我们阅读,而不是匹配。
 

  A(?=B)| 前瞻性断言。A仅当其后跟时,此表达式才匹配B。
 

  A(?!B)| 否定超前断言。A仅当表达式不后跟时,此表达式才匹配B。
 

  (?<=B)A| 断言肯定。A仅当表达式B紧靠其左侧时,它才与表达式匹配。这只能匹配固定长度的表达式。
 

  (?
 

  (?P=name)| 匹配与名为“ name”的早期组匹配的表达式。
 

  (...)\1| 该数字1对应于要匹配的第一个组。如果我们要匹配同一表达式的更多实例,只需使用其数字而不是再次写出整个表达式。我们可以从使用1多达99这些群体及其相应的编号。
 

  流行的Python re模块功能

  re.findall(A, B)| 匹配A字符串中表达式的所有实例,B并在列表中返回它们。
 

  re.search(A, B)| 匹配A字符串中表达式的第一个实例B,并将其作为重新匹配对象返回。
 

  re.split(A, B)| 使用定界符将字符串B拆分为列表A。
 

  re.sub(A, B, C)| 替换A用B的字符串C。

 

预约申请免费试听课

填写下面表单即可预约申请免费试听!怕钱不够?可先就业挣钱后再付学费! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可推荐就业!

©2007-2021/北京漫动者教育科技有限公司版权所有
备案号:京ICP备12034770号

©2007-2022/ www.aaa-cg.com.cn 北京漫动者数字科技有限公司 备案号: 京ICP备12034770号 监督电话:010-53672995 邮箱:bjaaa@aaaedu.cc

京公网安备 11010802035704号

网站地图