




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ID正则表达式用法及介绍复制链接本帖最后由 漫步云中 于 2011-2-18 11:23 编辑ID正则表达式用处很广,正则表达比较复杂的东西,只有不断用到,摸索,就能得心应手!例1:如果要把蓝色数据要替换成这右边的,有什么比较快捷的方法吗, 也就是把左边蓝色底文字的数字全都替换成右边的,就用到正则表达式:用查找替换。 选中整列后 用Grep 查找 .+ 替换为 ,见下图 :例2如果把下面对话的人名统一修改格式,英文的加蓝加粗。中文的加蓝变粗宋。因为整本书有几百个不一样的人名,如果用替换的话也是一个大工程,用GREP可以做到:(也可以用嵌套样式)GREP 代码查找参考如下:代码:.+?(:|:)替换如图:1. grep简介egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。2. grep正则表达式元字符集(基本集)锚定行的开始 如:grep匹配所有以grep开头的行。$锚定行的结束 如:grep$匹配所有以grep结尾的行。.匹配一个非换行符的字符 如:gr.p匹配gr后接一个任意字符,然后是p。*匹配零个或多个先前字符 如:*grep匹配所有一个或多个空格后紧跟grep的行。 .*一起用代表任意字符。匹配一个指定范围内的字符,如Ggrep匹配Grep和grep。匹配一个不在指定范围内的字符,如:A-FH-Zrep匹配不包含A-F和H-Z的一个字母开头,紧跟rep的行。(.)标记匹配字符,如(love),love被标记为1。锚定单词的开始,如:锚定单词的结束,如grep匹配包含以grep结尾的单词的行。xm重复字符x,m次,如:o5匹配包含5个o的行。xm,重复字符x,至少m次,如:o5,匹配至少有5个o的行。xm,n重复字符x,至少m次,不多于n次,如:o5,10匹配5-10个o的行。w匹配文字和数字字符,也就是A-Za-z0-9,如:Gw*p匹配以G后跟零个或多个文字或数字字符,然后是p。Ww的反置形式,匹配一个或多个非单词字符,如点号句号等。b单词锁定符,如: bgrepb只匹配grep。3. 用于egrep和 grep -E的元字符扩展集+匹配一个或多个先前的字符。如:a-z+able,匹配一个或多个小写字母后跟able的串,如loveable,enable,disable等。?匹配零个或多个先前的字符。如:gr?p匹配gr后跟一个或没有字符,然后是p的行。a|b|c匹配a或b或c。如:grep|sed匹配grep或sed()分组符号,如:love(able|rs)ov+匹配loveable或lovers,匹配一个或多个ov。x,xm,xm,n作用同xm,xm,xm,n4. POSIX字符类为了在不同国家的字符编码中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字符类,如:alnum:是A-Za-z0-9的另一个写法。要把它们放到号内才能成为正则表达式,如A- Za-z0-9或:alnum:。在linux下的grep除fgrep外,都支持POSIX的字符类。:alnum:文字数字字符:alpha:文字字符:digit:数字字符:graph:非空字符(非空格、控制字符):lower:小写字符:cntrl:控制字符:print:非空字符(包括空格):punct:标点符号:space:所有空白字符(新行,空格,制表符):upper:大写字符:xdigit:十六进制数字(0-9,a-f,A-F)5. Grep命令选项-?同时显示匹配行上下的?行,如:grep -2 pattern filename同时显示匹配行的上下2行。-b,-byte-offset打印匹配行前面打印该行所在的块号码。-c,-count只打印匹配的行数,不显示匹配的内容。-f File,-file=File从文件中提取模板。空文件中包含0个模板,所以什么都不匹配。-h,-no-filename当搜索多个文件时,不显示匹配文件名前缀。-i,-ignore-case忽略大小写差别。-q,-quiet取消显示,只返回退出状态。0则表示找到了匹配的行。-l,-files-with-matches打印匹配模板的文件清单。-L,-files-without-match打印不匹配模板的文件清单。-n,-line-number在匹配的行前面打印行号。-s,-silent不显示关于不存在或者无法读取文件的错误信息。-v,-revert-match反检索,只显示不匹配的行。-w,-word-regexp如果被引用,就把表达式做为一个单词搜索。-V,-version显示软件版本信息。6. 实例要用好grep这个工具,其实就是要写好正则表达式,所以这里不对grep的所有功能进行实例讲解,只列几个例子,讲解一个正则表达式的写法。$ ls -l | grep a通过管道过滤ls -l输出的内容,只显示以a开头的行。$ grep test d*显示所有以d开头的文件中包含test的行。$ grep test aa bb cc显示在aa,bb,cc文件中匹配test的行。$ grep a-z5 aa显示所有包含每个字符串至少有5个连续小写字符的字符串的行。$ grep w(es)t.*1 aa如果west被匹配,则es就被存储到内存中,并标记为1,然后搜索任意个字符(.*),这些字符后面紧跟着另外一个es(1),找到就显示该行。如果用egrep或grep -E,就不用号进行转义,直接写成w(es)t.*1就可以了。7.注意在某些机器上,要使用-E参数才能够进行逻辑匹配(详见下)grep a|b (匹配包含字符样式为a|b的行)grep -E a|b (匹配包含字符样式为a或b的行)man grep里面关于-E参数的说明是-ETreats each pattern specified as an extended regular expression (ERE). A NULL value for the ERE matches everyline.Note: The
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 仲夏促销活动策划方案
- 仿生青蛙活动方案
- 企业万圣节活动方案
- 企业人才周活动方案
- 企业全年活动方案
- 企业冰壶团建活动方案
- 企业十周年庆活动方案
- 企业咨询服务公司策划方案
- 企业基金会募捐活动方案
- 企业宣传前期活动方案
- 技能人才评价新职业考评员培训在线考试(四川省)
- 人力资源服务公司创业项目计划书
- 成本加酬金合同协议书
- 基于stm32四轴飞行器控制系统设计
- 人防工程竣工监理评估报告
- 2019-2020学年河南省济源市七年级下学期期末数学试卷-(解析版)
- 江苏省苏州市常熟市2023-2024学年五年级下学期数学期末检测
- 血液净化抗凝新进展-萘莫司他
- 重庆市大渡口区2023-2024学年四年级下学期期末测试数学试题
- 珍惜时间三分钟演讲稿小学生(23篇)
- 担保行业现状分析
评论
0/150
提交评论