java正则表达式过滤html标签_第1页
java正则表达式过滤html标签_第2页
java正则表达式过滤html标签_第3页
java正则表达式过滤html标签_第4页
java正则表达式过滤html标签_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、importjava.util.regex.Matcher;importjava.util.regex.Pattern;/*Title:HTML相关的正则表达式工具类*Description:包括过滤HTML标记,转换HTML标记,替换特定HTML标记*Copyright:Copyright(c)2006*authorhejian*version1.0*createtime2006-10-16*/publicclassHtmlRegexpUtilprivatefinalstaticStringregxpForHtml=*);/过滤所有以开头以结尾的标签privatefinalstaticStr

2、ingregxpForlmgTag=*)s*;/找出IMG标签privatefinalstaticStringregxpForlmaTagSrcAttrib=src=(A+);/找出IMG标签的SRC属性/*/publicHtmlRegexpUtil()/TODOAuto-generatedconstructorstub/*基本功能:替换标记以正常显示*paraminputreturnString*/publicStringreplaceTag(Stringinput)if(!hasSpecialChars(input)returninput;StringBufferfiltered=newS

3、tringBuffer(input.length();charc;for(inti=0;i=input.length()-1;i+)c=input.charAt(i);switch(c)case:filtered.append(:filtered.append();break;f,aMil.case:filtered.append();break;case&:filtered.append(&);break;default:filtered.append(c);return(filtered.toString();/*基本功能:判断标记是否存在*paraminput*returnboolean

4、*/publicbooleanhasSpecialChars(Stringinput)booleanflag=false;if(input!=null)&(input.length()0)charc;for(inti=0;i:flag=true;break;case:flag=true;break;亠faIIIIcase:flag=true;break;case&:flag=true;break;returnflag;/*基本功能:过滤所有以结尾的标签*paramstr*returnString*/publicstaticStringfilterHtml(Stringstr)Patternpa

5、ttern=Ppile(regxpForHtml);Matchermatcher=pattern.matcher(str);StringBuffersb=newStringBuffer();booleanresult1=matcher.find();while(result1)matcher.appendReplacement(sb,);result1=matcher.find();matcher.appendTail(sb);returnsb.toString();/*基本功能:过滤指定标签*paramstr*paramtag指定标签*returnString*/publicstaticSt

6、ringfiterHtmlTag(Stringstr,Stringtag)Stringregxp=*)s*;Patternpattern=Ppile(regxp);Matchermatcher=pattern.matcher(str);StringBuffersb=newStringBuffer();booleanresult1=matcher.find();while(result1)matcher.appendReplacement(sb,);result1=matcher.find();matcher.appendTail(sb);returnsb.toString();/*基本功能:替

7、换指定的标签*paramstrparambeforeTag要替换的标签*paramtagAttrib要替换的标签属性值*paramstartTag新标签开始标记*paramendTag新标签结束标记returnString如:替换img标签的src属性值为img属性值/img*/publicstaticStringreplaceHtmlTag(Stringstr,StringbeforeTag,StringtagAttrib,StringstartTag,StringendTag)StringregxpForTag=*)s*;StringregxpForTagAttrib=tagAttrib+

8、=(a+);PatternpatternForTag=Ppile(regxpForTag);PatternpatternForAttrib=Ppile(regxpForTagAttrib);MatchermatcherForTag=patternForTag.matcher(str);StringBuffersb=newStringBuffer();booleanresult=matcherForTag.find();while(result)只压缩代码对不影响StringBuffersbreplace=newStringBuffer();MatchermatcherForAttrib=patternForAttrib.matcher(matcherForTag.group(1);if(matcherForAttrib.find()matcherForAttrib.appendReplacement(sbreplace,startTag+matcherForAttrib.group(1)+endTag);ma

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论