package lix.util;
import org.apache.oro.text.perl.*;
class CleanHtml {
public static String clean(String html){
StringBuffer buffer = new StringBuffer();
Perl5Util preg = new Perl5Util();
preg.substitute(buffer,"s/<script[^>]*?>.*?<\\/script>//gmi",html);
html =buffer.toString();
buffer.setLength(0);
preg.substitute(buffer,"s#<[/]*?(?!a|img|br|/a|table|/table|tr|/tr|td|/td)[^<>]*?>#abc#gmi",html);
//(?# a,/a,img/br ...标签之外,都删除)
html =buffer.toString();
buffer.setLength(0);
/*
preg.substitute(buffer,"s/([\r\n])[\\s]+//gmi",html);
html =buffer.toString();
buffer.setLength(0);
*/
return html;
}
}
/*
*/
(?!exp)
匹配后面跟的不是exp的位置
...
- 大小: 21.2 KB
分享到:
相关推荐
jakarta-oro-2.0.8 java正则表达式扩展 apache出品
强大的JAVA正则表达式处理包jakarta-oro
Java正则表达式应用-Jakarta-ORO篇,这里详细的统计了正则表达式的在java中的运用,
java 正则表达式 perl5规范 jakarta-oro.jar
如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么...本文接下来的内容先简要地介绍正则表达式的入门知识,然后以Jakarta-ORO API为例介绍如何使用正则表达式。
jakarta-oro.jar包供大家享用 博文链接:https://xzio.iteye.com/blog/117213
另外,我还介绍了如何在Java程序中通过Jakarta-ORO库利用正则表达式。至于最终采用老式的字符串处理方式(使用StringTokenizer,charAt,和substring),还是采用正则表达式,这就有待你自己决定了。
java正则表达式.docx 如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符...
Java正则表达式详解 正则表达式基础知识 Jakarta-ORO库 应用实例
一个java正规表达式工具类 关键字: 一个java正规表达式工具...类中用到了 jakarta-oro-2.0.jar 包,请大家自己在 apache网站下下载 在这是junit测试单元类我就不提交了,在main()方法中有几个小测试,有兴趣自己玩吧.
Jakarta-ORO是最全面以及优化得最好的正则表达式API之一,Jakarta-ORO库以前叫做OROMatcher,是由Daniel F. Savarese编写,后来他赠给Jakarta Project。 Jakarta-ORO正则表达式库支持Perl5兼容的正则表达式语法。
jakarta-oro.rar 正则表达式包,在使用正常则表达式时依赖的包
jakarta-oro-2.0.8 正则表达式 引擎 源代码
jakarta-oro.jar 及代码 import org.apache.oro.text.regex.MalformedPatternException; import org.apache.oro.text.regex.MatchResult; import org.apache.oro.text.regex.Pattern; import org.apache.oro.text....
Jakarta-ORO 2.0.8 API
* [a-d[m-p]] a through d, or m through p: [a-dm-p] (union) [a-d[m-p]] 从a 到 d, 或 从m 到 p: [a-dm-p] (并集) * [a-z&&[def]] d, e, or f (intersection) [a-z&&[def]] d, e, 或 f (交集)...