js正则匹配html标签中的内容

本文教程操作环境:windows7系统、jquery3.2.1版本,DELL G3电脑。

一、正则表达式

是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。

简单来说,是一种匹配字符串的方法,通过一些特殊符号,实现快速查找、删除、替换某个特定字符串。

二、匹配方法:replace()方法

参数为正则表达式,如果找到匹配时,返回匹配字符串的开始位置,否则,返回-1;不支持全文检索。

三、使用:匹配html标签中的内容

匹配html标签,例如"<p>xxx</p>"这种格式

获取html中的数据并预处理

privatestaticPatternHTML_TAG_PATTERN=Pattern.compile("<[a-zA-Z]+.*?>([\\s\\S]*?)</[a-zA-Z]*?>");
/**
*获取html中的数据
*@paramhtmlString
*@return
*/
publicstaticList<String>getResultsFromHtml(StringhtmlString){
List<String>results=newArrayList<>();
//数据预处理
htmlString=replaceStyle(removeBrTag(htmlString));
if(htmlString!=null&&htmlString.length()>0){
MatcherimageTagMatcher=HTML_TAG_PATTERN.matcher(htmlString);

1、针对多个并列的标签的情况,对应正则表达式中的圆括号括起来的数据

while(imageTagMatcher.find()){
Stringresult="";
//group(1)
result=imageTagMatcher.group(1).trim();

2、针对多个标签嵌套的情况进行处理

if(result!=null&&result.length()>0){
result=replaceStartTag(result);
}
results.add(result);
}
}
returnresults;
}

原文来自:https://www.py.cn

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容