`

正则表达式(根据Tag查询Html内容)

阅读更多
使用正则表达式查询一段Html中的Title标签,包括内容!!


import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test {

    public static void main(String args[]) {
        String html = "<title fdsafdsa>ABCD<hrf></title>gsdggas<title>ggds</title>jkll<title fdfdsa>005</title>";
        List resultList = getContextByTag(html,"title");
        for (Iterator iterator = resultList.iterator(); iterator.hasNext();) {
            String context = (String) iterator.next();
            System.out.println(context);
        }
    }
    
    public static List getContextByTag(String html,String tag) {
    	String reg="<"+tag+"(([^<|^>|.]*>)|( >)).*?</"+tag+">";
        List resultList = new ArrayList();
        Pattern p = Pattern.compile(reg);
        Matcher m = p.matcher(html );
        while (m.find()) {
            resultList.add(m.group());
        }
        return resultList;
    }
}


结果:
<title fdsafdsa>ABCD<hrf></title>
<title>ggds</title>
<title fdfdsa>005</title>

分享到:
评论

相关推荐

    精通正则表达式~~~

    精通正则表达式第三版 搜集于网络 前言..........I 第1章:正则表达式入门.... 1 解决实际问题... 2 作为编程语言的正则表达式... 4 以文件名做类比... 4 以语言做类比... 5 正则表达式的知识框架... 6 对于...

    用正则表达式过滤html代码

    代码例子如下:&lt;&#37;Option Explicit Function stripHTML(strHTML)‘Strips the HTML tags from strHTML ... ‘Replace all HTML tag matches with the empty string strOutput = objRegExp.Repl

    正则表达式替换html元素属性的方法

    正则表达式替换任意html元素任意属性,或增加任意属性。 /** * 替换html中任意tag内任意attr值 * @param src_str * @param tag * @param attr * @param val * @returns {*} */ replace_...

    PHP正则表达式抓取某个标签的特定属性值的方法

    php正则学了一些日子,抓了一些网站的数据,从而发现每次都自己写正则重新抓很麻烦,于是就想写一个抓取特定标签具有特定属性值的接口通用,直接上代码。 //$html-被查找的字符串 $tag-被查找的标签 $attr-被查找的...

    正则表达式re.sub替换不完整的问题及完整解决方案

    title: 正则表达式re.sub替换不完整的问题现象及其根本原因 toc: true comment: true date: 2018-08-27 21:48:22 tags: [“Python”, “正则表达式”] category: [“Python”] — 问题描述 问题的起因来自于一段...

    delphi写的 正则分析抓取html数据

    delphi写的正则分析抓取html数据 功能还可以吧,用了一个皮肤控件

    用正则表达式写的HTML分离函数

    存成.asp文件,执行,你用ASPHTTP抓内容的时候用这个很爽,当然自己要改进一下了 &lt;&#37; Option Explicit Function stripHTML(strHTML) ‘Strips the HTML tags from strHTML Dim objRegExp, strOutput ...

    好东西,老外用正则表达式写的HTML分离函数

    存成.asp文件,执行,你用ASPHTTP抓内容的时候用这个很爽,当然自己要改进一下了&lt;&#37;Option ExplicitFunction stripHTML(strHTML)‘Strips the HTML tags from strHTML Dim objRegExp, strOutput Set ...

    [正则表达式]贪婪模式与非贪婪模式

    代码如下:/** ** author: site120 ** function : get script part from html document **/ var... var regExp_scriptTag = new RegExp(“*script([^&gt;]*)&gt;([\\s\\S]*?)*script\\s*&gt;” , “gi”); 

    超强JS(javascript)正则类

    超强JS(javascript)正则类 可提取HTML文件标签 //JS正则表达式类====================// /* 方法列表 */ //=================================// /* GetTag(string,tag); */ //=====================...

    MP3 信息修改工具 Mp3tag 3.06 中文多语免费版.zip

    Mp3tag 中文版可以以文件名批量添加媒体元信息,根据媒体元信息批量重命名文件,执行批量文字替换、导入导出文件信息、创建播放列表等任务。 MP3tag 便携版软件运行批量修改,免去了大家一个一个修改的麻烦,也解决...

    Universal Tag Finder:是查询HTML内容的工具-开源

    Universal Tag Finder是用于查询文件系统中html内容的工具。 对于开发人员,它允许在故障排除和验证期间找出相关元素。 无需费心地使用大量的正则表达式来查找元素。

    htmlSQL:htmlSQL是一个实验性PHP库,可让您通过类似SQL的语法访问HTML值

    这意味着您不必编写复杂的函数或正则表达式即可提取特定的值。 htmlSQL查询如下所示: SELECT href,title FROM a WHERE $class == "list" ^ Attributes ^ ^ search query (can be empty) to return ^ ^ HTML tag to...

    C#开发实例大全(基础卷).软件开发技术联盟(带详细书签) PDF 下载

    实例076 使用正则表达式验证一年的12个月份 92 实例077 使用正则表达式验证一个月的31天 93 实例078 使用正则表达式验证数字输入 94 实例079 使用正则表达式验证密码长度 95 实例080 使用正则表达式验证非零的正整数...

    go-requery:使用 Regexp 的强大功能查询文本

    重新查询 使用正则表达式的强大功能查询文本。用法 package mainimport ( "github.com/ddliu/go-requery")func main () { // create doc doc := requery . NewDoc ( `&lt;html&gt;...&lt;/html&gt;` ) // get the ...

    超强JS(javascript)正则类第三版

    * 第......... JS正则表达式类================================= * 方法列表 * ============================================== * GetTag(string,tag); 反回 数组 * ==================...

Global site tag (gtag.js) - Google Analytics