欢迎来到代码驿站!

当前位置:首页 >

正则表达式

时间:2021-07-18 08:26:41|栏目:|点击:
我们要解析一个HTML文档时可利用正则表达式取得标签内容
例子:
以从字符串中取出所有A标签的 id号和内容为例:
<a id="1" target="_blank">aaaaaaaaaa</a>
正则表达式:
<a[^<]*id[^<]*=[^<]*"(?<ID>[^<]*)"[^<]*target[^<]*=[^<]*"[^<]*_blank[^<]*" [^<]*>(?<content>[^<]*)</a>
正则分解:
[^<]* 是一个很有用的组合,能定位到下一个查询关键字
(?<ID>[^<]*)  用于取得一个或者多个值直到遇到下一个关键字
<ID> 类似一个正则的变量,给用()号取得的内容进行标识,以便于程序的调用
C#调用的例子:
string strRegex=@"<a[^<]*id[^<]*=[^<]*"(?<ID>[^<]*)"[^<]*target[^<]*=[^<]*"[^<]*_blank[^<]*" [^<]*>(?<CONTENT>[^<]*)</a>";
string strSource="<a id=\"1\" target=\"_blank\">aaaaaaaaaa</a>"
System.Text.RegularExpressions.Regex r;
                System.Text.RegularExpressions.MatchCollection m;
                mc= new System.Text.RegularExpressions.Regex(strRegex, System.Text.RegularExpressions.RegexOptions.IgnoreCase);
               ro = mc.Matches(strSource);
if (ro.Count >= 0)
 {
   for (int i = 0; i < m.Count; i++)
    {
        //取出ID和内容
         string id = ro[i].Groups["ID"].Value;
         string topic = ro[i].Groups["CONTENT"].Value;
    }
 }

上一篇:centos6使用docker部署redis主从数据库操作示例

栏    目:

下一篇:docker 容器上编译 go 程序提示找不到文件问题

本文标题:正则表达式

本文地址:http://www.codeinn.net/misctech/158839.html

推荐教程

广告投放 | 联系我们 | 版权申明

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:914707363 | 邮箱:codeinn#126.com(#换成@)

Copyright © 2020 代码驿站 版权所有