欢迎来到代码驿站!

.NET代码

当前位置:首页 > 软件编程 > .NET代码

ASP.net(C#)从其他网站抓取内容并截取有用信息的实现代码

时间:2021-01-18 14:45:37|栏目:.NET代码|点击:
1. 需要引用的类库
复制代码 代码如下:

using System.Net;
using System.IO;
using System.Text;
using System.Text.RegularExpressions;

2. 获取其他网站网页内容的关键代码
复制代码 代码如下:

WebRequest request = WebRequest.Create("http://目标网址.com/");
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
//reader.ReadToEnd() 表示取得网页的源码
TextBox1.Text = reader.ReadToEnd();

3. 获取其他网站网页源码之后通过{正则表达式}帅选有用信息
复制代码 代码如下:

MatchCollection TitleMatchs = Regex.Matches(reader.ReadToEnd(), @"发表评论</a></p></div><div class=""body"">([\s\S]*?)</div><div class=""share"">", RegexOptions.IgnoreCase | RegexOptions.Multiline);
foreach (Match NextMatch in TitleMatchs)
{
s += "<br>" + NextMatch.Groups[1].Value;
TextBox1.Text += "\n" + NextMatch.Groups[1].Value;
}

RegexOptions.IgnoreCase: 表示不区分大小写, 一般网站源码大小写不敏感所以取消之.

RegexOptions.Multiline: 表示对多行内容进行帅选.
4. 大功告成
不上图了! 影响不好! 见谅见谅
文中代码打包下载

上一篇:asp.net实现多个文件同时下载功能

栏    目:.NET代码

下一篇:C#8 的模式匹配实现

本文标题:ASP.net(C#)从其他网站抓取内容并截取有用信息的实现代码

本文地址:http://www.codeinn.net/misctech/47119.html

推荐教程

广告投放 | 联系我们 | 版权申明

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:914707363 | 邮箱:codeinn#126.com(#换成@)

Copyright © 2020 代码驿站 版权所有