zoukankan
html css js c++ java
简单的信息采集程序示例(小偷程序) (转)
简单的信息采集程序示例(小偷程序)
最近正准备做一个信息采集的程序,下面是一个简单的采集程序,提供给初学者入门参考。
aspx页面代码
<
asp:TextBox ID
=
"
Txt_Url
"
runat
=
"
server
"
Width
=
"
441px
"
></
asp:TextBox
><
br
/>
<
asp:Button id
=
"
Btn_GetUrlSource
"
runat
=
"
server
"
Text
=
"
取得网页代码
"
OnClick
=
"
Btn_GetUrlSource_Click
"
></
asp:Button
>
<
br
/>
<
asp:TextBox id
=
"
Txt_UrlSource
"
runat
=
"
server
"
Width
=
"
100%
"
Height
=
"
195px
"
TextMode
=
"
MultiLine
"
></
asp:TextBox
><
br
/>
<
br
/>
采集开始代码
<
asp:TextBox ID
=
"
Txt_First
"
runat
=
"
server
"
Height
=
"
90px
"
TextMode
=
"
MultiLine
"
Width
=
"
280px
"
></
asp:TextBox
><
br
/>
<
asp:Button ID
=
"
Btn_ListCheck
"
runat
=
"
server
"
OnClick
=
"
Btn_ListCheck_Click
"
Text
=
"
测试唯一性
"
/><
br
/>
采集结束代码
<
asp:TextBox ID
=
"
Txt_Last
"
runat
=
"
server
"
Height
=
"
90px
"
TextMode
=
"
MultiLine
"
Width
=
"
280px
"
></
asp:TextBox
><
br
/>
<
br
/>
<
asp:Button ID
=
"
Btn_Result
"
runat
=
"
server
"
Text
=
"
取得采集结果
"
OnClick
=
"
Btn_Result_Click
"
/><
br
/>
<
asp:TextBox ID
=
"
Txt_Result
"
runat
=
"
server
"
Height
=
"
134px
"
TextMode
=
"
MultiLine
"
Width
=
"
579px
"
></
asp:TextBox
>
.cs页面代码
using
System;
using
System.Collections;
using
System.ComponentModel;
using
System.Data;
using
System.Drawing;
using
System.Web;
using
System.Web.SessionState;
using
System.Web.UI;
using
System.Web.UI.WebControls;
using
System.Web.UI.HtmlControls;
using
System.IO;
using
System.Net;
using
System.Text.RegularExpressions;
using
NetShuai.Database;
private
string
PageUrl
=
""
;
private
void
Page_Load(
object
sender, System.EventArgs e)
{
//
在此处放置用户代码以初始化页面
}
protected
void
Btn_GetUrlSource_Click(
object
sender, EventArgs e)
{
PageUrl
=
Txt_Url.Text;
WebRequest request
=
WebRequest.Create(PageUrl);
WebResponse response
=
request.GetResponse();
Stream resStream
=
response.GetResponseStream();
StreamReader sr
=
new
StreamReader(resStream, System.Text.Encoding.Default);
Txt_UrlSource.Text
=
sr.ReadToEnd();
resStream.Close();
sr.Close();
}
protected
void
Btn_Result_Click(
object
sender, EventArgs e)
{
string
strExp;
strExp
=
@"
(?<=
"
+
Server.HtmlEncode(Txt_First.Text)
+
"
)[\w\W]*?(?=
"
+
Server.HtmlEncode(Txt_Last.Text)
+
"
)
"
;
MatchCollection mc
=
Regex.Matches(Server.HtmlEncode(Txt_UrlSource.Text), strExp);
for
(
int
i
=
0
; i
<
mc.Count; i
++
)
{
Txt_Result.Text
+=
Server.HtmlDecode(mc[i].Value);
}
}
protected
void
Btn_ListCheck_Click(
object
sender, EventArgs e)
{
string
strExp;
strExp
=
Server.HtmlEncode(Txt_First.Text);
MatchCollection mc
=
Regex.Matches(Server.HtmlEncode(Txt_UrlSource.Text), strExp);
if
(mc.Count
>
1
)
{
Response.Write(
"
<script>alert('列表开始代码有重复!')</script>
"
);
return
;
}
strExp
=
Server.HtmlEncode(Txt_Last.Text);
mc
=
Regex.Matches(Server.HtmlEncode(Txt_UrlSource.Text), strExp);
if
(mc.Count
>
1
)
{
Response.Write(
"
<script>alert('列表结束代码有重复!')</script>
"
);
return
;
}
}
查看全文
相关阅读:
同步与异步接口
教你用 WEB SPEECH API 和 node.js 创建 一个简单的AI
face ++ 人脸识别技术初步
php ddos 安全处理代码
基于GBT28181:SIP协议组件开发-----------第五篇SIP注册流程eXosip2实现(二)
基于GBT28181:SIP协议组件开发-----------第四篇SIP注册流程eXosip2实现(一)
基于GBT28181:SIP协议组件开发-----------第三篇SIP注册流程分析实现
基于GBT28181:SIP协议组件开发-----------第二篇SIP组件开发原理
基于GBT28181:SIP协议组件开发-----------第一篇环境搭建
qt二维码示例
原文地址:https://www.cnblogs.com/zhangzheny/p/901722.html
最新文章
博客园流量统计(入门版)——使用CNZZ(友盟)
个人博客园样式、背景及细节美化过程
Hello world &博客客户端试用
JSP自定义标签及函数的使用
服务端兼容多个不同APP版本
任务计划程序-Windows2008定时重启
MySQL5.7免安装版配置
一次对象过大引起的gc性能问题的分析与定位
JAVA常用知识点
java基础
热门文章
java框架
CLOSE_WAIT问题分析
JMeter编写JAVA请求和编写自定义函数
Redis的过期策略和内存淘汰机制
MySQL存储引擎区别和特性
一次数据类型错误导致索引失效引起的性能问题
一次redis连接池连接数配置过少引起的性能问题
Jmeter实现筛数
0成本在git 上搭建我们的博客(hexo) 2
0成本在git 上搭建我们的博客(hexo)
Copyright © 2011-2022 走看看