zoukankan
html css js c++ java
正则表达式分析网页,获得中央一电视节目列表
String strUrl
=
"
http://www.cctv.com/tvguide/11/01/20061010/1.shtml
"
;
byte
[] pageHtml
=
HttpUtil.getPage(strUrl);
//
将页面转成string
String strHtml
=
new
String(pageHtml,
"
GB2312
"
);
String[][] ls
=
null
;
ls
=
StringUtil.splitByReg(strHtml,
"
(\\d{2}:\\d{2}:\\d{2})</font>.*<font >(.+)</font>.*</tr>\\r\\n<tr>
"
);
for
(
int
i
=
0
;i
<
ls.length;i
++
)
{
//
String[] ls1[] = StringUtil.splitByReg(ls[i],"");
System.out.print(ls[i][
0
]
+
"
##
"
+
ls[i][
1
]);
System.out.println();
}
/** */
/**
通用正则表达式解析函数
* splitByReg
*
@param
str 需要解析的字符串
*
@param
regExp 匹配的正则表达式
*
@return
解析后字符串数组
*/
public
static
String[][] splitByReg(String str,String regExp)
{
Pattern sp
=
Pattern.compile(regExp);
Matcher matcher
=
sp.matcher(str);
Vector
<
Vector
<
String
>>
colInoput
=
new
Vector
<
Vector
<
String
>>
();
while
(matcher.find())
{
Vector
<
String
>
v
=
new
Vector
<
String
>
();
for
(
int
i
=
1
;i
<=
matcher.groupCount();i
++
)
{
v.add(matcher.group(i));
}
colInoput.add(v);
}
String[][] resultList
=
null
;
if
(colInoput.size()
>
0
)
resultList
=
new
String[colInoput.size()][colInoput.get(
0
).size()];
for
(
int
i
=
0
;i
<
colInoput.size();i
++
)
{
String[] kk
=
new
String[colInoput.get(i).size()];
colInoput.get(i).copyInto(kk);
resultList[i]
=
kk;
}
return
resultList;
}
查看全文
相关阅读:
创建发布Webservice以及wsimport工具
Webservice介绍
MongoDB简单认识
Java集合的介绍
Java虚拟机(JVM)体系结构概述及各种性能参数优化总结
Java虚拟机(JVM)
eclipse, idea安装lombok插件
在window下, Java调用执行bat脚本
python3对多线程处理
Selenium常见元素定位方法和操作的学习介绍
原文地址:https://www.cnblogs.com/polugen/p/532765.html
最新文章
mysql的几种隐式转化
IPy的使用
使用音频和图形指纹技术在浏览器中生成极其持久的Cookie
织梦主动推送当天全部内容给百度收录
浏览器指纹修改之platform指纹平台修改
浏览器指纹修改之fonts字体指纹修改
浏览器指纹修改之电池指纹信息修改
修改浏览器指纹之webrtc指纹修改
【DT8.0】分享原创极简搜索界面
分享自建背景壁纸自动切换API接口
热门文章
Apache开启Etag缓存禁止,提高访问速度
必应图片调取接口
OOM问题分析
灰度发布
进程分析命令(持续更新中)
SpringBoot的核心注解和配置
SpringBoot简介及第一个应用
(转)Spring整合Jpa
CXF框架介绍及Spring集成
WSDL(WebService描述语言)文件介绍
Copyright © 2011-2022 走看看