zoukankan html css js c++ java

HttpUnit学习笔记

	<!-- htmlUnit -->
	<dependency>
	    <groupId>net.sourceforge.htmlunit</groupId>
	    <artifactId>htmlunit</artifactId>
	    <version>2.19</version>
	</dependency>

        WebClient webClient = new WebClient(BrowserVersion.CHROME);//选择浏览器
        HtmlPage mainPage = webClient.getPage("https://www.baidu.com/");
        List<HtmlAnchor> list = (List<HtmlAnchor>) mainPage.getByXPath("//a[@class="mnav"]");//使用XPath，获取要查询的Class对象
        for(HtmlAnchor temp:list){
            System.out.println(temp.asText());
        }
        webClient.close();

可以通过特定的代码设置cookie

新浪微博有强制登录机制，所以不能直接爬数据，可以直接爬手机版的首页（weibo.cn）

查看全文

相关阅读:
Pytorch 四种边界填充方式(Padding)
数据预处理 —— padding数据
 Python PIL彩色图像转灰度图像
 Python PIL读取与保存图片
 Python-OpenCV 彩色图像转灰度图像
 Python-OpenCV读取与保存图片
 Python 矩阵旋转180度
 Pytorch 扩展Tensor维度、压缩Tensor维度
 基于SSM的健身房管理系统
 大学生创新创业项目-智取乐食

原文地址：https://www.cnblogs.com/xujanus/p/5063961.html