爬取xml数据之R - 走看看

zoukankan html css js c++ java

爬取xml数据之R

生物信息很多时候要爬数据。最近也看了一些这些方面的。

url<-"要爬取的网址"

url.html<-htmlParse(url,encoding="UTF-8")

如果要获得部分信息，则使用XPath方法。

xpath<-"//*[@id='填写目标id']/span[@id='细分标签的id']

目标id.node<-getNodeSet(url.html,xpath)

//表示任意个html嵌套标签

*表示任意个标签

/表示下一级，span则表示细分标签

如果要读取节点下表签内的内容，则使用xmlValue;xmlGetAttr则可以读取某个属性值

查看全文

相关阅读:
方法的重载
 this用法
 简单的随机数代码和笔记
 java内存简单剖析
 day 28
day 27
day 26
day 25
day 24
day 23

原文地址：https://www.cnblogs.com/ubiwind/p/9883151.html

Copyright © 2011-2022 走看看