- Rvest 包中常用函数一览:
函数 | 作用 |
---|---|
read_html() |
读取 html 页面 |
html_nodes() |
提取所有符合条件的节点 |
html_node() |
返回一个变量长度相等的list,相当于对html_nodes() 取[[1]] 操作 |
html_table() |
获取 table 标签中的表格,默认参数trim=T ,设置header=T 可以包含表头,返回数据框 |
html_text() |
提取标签包含的文本,令参数trim=T ,可以去除首尾的空格 |
html_attrs(nodes) |
提取指定节点所有属性及其对应的属性值,返回list |
html_attr(nodes,attr) |
提取节点某个属性的属性值 |
html_children() |
提取某个节点的孩子节点 |
html_session() |
创建会话 |