python 爬虫之beautifulsoup（bs4）使用 --待完善

#!/usr/bin/env python
# -*- coding:utf-8 -*-
from bs4 import BeautifulSoup
import requests

url = 'http://www.jd.com/'
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'
}
#User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36
web_date = requests.get(url,headers=headers)
soup = BeautifulSoup(web_date.text,'lxml')
print soup

headers表示头文件，伪装成浏览器浏览网页

wb_data网页数据requests.get请求访问(url网页京东,headers伪装的头文件）

soup解析后的数据BeautifulSoup解析数据(wb_data网页数据,lxml解析的格式按这个要求解析)

打印结果如下：

查看全文

相关阅读:
面试题目
 MyEclipse 启动 tomcat时错误处理
 js 剪贴板操作
 PHP面试题
 MySQL 数据库 source 导入乱码
 php 不用通过表单也能创建HTTPpost请求
 一个css中zindex的用法
 最新黑链代码expression：隐藏链接代码
 测试网站访问速度的几个小方法
 优秀开源外贸网店程序一览

原文地址：https://www.cnblogs.com/longesang/p/10494166.html