zoukankan      html  css  js  c++  java
  • 2019大学排名

       目的网站:http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html

    import requests
    import bs4
    

      requests用于得到目的网站源代码

      bs4用于解析request得到的源码

    r = requests.get('http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html')
    r.encoding = 'utf-8'
    soup = bs4.BeautifulSoup(r.text,"html.parser")
    

      向目的网站发送请求,并将请求结果保存到对象 r ,将 r 的编码指定为utf-8,然后开始解析源码,解析结果保存到soup中

      查看网页源代码,如图:

       tbody  和  tbody  中的  td  即位所需要的标签

    for i in soup.find('tbody').children:
    	#内容是否为标签,避免遇到空行符或其他
    	if isinstance(i,bs4.element.Tag):
    		#将结果根据td分开,存在td中
    		j= i('td')
    		#只需列表前三个值
    		t = [j[0].string,j[1].string,j[2].string]
    		if t[1]=='湖北师范大学':
    			print('----------------------------------------------------------------')
    		#打印结果,若找到湖北师范大学,用-----隔开
    		print(t)
    		if t[1]=='湖北师范大学':
    			print('----------------------------------------------------------------')
      运行结果:

      

       完整代码:

    import requests
    import bs4
    
    r = requests.get('http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html')
    r.encoding = 'utf-8'
    soup = bs4.BeautifulSoup(r.text,"html.parser")
    a = []
    for i in soup.find('tbody').children:
    	#内容是否为标签,避免遇到空行符或其他
    	if isinstance(i,bs4.element.Tag):
    		#将结果根据td分开,存在td中
    		j= i('td')
    		#只需列表前三个值
    		t = [j[0].string,j[1].string,j[2].string]
    		if t[1]=='湖北师范大学':
    			print('----------------------------------------------------------------')
    		#打印结果,若找到湖北师范大学,用-----隔开
    		print(t)
    		if t[1]=='湖北师范大学':
    			print('----------------------------------------------------------------')
    

      

  • 相关阅读:
    电脑开机慢是查看与解决方案
    做男人真难
    强大的数据恢复软件--EasyRecovery专业版
    30招让你从头到脚都健康
    教您如何使用SQL中的SELECT LIKE like语句
    SQL server经典电子书、工具和视频教程汇总
    数据开发-经典
    C# 数据操作工具类
    关于web请求中 获取真实IP
    生成二维码
  • 原文地址:https://www.cnblogs.com/yizhixiang/p/11635803.html
Copyright © 2011-2022 走看看