zoukankan html css js c++ java

python快速提取edu SRC页面检索信息

方便快速提取edu SRC页面信息，利于SRC信息搜集，以及生成漏洞报告

edu SRC页面信息

提取信息

代码：

      import requests,time
      from lxml import etree

      def edu_list(page):
          for page in range(1,page+1):
              try:
                  url='https://src.sjtu.edu.cn/list/?page='+str(page)
                  data=requests.get(url).content
                  #print(data)
                  soup = etree.HTML(data.decode('utf-8'))
                  result = soup.xpath('//td[@class=""]/a/text()')
                  #print(result)


                  results = '
'.join(result)
                  resultss=results.split()
                  print(resultss)
                  for edu in resultss:
                      with open(r'src.txt', 'a+',encoding='utf-8') as f:
                          f.write(edu+'
')
                          f.close()
              except Exception as e:
                  time.sleep(0.5)
                  pass

      if __name__ == '__main__':
          edu_list(10)

查看全文

相关阅读:
HDU2054_A == B ?【模拟题】【大数】【水的问题】
hadoop结构出现后format变态
 jquery的clone办法bug修复
 Django学习笔记（三）—— 型号 model
华夏的理财30天A和华夏财富宝货币哪个收益比较好?
网贷平台公司必看
 网贷平台平安陆金所
 网贷平台公司各平台投资收费比较
 2012年网贷平台全国排名
 新进网贷的小散感受

原文地址：https://www.cnblogs.com/SnowSec/p/14665296.html