zoukankan      html  css  js  c++  java
  • 教你如何用python爬取A股财务报表(含代码)

     量化交易除了在K线上可以有所应用,还可以用于基本面的操作,在处理数据之前首先要获取数据,网易财经给我们提供了一个方便的API接口,这样就不必在其他资讯网里面使用收钱的API

    抓下来的数据都是CSV格式,财务报表有利润表、资产负债表、现金流量表(本来应该还有一个所有者权益表我没找到)。

      在网页和程序当中都使用拼音第一个字母小写代替(lrb,zcfzb,xjllb)

      接下来直接上代码,使用的是python3.6.6环境是用anaconda搭建

    import re,urllib
    import xlwt
    from bs4 import BeautifulSoup
    from time import sleep
    count = 1
    for count in range(600500,603800):
        url = 'http://quotes.money.163.com/service/lrb_'+str(count)+'.html'
        while True:
            try:
                content = urllib.request.urlopen(url,timeout=2).read()
                print(content)
                with open('../利润表/'+str(count)+'lrb.csv','wb') as f:
                    f.write(content)
                print(count)
                sleep(1)
                break
            except Exception as e:
                if str(e) =='HTTP Error 404: Not Found':
                    break
                else:
                    print(e)
                    continue

      ok,就这么简单就完成啦,可以复制改一下路径然后就可以把三个表一起下下来了,这个程序里已经做了容错,所以在抓完所有数据之前不会自动停下(除非手工停止)。

      如果对你有帮助可以收藏点个赞~

  • 相关阅读:
    拦截器
    Ajax
    JSON
    数据处理及跳转
    RestFul和控制器
    第一个MVC程序
    什么是SpringMVC
    回顾MVC
    声明式事务
    微软最强 Python 自动化工具开源了!不用写一行代码!
  • 原文地址:https://www.cnblogs.com/lantian123/p/13212953.html
Copyright © 2011-2022 走看看