zoukankan      html  css  js  c++  java
  • 我了解到的新知识之----如何使用Python获取最新外汇汇率信息

    这个需求本来是来源于公司同事工作中需求,用户需要使用数据分析工具Power BI抓取多页的中国银行官网上当天的外汇数据。但是没能研究出来。

    我就开始在网络上找关于使用python来抓取当天汇率的案例分享,没想到“知乎”上有一个网友分享了以下这段代码:

    # -*- coding:utf-8 -*-
    import re
    from lxml import etree
    import requests
    
    url = 'http://www.boc.cn/sourcedb/whpj/index.html'  # 网址
    html = requests.get(url).content.decode('utf8') #获取网页源码(中间涉及到编码问题,这是个大坑,你得自己摸索)
    
    
    # 方式一:正则匹配
    a = html.index('<td>美元</td>')  # 取得“美元”当前位置
    s = html[a:a + 300]  # 截取美元汇率那部分内容(从a到a+300位置)
    result = re.findall('<td>(.*?)</td>', s)  # 正则获取
    
    # 方式二:lxml获取
    # result=etree.HTML(html).xpath('//table[@cellpadding="0"]/tr[18]/td/text()')
    
    #写入txt
    with open('汇率.txt', 'w+') as f:
        f.write(result[0] + '
    ')
        f.write('现汇买入价:' + result[1] + '
    ')
        f.write('现钞买入价:' + result[2] + '
    ')
        f.write('现汇卖出价:' + result[3] + '
    ')
        f.write('现钞卖出价:' + result[4] + '
    ')
        f.write('中行折算价:' + result[5] + '
    ')
        f.write('发布时间:' + result[6] + result[7] + '
    ')

    这段代码是来自于“知乎”用户“花墙”,再次感谢这位网友的分享。

    运行这段代码的前提是要安装好lxml,requests两个库,当然还得安装好virtualenv这个虚拟环境。

    然后就可以放心跑上面的代码了,跑完之后,会自动生成一个txt文档,打开之后就是这样:

    美元
    现汇买入价:670.14
    现钞买入价:664.69
    现汇卖出价:672.98
    现钞卖出价:672.98
    中行折算价:671.67
    发布时间:2019-03-1710:30:00

    这样就可以获取最新的实时外汇数据了,这个数据倒是很符合我个人的需求,至于同事说的要同时获取多个页面的数据,还是有待于研究的,如果有网友在这一方面愿意分享一下,那万分感谢了。

  • 相关阅读:
    php composer 相关及版本约束等小技巧
    Jquery 获取表单值如input,select等方法
    Apache benchmark 压力测试工具
    Linux中的随机数文件 /dev/random /dev/urandom
    redis持久化
    Python---装饰器
    高仿拉手网底部菜单实现FragmentActivity+Fragment+RadioGroup
    python实现二叉树和它的七种遍历
    Spring AOP应用实例demo
    二维数组的列排序
  • 原文地址:https://www.cnblogs.com/refreshing/p/10546075.html
Copyright © 2011-2022 走看看