zoukankan      html  css  js  c++  java
  • API爬取天气预报数据

    API爬取天气预报数据

    """

    和风天气API:https://id.heweather.com/

    该网站为个人开发者提供免费的天气预报数据,自行访问官网注册,在控制台看到个人的key。

    然后看API文档,基本可以开发了,有访问次数限制。

    """

    爬取数据代码

    import requests
    import time
    import pymongo
    
    """
    和风天气API提供了3000多个城市的天气预报,我们先获取这些城市的cid,
    再循环获取3000个城市的天气预报,
    存入mongodb
    
    """
    #建立mongodb的连接
    client=pymongo.MongoClient(host="localhost",port=27017)
    
    #建立数据库weather
    book_weather=client['weather']
    
    #在weather数据库中建立集合:sheet_collection_1
    sheet_weather=book_weather['sheet_collection_1']
    
    • 1:获取网站给我们提供的天气预报csv文件。


    #获取city的cid	地区/城市ID	CN101080402
    #:获取城市列表的url
    url="https://a.hecdn.net/download/dev/china-city-list.csv"
    
    #请求ulr
    strhtml=requests.get(url)
    strhtml.encoding='utf-8'
    
    #返回字符串内容,csv格式
    data=strhtml.text
    # print(data)
    
    #转为列表
    data1=data.split('
    ')
    
    #去除前两行标题头
    for i in range(2):
        data1.remove(data1[0])
    
    for item in data1:
        # print(item[0:12])
    
    • 2:调用接口获取数据
        weather_url='https://free-api.heweather.net/s6/weather/now?location='+item[0:12].strip()+'&key=13e99fe03be0440cb9ff12e2edfe1ab6'
        # print(weather_url)
        weather_html=requests.get(weather_url)
        weather_html.encoding="utf-8"
        time.sleep(2)
        # print(weather_html.text)
        dic=weather_html.json()
    
    • 3:通过在线json解析工具,找到我们需要的数据,再插入到mongodb中
        city=dic["HeWeather6"][0]["basic"]["location"]
        twt=dic["HeWeather6"][0]["now"]["tmp"]
        ws=dic["HeWeather6"][0]["now"]["cond_txt"]
        w_date=dic["HeWeather6"][0]["update"]["loc"]
        
    
        #插入数据到mongodb中
        sheet_weather.insert_one({"城市":city,"气温":twt,"天气情况":ws,"天气日期":w_date})
    
        print("城市代码:{0}".format(item[0:12].strip()))
    
    • 4调试能获取到想要的数据之后,

      传到linux系统中运行

    ubuntu@ubuntu:~$ rz -y
    rz waiting to receive.
    Starting zmodem transfer.  Press Ctrl+C to cancel.
    Transferring pymongo-3.10.1-cp37-cp37m-manylinux2014_x86_64.whl...
      100%     451 KB     451 KB/sec    00:00:01       0 Errors  
    
    #安装pymongo
    ubuntu@ubuntu:~$ pip3 install pymongo-3.10.1-cp37-cp37m-manylinux2014_x86_64.whl 
    Defaulting to user installation because normal site-packages is not writeable
    Processing ./pymongo-3.10.1-cp37-cp37m-manylinux2014_x86_64.whl
    Installing collected packages: pymongo
    Successfully installed pymongo-3.10.1
    
    #运行
    ubuntu@ubuntu:~$ nohup python get_city.py &
    [1] 12938
    ubuntu@ubuntu:~$ nohup: ignoring input and appending output to 'nohup.out'
    
    #查看,输出
    ubuntu@ubuntu:~$ tail -f nohup.out 
    城市代码:CN101010100
    城市代码:CN101010200
    城市代码:CN101010300
    城市代码:CN101010400
    城市代码:CN101010500
    城市代码:CN101010600
    
  • 相关阅读:
    18C 新的发行版和补丁模型
    单机数据库193000 升级到195000
    Mycat学习-单独启动mycat
    dstat 监控工具
    基于FTP 的本地Yum服务器配置
    记一次SQL PLUS 不能登录的异常处理
    FastDFS---分布式文件存储系统安装与使用
    ERROR
    记:一次安装Nginx的过程
    连接阿里RDS数据库
  • 原文地址:https://www.cnblogs.com/zhoujun007/p/12543091.html
Copyright © 2011-2022 走看看