zoukankan      html  css  js  c++  java
  • 数据科学中的R和Python: 30个免费数据资源网站

    1 政府数据

    • Data.gov:这是美国政府收集的数据资源。声称有多达40万个数据集,包括了原始数据和地理空间格式数据。使用这些数据集需要注意的是:你要进行必要的清理工作,因为许多数据是字符型的或是有缺失值。
    • Socrata它是探索政府相数据的另一个好地方。Socrata的一个了不起的地方是,他们有不错的可视化工具,使研究数据更为容易。
    • 一些城市都有自己的数据门户网站设置,可供访问者浏览城市的相关数据。例如,在旧金山数据网站,你可以获得很多数据,从犯罪统计到城市的停车位。
    • 联合国有关网站,例如世界卫生组织提供了丰富的数据资源,从死亡率到世界饥饿统计数字。
    • 美国人口普查局也有相当多的生活数据,例如收入、种族、教育、人口和商业信息。

    2 集成数据
    这些网站已经从各种地方收集了相当多的数据。有时更容易从这里找到好东西。

    • Programmable Web:这是一个探索各类API的好地方。
    • infofochimps:提供了一个数据集市,其中有大量的公开数据资源和API资源。类别非常广泛,从Twitter到地理位置数据。用户甚至可以上传自己的数据。
    • Data Market这也是一个好地方,数据包括了经济,医疗保健,食品和农业,汽车行业相关的数据。
    • Google Public data explorer谷歌公共数据浏览容纳大量的数据,从世界发展指标、经合组织和人类发展指标,主要是有关经济数据。
    • Junar这也是一个很好的提供的数据抓取和传送服务的网站。
    • Buzzdata这是一个提供数据共享服务的网站,它允许用户上传自己的数据和连接。

    3 社交网络数据
    通常情况下要得到社交数据,需要依赖社交网站本身提供的API数据。

    • Twitter:你可以访问Twitter API,但其用途相当有限,Twitter API有一个获取数据的限制。如果需要更多信息,可以去看看Gnip或者PeopleBrowsrDataSift
    • Foursquare:他们有自己的API,你也可以通过Infochimps得到它。
    • Facebook:Facebook的图形API是Facebook的最佳资源。
    • Face.com一个提供面部识别数据的工具。

    4 气象数据

    • Wunderground这里提供了详细的天气信息,可以用邮政编码或城市名称来搜索历史数据。它提供了温度、风速、降水等信息。
    • Weatherbase有详细的天气统计数据,近27000个城市的温度,降雨和湿度。

    5 体育数据
    下面三个网站都提供球队、球员、教练和经理的全面信息。

    • 足球
    • 棒球
    • 篮球
    • ESPN最近也推出了自己的API,但你必须是一个合作伙伴才可以获得他们的数据。

    6 高校和科研
    针对在某一领域的学者工作进行搜索是获取数据的有效方法。如果你想在一份研究报告中用一份相关数据,最好的办法是直接联系有关专业的大学教授。
    加州大学洛杉矶分校提供了一些在其课程中使用的数据集。

    7 新闻资料

    • The New York Times:它有一个很好的API和资源管理器访问任何出版物中的文章。
    • The Guardian Data Blog:卫报的数据博客会定期提供一些数据可视化的文章,其数据可通过Google文档格式下载。

    下面是笔者的补充:

    最后推荐一本小册子:数据源手册。该书主要介绍了几十种非常有用的API和相关网站,值得一读。你知道在哪下载的。

    from:http://xccds1977.blogspot.com/2012/04/30.html

    补充:

    数据免费开放计划-聚合数据

  • 相关阅读:
    怀念
    红颜知己
    我的孩子们
    10月22日
    Movies
    vue返回上一页效果(this.$router.go、)
    Java随笔
    Java随笔
    java随笔
    java随笔
  • 原文地址:https://www.cnblogs.com/lqruui/p/5419737.html
Copyright © 2011-2022 走看看