zoukankan      html  css  js  c++  java
  • 随笔

    主题-数据科学

    今天跟大家直播探讨的主题就是数据科学,探讨数据科学在公司中的应用,数据科学的前景,以及要成为数据科学从业者的一个规划。
    数据科学,就是运用一些科学化的方法,去了解数据,运用数据。

    案例:AlphaGo

    大家都知道AlphaGo战胜顶尖棋手的故事,那么考考大家几个问题?
    1、AlphaGo是哪个公司创造的?——深度思维(DeepMind),是一家英国公司,仅仅成立五年
    2、AlphaGo底层的算法?——深度学习

    一直以来,在技术科学领域,都认为围棋是机器最不可能获胜的一个项目,但随着数据科技的发展,这个神话已经被打破

    那么,对于未来我们就会有无尽的遐想,我们思考一个“宇宙性”(呵呵),“人伦性”的问题,就是机器是否会终结人类,取代人类。

    案例:特斯拉(Tesla)汽车

    特斯拉,我们都不陌生,以前人说,人类为了解决迁移的痛点,发明了汽车,可是呢,汽车还是需要人类的一个驾驶,
    特斯拉实现无人驾驶的基本原理就是,在车子上安了大量的感测器,它可以感测到周围环境的变化,可以控制车内所有的零件。
    这样就实现了特斯拉的口号:‘让自动驾驶不再是梦想’,

    人工智能

    上面的两个案例,都是人工智能的一个体现。

    人工智能与“喂数据”

    我们只要把一些数据“喂”(什么是喂数据)给电脑以后,电脑就会学习这些数据,并展现一个模型出来,而这个模型可以协助电脑做出决策,进而这些决策可以取代人类重复性高的一些工作,为我们去创造一个更多的想像与新可能

    人工智能的与数据科学的关系

    @数据分析-jacky

    • 1、人工智能最不可或缺的因素:数据

    • 2、人工智能的就是把有效的数据喂给电脑,让他长成一定的智慧,实现它,就必须依靠我们的数据科学。

    数据科学在人工智能中做了什么事?
    能够有效的各种不同的数据源,我们能够经过清洗处理之后,做个转化,能够把它变成是机器的“粮食”。让电脑呢,可以依靠这些粮食,长成智慧,去做出进一步的决策。

    数据科学能做什么?

    十个字:“从数据鉴往,从数据知来

    这里写图片描述

    我们要了解一个事情的轮廓,只要能取得相关的一些数据,我们就可以用比较客观的一些方式,去了解这个事件如何发生,为何发生,我们如果能给一些有效的数据,喂给一些数学模型,演算法,我们就可以让电脑掌握所谓的预知能力,让我们通过这些数据,预测未来。

    数据科学需要怎样的技能?

    数学与统计能力

    数据科学的第一步,是建立模型,能够让电脑产生预知能力,那么建立模型就需要一些数学与统计学能力。

    工程能力

    在做数据分析之前,我们要收集和处理数据,那么我们就要借由很多的资讯工程,才能够把这些数据整理起来,

    数据科学从业者是怎样的人呢?(我习惯于说数据科学从业者,好多20到40岁的同行们,都称呼自己为数据科学家,这个我还是不评论了)
    要么是懂一点工程的统计学者
    要么是懂一定统计的工程师

    但是只有工程与统计还远远不够,我们还需要一定的背景知识,领域知识

    领域知识

    数据挖掘届最有名的案例是啤酒与尿布的案例

    数据科学的一个最最重要的能力就是能辨别对于我们做出来的结果,到底是有因果关系还是只是恰好发现有关联而已。

    @数据分析-jacky
    这个图是外国的数据科学家朱康伟发表的:

    数据科学家要具备怎样的能力?

    第一种能力:编程能力(Hacking Skills)

    只有有写程序的能力,我们才能处理数据。

    第二种能力:数学与统计的能力
    因为只有掌握了这种能力,我们才有办法去建模。

    有写程序的能力和数学与统计能力,我们就能实现我们的算法,让电脑可以让我们收集到的数据,自动的去产生一些规则,那这样的学问,就是现在大名鼎鼎,异常火爆的机器学习

    第三种能力:领域知识

    拥有数学与统计学知识,与领域知识,就是传统的研究

    如果拥有写程序的能力与领域知识,就是danger zone, 因为不懂数据与统计,我们可能会要一些毫无关系的东西,当作我们的结论,这时特别容易做出错误的推论。

  • 相关阅读:
    HDU 1800 Flying to the Mars 字典树,STL中的map ,哈希树
    字典树 HDU 1075 What Are You Talking About
    字典树 HDU 1251 统计难题
    最小生成树prim算法 POJ2031
    POJ 1287 Networking 最小生成树
    次小生成树 POJ 2728
    最短路N题Tram SPFA
    poj2236 并查集
    POJ 1611并查集
    Number Sequence
  • 原文地址:https://www.cnblogs.com/shujufenxi/p/7786592.html
Copyright © 2011-2022 走看看