zoukankan      html  css  js  c++  java
  • 机器学习(一)

    机器学习的概念和基本术语:(我这里把机器学习当成一个人的学习过程来理解的)

      很多人会问:what fuck mechine learning?其实我也是小白。不过我自己的理解是:像人一样,根据我们从小开始经历过的事情自觉地把相似的分类,然后形成一套解决方法的潜意识理念,等到我们再次遇到相似的问题,我们就能通过以往的经验去解决问题。所以我理解的机器学习,就是一个通过以往的训练数据,然后利用算法形成一个模型,这个模型能在我们以后碰到类似的问题时能快速的作出判断和输出结果。

      世界上有很多人,而在机器学习中,把这个叫做“数据集”,而其中的小明就是一个“样本”,而人都会有一些特征,比如瞳孔颜色,发色,眼皮等这些就是“属性”,其中瞳孔颜色为黑色,蓝色,绿色,这些叫“属性值”。假设这三个属性可以确定人种,那么我们可以用一个三维坐标把数据集里面的数据全部对应起来。

      学习任务可以分为:

        分类和回归(预测值为离散型的)。

        分类和回归学习的区别:分类就好比周志华书上讲的,“好瓜”,“坏瓜”,这种离散的值,把瓜分成两种或更多种的称为分类。而瓜的成熟度0.9,0.85.等,这些就是回归。

        “聚类”

         数据集自动分成若干组,这些组可能会存在对应的概念。通常情况下,我们这些概念我们事先试试不知道的,而我们训练数据中是不存在这些标记的。

      监督学习和非监督学习:

        监督学习就是事先我们知道学习的结果,就像是人种的分类,我们已经知道白种人,黄种人等,我们目的是为了通过训练数据去建立一个可以识别人种的模型。上面提到的分类和回归就是监督学习。

        非监督学习:事先不知道结果,通过学习然后慢慢无限逼近的过程。聚类就是非监督学习。

      “泛化”能力,这是评估学习模型适应新样本的能力的术语。

      假设空间:把学习过程中所有假设组成的空间。

      假设空间规模大小:比如,瞳孔颜色有黑,蓝,绿。发色,黑,红,白 。皮肤有白,黄,黑。我们要找黄种人:黑瞳孔,黑头发,黄皮肤。我们计算是共有三中属性,每个属性可以取“*”和其他三个值。所以三个属性都可以去四个值。4*4*4+1(可能黄种人这个概念根本不存在)=65

      版本空间:就是把假设空间和正例不一致,和反例一直的假设全部删除。剩下的假设组成的就是版本空间。

      “学习算法无好坏”--具体问题具体分析。

      

    个人理解,有错请指出。

    机器学习开始就是一个小孩子刚出生到他开始走路之前。他的学习方式就是从外界不断的获取信息,然后模仿。这个时候是收集数据,当然收集数据这个过程一直到生命结束。然后慢慢他就会去尝试做一些事情,他不知道事情的结果,这是外界会给他一个限定,可以,不可以。这经常是大人嘴里的可以做这个不可以做那个。这里面就包含了概念学习中的布尔概念学习。小孩子在这种情况下,慢慢就对一些事情打上标记,抽烟,不能做。打篮球,可以做。这些就是所谓的标记信息。随着时间,小孩子有了自己的思想,他就会去对外界进来的信息进行分析,大人说的是对的吗?等到小孩子成年后,他就会通过不断的验证学习形成自己的一个模型,而这个模型会不断地额完善,直到死去。而这是个周而复始的过程,数据收集,数据分析,形成模型,模型优化(数据收集,数据分析,模型优化)所以说小孩子的早期教育十分重要,因为形成模型后再去修改就十分困难。

  • 相关阅读:
    安卓使用spinner控件和pull解析实现全国省市县的三级联动(附上xml文件)
    安卓linearlayout布局的一个嵌套实例
    接口回调的例子和安卓中的接口回掉实例
    Android Studio 快捷键
    java比较器 之compareable 和comparato比较
    4.Gradle构建Spring Boot项目
    2.Gradle安装和常用命令
    1.Gradle基础介绍
    6.SpringBoot学习(六)——Spring Boot Banner自定义
    4.SpringBoot学习(四)——Spring Boot Validation校验及原理
  • 原文地址:https://www.cnblogs.com/lx-1024/p/7551289.html
Copyright © 2011-2022 走看看