zoukankan      html  css  js  c++  java
  • 1.1_数据的来源和类型

    数据的来源与类型

    大部分的数据都来自已有的数据库,如果没有的话也可以交给很多爬虫工程师去采集,来提供。也可以来自平时的记录,反正数据无处不在,大都是可用的。

    数据的类型

    按照机器学习的数据分类我们可以将数据分成:

    • 标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类)
    • 数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等 (数值型目标变量主要用于回归分析)

    按照数据的本身分布特性

    • 离散型
    • 连续型

    那么什么是离散型和连续型数据呢?首先连续型数据是有规律的,离散型数据是没有规律的

    • 离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,班级人数、进球个数、是否是某个类别等等

    • 连续型数据是指在指定区间内可以是任意一个数值,例如,票房数据、花瓣大小分布数据

  • 相关阅读:
    input光标位置
    清除浮动
    CSS的两种盒模型
    网页中常用的命名
    清除inline-block元素默认间距
    自定义复选框样式及全选操作
    如何用elementui去实现图片上传和表单提交,用axios的post方法
    datatables
    9273:PKU2506Tiling
    666:放苹果
  • 原文地址:https://www.cnblogs.com/alexzhang92/p/10070173.html
Copyright © 2011-2022 走看看