zoukankan      html  css  js  c++  java
  • 机器学习环境搭建及基础

    一 环境准备

    1. 创建虚拟环境

       (1) 安装virtualenv(pip install virtualenv)
       (2) 创建虚拟环境 – ml-venv (virtualenv ml-venv)
       (3) 激活虚拟环境 (cd ml-venvscripts  回车后activate)  

    2.  安装科学计算相关包

            pip install numpy
            pip install pandas
            pip install matplotlib

    3. 安装scikit-learn

            pip install sklearn
            pip install scipy

    4. 安装Jupyter notebook

            pip install jupyter

    启动虚拟环境下cmd : jupyter notebook

    二 机器学习基础——机器学习就是把无序的数据转换成有用的信息

    1.概念

    对于问题,无需写任何专门的代码,泛型算法(Generic Algorithms) 能对提供的数据得出一些有意思的结论。不用编码, 将数据输入泛型算法当中,它就会在数据的基础上建立出它自己的逻辑。

    2.原理

    打比方:学习算法是种子,数据是土壤,被掌握的程序是成熟的作物。机器学习专家就像农民,播下种子,灌溉,施肥,留意作物的生长状况。

    3.机器学习案例

    1.Google搜索引擎
    2.垃圾邮件过滤(spam,nospam)
    3.网易云音乐每日推荐
    4.天气预报
    5.社交网络恶意评论管理
    6.......

    4.人工智能与机器学习的关系

    (1) 机器学习是一种人工智能的实现方法,深度学习是机器学习的一种技术

    (2)机器学习是人工智能的子集,深度学习是机器学习的子集

    5.人工智能的目的

    教会计算机做现在人类能做的事,并且做得更好。

    6.算法分类

    (1)监督式学习 :已经知道问题的答案并且可以反向找出解题的逻辑

    •分类:主要任务是将实例数据划分到合适的分类中
    •回归:预测数值型数据(数据拟合曲线:通过给定数据点最优拟合曲线)
    (2)非监督式学习

    •聚类:将数据集合分成由类似的对象组成的多个类的过程称为聚类
    •密度估计:将寻找描述数据统计值的过程称之为密度估计
    说明:数据没有类别信息,也不会给定目标值,非监督学习还可以减少数据特征的维度,以便于我们可以使用二维或三维图形更加直观的展示数据信息;
    (3)强化学习

    7.算法用途

    8.算法选择

    9.实现步骤

    (1) 程序化
    (2) 自动化
    (3) 智能化
         神经网络 :每一个节点都知道如何收集一组收据,找到它们的权重,做出对应的输出值(价格预测)
         递归神经网络(RNN):每次使用神经网络的时候都会对它进行升级,这使得让它能跟根据最近浏览的信息更新它的预测。如果数据记忆足够大的话,它甚至能够模拟出长期的规律
         神经元:制造一个 权重 * 因素 简单算法,这个算法叫做神经元。

    10.关键术语

    特征/属性
    •目标变量
    •实例
    •分类
    •样体集
    •训练集
    •训练样本
    •测试数据
    •知识表示

    11.开发机器学习应用程序的步骤

    1.收集数据
    2.准备输入数据
    3.分析输入数据
    4.训练算法
    5.测试算法
    6.使用算法

  • 相关阅读:
    大数据概述
    递归下降语法分析
    消除左递归c语言文法
    自动转换机
    简单的C语言文法
    实验报告一 词法分析程序
    组合数据类型练习
    Python绘制五星红旗
    熟悉常用Linux操作
    大数据概述
  • 原文地址:https://www.cnblogs.com/mlan/p/8616032.html
Copyright © 2011-2022 走看看