zoukankan      html  css  js  c++  java
  • 《Python数据分析与机器学习实战-唐宇迪》读书笔记第1 章--机器学习概念、入门环境

    python数据分析个人学习读书笔记-目录索引

      唐宇迪,计算机专业博士,网易云课堂人工智能认证行家,51CTO学院讲师,CSDN博客专家、讲师。拥有多年人工智能领域培训经验,带领课程研发团队累计开发AI课程60余门,覆盖当下人工智能热门领域
      该书结合了机器学习、数据分析和 Python 语言,通过案例以通俗易懂的方式讲解了如何将算法应用到实际任务。 全书共 20 章,大致分为 4 个部分。第一部分介绍了 Python 的工具包,包括科学计算库 Numpy、数据分析库 Pandas、可视化库 Matplotlib;第 2 部分讲解了机器学习中的经典算法,例如回归算法、决策树、集成算法、支持向量机、聚类算法等;第 3 部分介绍了深度学习中的常用算法,包括神经网络、卷积神经网络、递归神经网络;第 4 部分是项目实战,基于真实数据集,将算法模型应用到实际业务中。

           该书适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。

          该书的推荐学习路线图:

    邀月工作室

         


    《Python数据分析与机器学习实战-唐宇迪》读书笔记第1 章--机器学习概念、入门环境

    1.1机器学习的应用领域:

     邀月工作室

    2、机器学习流程:

    邀月工作室

    一般来说,机器学习流程大致分为以下几步:
      第①步:数据收集与预处理。例如,新闻中会掺杂很多特殊字符和广告等无关因素,要先把这些剔除掉。除此之外,可能还会用到对文章进行分词、提取关键词等操作,这些在后续案例中会进行详细分析。
      第②步:特征工程,也叫作特征抽取。例如,有一段新闻,描述“科比职业生涯画上圆满句号,今天正式退役了”。显然这是一篇与体育相关的新闻,但是计算机可不认识科比,所以还需要将人能读懂的字符转换成计算机能识别的数值。这一步看起来容易,做起来就非常难了,如何构造合适的输入特征也是机器学习中非常重要的一部分。
      第③步:模型构建。这一步只要训练一个分类器即可,当然,建模过程中还会涉及很多调参工作,随便建立一个差不多的模型很容易,但是想要将模型做得完美还需要大量的实验。
      第④步:评估与预测。最后,模型构建完成就可以进行判断预测,一篇文章经过预处理再被传入模型中,机器就会告诉我们按照它所学数据得出的是什么结果。

    1.3环境配置:

    1)推荐下载Anaconda集成环境。

    https://www.anaconda.com/

    下载对应版本安装即可。集成jupyter notebook、spyder等。注意修改为清华的镜像,参考:https://www.cnblogs.com/downmoon/p/12447551.html

    不过,邀月个人还是钟爱Eclipse,毕竟多开发语言环境。

    如果还有个别包无法使用pip install,可以在这里尝试下载whl。https://www.lfd.uci.edu/~gohlke/pythonlibs/

    2)jupyter notebook

    一个非常适合教学的工具。

    如果安装或配置方面有什么问题,可以参考这里:https://www.cnblogs.com/downmoon/p/12598135.html

    1.4其他资源 :

    Github:https://github.com/

    GitHub提供了非常丰富的开源项目和代码。

    kaggle社区:https://www.kaggle.com/

    其内容都是和数据科学相关的,大家可以把它当成一个竞赛站点,不仅包括各行各业的数据集,而且还有各路大神的解决方案。

    本章小结:本章从整体上介绍了Python和机器学习的学习路线,该书所使用的环境只需一个Anaconda即可搞定。

    第1章完。

    python数据分析个人学习读书笔记-目录索引

    该书资源下载,请至异步社区:https://www.epubit.com

  • 相关阅读:
    探讨.net Socket支持在线连接数量
    Net Configuration Agent
    Http压力测试工具HttpTest4Net
    TCP连接有效性检测方法
    SocketAsyncEventArgs使用解说
    可靠、高吞吐架构基础改造
    PerformanceCounter蛋痛的设计
    谱聚类(spectral clustering)原理总结
    用scikit-learn学习DBSCAN聚类
    DBSCAN密度聚类算法
  • 原文地址:https://www.cnblogs.com/downmoon/p/12651783.html
Copyright © 2011-2022 走看看