zoukankan      html  css  js  c++  java
  • 201116西瓜书机器学习系列---11、特征选择

    201116西瓜书机器学习系列---11、特征选择

    一、总结

    一句话总结:

    特征选择的【步骤】,特征选择的【方法】

    1、稀疏学习?

    2、信息增益如何做特征选择?

    【信息增益越大,特征越重要】

    3、过滤式特征选择:代表算法Relief(Relevant Feature)?

    Relief原理:【能区分开目标的特征挑出来,区分不开目标的特征给它去掉】
    $$delta ^ { j } = sum _ { i = 1 } ^ { M } - operatorname { diff } ( x _ { i } ^ { j } , x _ { i , n h } ^ { j } ) ^ { 2 } + operatorname { diff } ( x _ { i } ^ { j } , x _ { i , n i n } ^ { j } ) ^ { 2 }$$

    4、L1正则化?

    L1正则化使得W变的【稀疏】,L2正则化【使得W变的比较小】

    5、为什么L1正则化可以让特征变少(为什么L1正则化使得W变的稀疏)?

    $$operatorname { obj } ( w ) = min sum _ { i = 1 } ^ { m } ( y _ { i } - w ^ { T } x _ { i } ) ^ { 2 } + lambda | w | _ { 1 }$$
    【L1正则化交点常在坐标轴上】,这样【某个特征值就会为0】,表示这个特征没影响,而【L2正则化的交点常不在坐标轴上】,看图非常好理解

    6、特征工程?

    做一个模型,【70%-90%时间】会花在特征工程上面;【最耗时、最有创造力】的部分;【不同模型】对特征工程【要求不一样】;【cnn、dnn对特征工程要求较低】

    二、特征选择

    博客对应课程的视频位置:

     
    我的旨在学过的东西不再忘记(主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法)的偏公益性质的完全免费的编程视频学习网站: fanrenyi.com;有各种前端、后端、算法、大数据、人工智能等课程。
    博主25岁,前端后端算法大数据人工智能都有兴趣。
    大家有啥都可以加博主联系方式(qq404006308,微信fan404006308)互相交流。工作、生活、心境,可以互相启迪。
    聊技术,交朋友,修心境,qq404006308,微信fan404006308
    26岁,真心找女朋友,非诚勿扰,微信fan404006308,qq404006308
    人工智能群:939687837

    作者相关推荐

  • 相关阅读:
    vue cli
    vue element-ui
    vue mint-ui
    vue富文本编辑器
    vue-单文件组件相关
    axios
    vue Router
    css 行内元素和块级元素的一些注意事项
    golang协程和变量
    Internet地址介绍
  • 原文地址:https://www.cnblogs.com/Renyi-Fan/p/14001799.html
Copyright © 2011-2022 走看看