201116西瓜书机器学习系列---11、特征选择

zoukankan html css js c++ java

201116西瓜书机器学习系列---11、特征选择

201116西瓜书机器学习系列---11、特征选择

一、总结

一句话总结：

特征选择的【步骤】，特征选择的【方法】

1、稀疏学习？

2、信息增益如何做特征选择？

【信息增益越大，特征越重要】

3、过滤式特征选择：代表算法Relief（Relevant Feature）？

Relief原理：【能区分开目标的特征挑出来，区分不开目标的特征给它去掉】

$$delta ^ { j } = sum _ { i = 1 } ^ { M } - operatorname { diff } ( x _ { i } ^ { j } , x _ { i , n h } ^ { j } ) ^ { 2 } + operatorname { diff } ( x _ { i } ^ { j } , x _ { i , n i n } ^ { j } ) ^ { 2 }$$

4、L1正则化？

L1正则化使得W变的【稀疏】，L2正则化【使得W变的比较小】

5、为什么L1正则化可以让特征变少（为什么L1正则化使得W变的稀疏）？

$$operatorname { obj } ( w ) = min sum _ { i = 1 } ^ { m } ( y _ { i } - w ^ { T } x _ { i } ) ^ { 2 } + lambda | w | _ { 1 }$$

【L1正则化交点常在坐标轴上】，这样【某个特征值就会为0】，表示这个特征没影响，而【L2正则化的交点常不在坐标轴上】，看图非常好理解

6、特征工程？

做一个模型，【70%-90%时间】会花在特征工程上面；【最耗时、最有创造力】的部分；【不同模型】对特征工程【要求不一样】；【cnn、dnn对特征工程要求较低】

二、特征选择

博客对应课程的视频位置：

我的旨在学过的东西不再忘记（主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法）的偏公益性质的完全免费的编程视频学习网站： fanrenyi.com；有各种前端、后端、算法、大数据、人工智能等课程。

版权申明：欢迎转载，但请注明出处
一些博文中有一些参考内容因时间久远找不到来源了没有注明，如果侵权请联系我删除。

博主25岁，前端后端算法大数据人工智能都有兴趣。

大家有啥都可以加博主联系方式（qq404006308，微信fan404006308）互相交流。工作、生活、心境，可以互相启迪。

聊技术，交朋友，修心境，qq404006308，微信fan404006308

26岁，真心找女朋友，非诚勿扰，微信fan404006308，qq404006308

人工智能群：939687837

作者相关推荐

感悟总结

其它重要感悟总结

感悟总结200813 最近心境200830 最近心境201019 201218-210205

查看全文

相关阅读:
Android中Handler与Message的简单实例
 折腾蛋疼的Ubuntu1204LTS的U盘安装
 sgs_intro
把杀某程序封装成sh
boost 程序库完全开发_ch4_utility
VS2005 warning C4819处理办法(提示代码页有不兼容的字符)
Ubuntu1204LTS下xynxyc编译Emacs24.02
当VS05调试赋值不对时,小心只是IDE的watch在骗你.....
很好的boost学习资料
 C++实现Creational Singleton模式

原文地址：https://www.cnblogs.com/Renyi-Fan/p/14001799.html

201116西瓜书机器学习系列---11、特征选择

201116西瓜书机器学习系列---11、特征选择

一、总结

一句话总结：

特征选择的【步骤】，特征选择的【方法】

1、稀疏学习？

2、信息增益如何做特征选择？

【信息增益越大，特征越重要】

3、过滤式特征选择：代表算法Relief（Relevant Feature）？

Relief原理：【能区分开目标的特征挑出来，区分不开目标的特征给它去掉】

$$delta ^ { j } = sum _ { i = 1 } ^ { M } - operatorname { diff } ( x _ { i } ^ { j } , x _ { i , n h } ^ { j } ) ^ { 2 } + operatorname { diff } ( x _ { i } ^ { j } , x _ { i , n i n } ^ { j } ) ^ { 2 }$$

4、L1正则化？

L1正则化使得W变的【稀疏】，L2正则化【使得W变的比较小】

5、为什么L1正则化可以让特征变少（为什么L1正则化使得W变的稀疏）？

$$operatorname { obj } ( w ) = min sum _ { i = 1 } ^ { m } ( y _ { i } - w ^ { T } x _ { i } ) ^ { 2 } + lambda | w | _ { 1 }$$

【L1正则化交点常在坐标轴上】，这样【某个特征值就会为0】，表示这个特征没影响，而【L2正则化的交点常不在坐标轴上】，看图非常好理解

6、特征工程？

做一个模型，【70%-90%时间】会花在特征工程上面；【最耗时、最有创造力】的部分；【不同模型】对特征工程【要求不一样】；【cnn、dnn对特征工程要求较低】

二、特征选择

作者相关推荐