作者: 谢邦昌 装载:http://blog.sina.com.cn/s/blog_61c463090100lse6.html数据挖掘总结之书籍篇
从2007年做数据挖掘到现在,经历了很多痛苦,也获得了很多快乐。因为data mining一直就是一门强调实践的技术。在学习的过程中,参加过DEKE课程的学习,阅读了很多相关的书籍,榨取过很多paper的精华,品读过一些优秀的开源数据挖掘代码,实现过一些常见的数据挖掘算法,使用过常见的数据挖掘软件。每每看到桌前那堆打印的paper,还有那两本厚厚的读书笔记和学习总结,感觉还是挺不错的(*^__^*) 。以后多写一些感受和大家(Dminer)分享,这样自己也可以时刻审视自己,提高自己,完善自己的知识。最近有些同学问数据挖掘要怎么学,我觉得首先就是兴趣,这个是最重要的,不过没有兴趣可以去培养嘛,主要是喜欢这行。我觉得还是从和数据挖掘相关的书说起吧。这两年也看了一些数据挖掘的书,这些书适合不同层次水平的人看。在此,总结了一下,主要有以下几本书籍(其他的记不住了O(∩_∩)O~):
1.数据挖掘:概念与技术 作者:Jiawei Han著 范明 孟小峰译
这本书在业界相当出名吧,作者也是超牛,http://www.cs.uiuc.edu/~hanj/
主要是从数据库,数据仓库方面入手,讲的很全面,作为数据挖掘入门是本好书,算法,实例都很详细,还有数据挖掘领域最前沿的知识介绍。
数据挖掘原理 作者: David Hand,Heikki Mannila,Padhraic Smyt
这本书是一本很有深度的数据挖掘书,有很多数学统计的推导,不适合数据挖掘入门者,属于天书级别。我到现在还没都弄懂,不看个10遍估计拿不下。痛苦ing
Data Mining: Practical Learning Tools and Techniques with Java Implementations 作者:(新西兰)Ian H.Witten,Eide Frank
这本书是结合开源数据挖掘工具weka编写,用java语言实现,书中描述了怎么去开发,怎么weka的基础上进行二次开发。
机器学习(英文版) 作者: Tom M.Mitchell
这本书主要是讲解机器学习相关算法,很多算法被应用在数据挖掘中。
机器学习导论 作者: (土耳其)Ethem Alpaydin
The Elements of Statistical Learning:Data Mining,Inference,and Prediction 作者: (美)Trevor Hastie,Robert Tibshirani,Jerome Friedman
这本书从统计学的角度描述数据挖掘,很多数学公式推导,需要有深厚的数理统计硬功夫。
金融数据挖掘 作者:马超群;兰秋军;陈为民
国内学者写的金融数据挖掘,主要如何将数据挖掘算法应用在金融领域,有算法讲解,也有算法的改进。
数据挖掘基础教程 作者: (印度)K.P. Soman Shyam Diwakar V. Ajay译者: 范明;牛常勇
这本书很适合初学者,算法讲解详细,算法势力也比较多,易于理解。
数据挖掘教程 作者: Margaret H. Dunham 译者: 郭崇慧 田凤占 靳晓明
这本书按照数据挖掘应用,初级,高级来分别讲解。数据挖掘算法主要通过伪代码描述,算法讲解很清楚,习题深入浅出,很是适合指导paper
数据挖掘原理与算法 作者: 毛国君 段立娟 王实 石云
数据挖掘原理与算法 作者: 邵峰晶 于忠清 王金龙 孙仁诚
以上两本书都是国内学者写的数据挖掘算法相关的书,比较好理解,基本的数据挖掘算法讲的也比较清晰。尤其是书籍后面的参考文献,都是数据挖掘方面非常好的paper。估计这书是作者的论文总结吧,O(∩_∩)O~
数据挖掘与应用 作者: 张俊妮
运用SAS进行数据挖掘,超赞级别,理论实践都写得很good
数据挖掘原理与应用--SQL Server 2005数据库 作者: (美)ZhaoHui Tang Jamie MacLennan
数据挖掘Clementine应用实务
作者: 谢邦昌