一、何为数据挖掘?
广义的数据挖掘是指知识发现的全过程。又成为数据库中知识发现(Knowledge Discovery in Databases,KDD)。
注意:数据库查询系统和专家系统不是数据挖掘!在小规模数据上的统计分析和学习过程也不算是数据挖掘。
数据挖掘:从大量的、不完全的、有噪声的、模糊的甚至是随机的实际应用数据中提取隐含在其中的、人们实现不知道的但又潜在有用的信息和知识的过程。
二、一些实例应用
1、找答案、找图片
2、找出与你的论文最相似的一篇
3、自动推荐(商品、朋友)
三、数据挖掘的过程
(DM-Lec1 P31)
(一)从数学的角度
(二)从计算机的角度