zoukankan      html  css  js  c++  java
  • 数据挖掘(DM)初览

    虽然考完了《数据挖掘》,但,要真正问自己到底对 DM 了解到多少,还真的什么都回答不上来!

    考试前的几天,才开始看中文版书,说实话,那本英文原版教材看起来真的很吃力,即使你英语水平够高,但你计算机专业水平够高吗?都不高,那就跟看天书是一个概念。

    虽然前面的数据预处理以及数据仓库构建十分必要,但是,重要的还是后面的关联规则的挖掘,这其实也很实际,比如应用到实际的电子购物数据分析中,用来发现用户购买喜好,基于此,你也就明白了为什么数据挖掘这个方向的导师也可以顺便把“电子商务”这个方向附加到自己的研究方向上去,去哄一些学生过来(-_______-``` 希望导师别看到这句话!)。

    其实,DM 与电子商务的结合只是 Web 数据挖掘的一个分支而已。Web 数据挖掘也只是 DM 众多应用中的一个方向而已。

    Web 数据挖掘包含了三个方向:Web 内容挖掘、Web 结构以及 Web 使用记录挖掘。前两者的研究已经出了很多成果,比如 Web 结构挖掘就是各种搜索引擎使用的技术,著名的算法包括 HITS、Google PageRank 等。而 Web 使用记录挖掘方面的研究就相对比较少,也可能是由于电子商务还没有达到成熟的境地。所以说,以后还是要多研究一些 Web 使用记录的数据挖掘,研究人的行为可不是那么好研究的,就如人工智能一样,技术要想达到一定的程度,会受到各种周边技术发展的制约。

    对于一些数据挖掘中的算法,我觉得应用还是非常广泛的,并且很实用。就如国外的社会化音乐网站 Last.FM,这网站够COOL,它能通过分析用户听歌的记录,来发觉出你的“音乐DNA”。还有国内的豆瓣,通过你的读书、看电影、听音乐的历史记录来挖掘出你的喜好,给你推荐你可能喜欢的其它书、影、乐。没什么,就是数据挖掘而已。

    图书馆看到一本书上说,BI(商业智能)即将成为未来几年 IT 领域的核心价值!呵呵,感觉不错,因为 DM 是 BI 的一个关键。

    前景是美好的!欠的,只是静下心,踏踏实实做研究!就这样。

  • 相关阅读:
    HBase with MapReduce (MultiTable Read)
    HBase with MapReduce (SummaryToFile)
    HBase with MapReduce (Summary)
    HBase with MapReduce (Read and Write)
    HBase with MapReduce (Only Read)
    Hbase中的BloomFilter(布隆过滤器)
    HBase的快照技术
    How To Use Hbase Bulk Loading
    Cloudera-Manager修改集群的IP
    Java中的HashSet和TreeSet
  • 原文地址:https://www.cnblogs.com/caca/p/955534.html
Copyright © 2011-2022 走看看