zoukankan      html  css  js  c++  java
  • 【数据仓库与数据挖掘

    频繁项集:

    最基本的模式是项集,它是指若干个项的集合。频繁模式是指数据集中频繁出现的项集、序列或子结构。频繁项集是指支持度大于等于最小支持度(min_sup)的集合。其中支持度是指某个集合在所有事务中出现的频率。频繁项集的经典应用是购物篮模型。常用的频繁项集的评估标准有支持度,置信度和提升度(关联规则)三个

      求频繁项集:

      对于如表5.5所示的事务集合,设最小支持度计数为3,采用Apriori算法求出所有的频繁项集。

    关联规则:

    关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。其中,关联规则XY,存在支持度和信任度。

      支持度:几个关联的数据在数据集中出现的次数占总数据集的比重

      

      置信度:一个数据出现后,另一个数据出现的概率,或者说数据的条件概率。

      

      提升度:表示含有Y的条件下,同时含有X的概率,与X总体发生的概率之比

      

     

     自连接:

  • 相关阅读:
    .net Remoting学习笔记(一) 中庸
    培训是一种乐趣(2)
    ExtJS实战(10)项目总结
    ExtJS实战(4)struts
    ExtJS实战(7)登陆
    ExtJS实战(5)dwr
    让老师崩溃的回答-程序员的经典笑话
    ExtJS实战(9)疑难杂症分析
    ExtJS实战(6)extjs+json
    ExtJS实战(8)CRUD+分页+复杂查询+排序
  • 原文地址:https://www.cnblogs.com/litstar/p/12631500.html
Copyright © 2011-2022 走看看