关联规则推荐及Apriori算法 - 走看看

zoukankan html css js c++ java

关联规则推荐及Apriori算法

参考这篇文章：

http://blog.csdn.net/rongyongfeikai2/article/details/40457827

这条关联规则的支持度：support = P(A并B)

这条关联规则的置信度：confidence = support(A并B）/suport(A)

Apriori算法指导我们，如果要发现强关联规则，就必须先找到频繁集。所谓频繁集，即支持度大于最小支持度的项集。如何得到数据集合D中的所有频繁集呢？

Apriori算法为了进一步缩小需要计算支持度的候选集大小，减小计算量，所以在取得候选集时就进行了它的子集是否有非频繁集的判断。

所以Aprior算法提出了一个逐层搜索的方法，如何逐层搜索呢？包含两个步骤：

1.自连接获取候选集。第一轮的候选集就是数据集D中的项，而其他轮次的候选集则是由前一轮次频繁集自连接得到（频繁集由候选集剪枝得到）。

2.对于候选集进行剪枝。如何剪枝呢？候选集的每一条记录T，如果它的支持度小于最小支持度，那么就会被剪掉；此外，如果一条记录T，它的子集有不是频繁集的，也会被剪掉。

查看全文

相关阅读:
对话框事件
 C# 实现retry
Linq中的group by多表多字段，Sum求和
 词干提取（stemming）和词形还原（lemmatization）
GIT简单应用实例
 像素、分辨率、dpi的区别和联系
 二值图像、灰度图像、彩色图像
 更好的做科研
 数据挖掘竞赛利器-Stacking和Blending方式
 如何成为一名成功的博士生

原文地址：https://www.cnblogs.com/charlesblc/p/6392263.html

Copyright © 2011-2022 走看看