zoukankan      html  css  js  c++  java
  • Apriori算法及python实现

     

    1 Apriori介绍

    Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后再在所有的频繁集中找出强规则,即产生用户感兴趣的关联规则。

    2.算法模拟

    clip_image002

    3.伪代码

    clip_image004

    4.python实现

    # -*- coding:gb2312 -*-
    import sys
    import copy
    
    def init_pass(T):
        C = {}  #C为字典
        for t in T: 
            for i in t:
    
                if i in C.keys():
                    C[i] += 1
                else:
                    C[i] = 1
        return C
    
    def generate(F):
        C = []
        k = len(F[0]) + 1
        for f1 in F:
            for f2 in F:
                if f1[k-2] < f2[k-2]:
                    c = copy.copy(f1)
                    c.append(f2[k-2])
                    flag = True
                    for i in range(0,k-1):
                        s = copy.copy(c)
                        s.pop(i)
                        if s not in F:
                            flag = False
                            break
                    if flag and c not in C:
                        C.append(c)
        return C
    
    def compareList(A,B):
        if len(A) <= len(B):
            for a in A:
                if a not in B:
                    return False
        else:
            for b in B:
                if b not in A:
                    return False
        return True
        
    def apriori(T,minSupport):
        D=[]
        C=init_pass(T)
        keys=C.keys();#.keys()方法,求出字典中的索引
        keys.sort()
        D.append(keys)#加入D集中
        F=[[]]
        for f in D[0]:
            if C[f]>=minSupport:
                F[0].append([f])
        k=1
    
        while F[k-1]!=[]:
            D.append(generate(F[k-1]))
            F.append([])
            for c in D[k]:
                count = 0;
                for t in T:
                    if compareList(c,t):
                        count += 1
                if count>= minSupport:
                    F[k].append(c)
            k += 1
    
        U = []
        for f in F:
            for x in f:
                U.append(x)
        return U
    
    
    T = [['A','C','D'],['B','C','E'],['A','B','C','E'],['B','E']]
    
    Z= apriori(T,2)
    print Z

    4.输出结果

    clip_image005

  • 相关阅读:
    open()函数与读写文件
    vim编辑器常用操作
    strip()函数---去除字符串首尾字符
    Python中字符串转义的用法
    shell中内置字段的分隔符IFS
    shell中整数变量自增用法
    shell中EOF的用法
    shell变量字符串截取
    shell中的“数组”
    年终总结:想的多了就该敷衍性得记录一下
  • 原文地址:https://www.cnblogs.com/bankyh/p/4232402.html
Copyright © 2011-2022 走看看