zoukankan      html  css  js  c++  java
  • R语言与关联规则挖掘—购物篮分析

    名词:

    挖掘数据集:购物篮数据

    挖掘目标:关联规则

    关联规则:啤酒=>尿布(支持度0.02,置信度0.6)

    支持度:所有数据中有2%的购物记录包含了啤酒和尿布

    置信度:所有包含啤酒的购物记录里有60%包含尿布

    最小支持度阈值和最小置信度阈值。

    项集:项(商品)组成的集合

    K-项集:k个项组成的集合

    频繁项集:满足最小支持度的项集

    强关联规则:满足最小支持阈值和最小置信度阈值的规则

    步骤:

    找出所有频繁项集;由频繁项集产生强关联规则。

    案例:

    TID为购物记录,List of item_ID为商品ID,如第T100条购物记录中,包含商品I1,I2,I5。

    最后推出的关联规则有:

     (以上图片来源薛毅老师的《r modeling》)

    R语言操作:

    包:arules

    数据集:Groceries(内置数据集)

    函数:inspect:显检查,示一个的文集或一个术语文档矩阵的详细信息。查看数据。

             apriori:提取关联规则

    代码:

    ​结果如下:

    结果展示的即为每一种消费记录推出同时购买某种商品的支持度和置信度。最右边的lift参数表明该规则的可信度,如果等于1,啧表明前面的商品与关联商品是独立的。lift值越大,表明规则越可信。

  • 相关阅读:
    mysql热备脚本
    linux系统编程-进程
    15-模块
    14-面向对象3
    13-面向对象2
    12-面向对象1
    02-对比两个文件的差异
    11-面向对象基础
    08-不定长函数
    07-缺省参数
  • 原文地址:https://www.cnblogs.com/rhongp/p/6383800.html
Copyright © 2011-2022 走看看