zoukankan      html  css  js  c++  java
  • 无监督学习算法-Apriori进行关联分析

    关联分析

    是无监督讯息算法中的一种,Apriori主要用来做_关联分析_,_关联分析_可以有两种形式:频繁项集或者关联规则。举个例子:交易订单

    序号 商品名称
    1 书籍,电脑
    2 杯子,手机,手机壳,盘子
    3 古筝,手机,手机壳,玻璃
    4 手机,玻璃
    5 电视,手机,手机壳

    频繁项集:{ 古筝,手机,手机壳,玻璃}就是一个例子。
    关联规则:手机->手机壳,买手机很大概率会买手机壳。

    关联分析使用的思路

    • 无论是频繁项集还是关联规则,都是需要看发生的频率,比如有手机就有手机壳的概率,如果这个比率超过了75%,那么符合。那么概率手机->手机壳=概率({手机、手机壳})/概率({手机})=
      3/5 除以 4/5 = 0.75。
    • 上面的只是其中一种组合,理论上要计算所有排列组合的概率,所以随着数据量的增大,计算量指数增长,而Apriori算法的思路就是如何减少计算量

    Apriori的原理

    优缺点和场景

    • 优点:编码容易
    • 缺点:大数据量时间可能会唱
    • 试用:数值型 or 标称型数据
  • 相关阅读:
    “是懒人造就了方法”——读后感
    多态性动手动脑
    数组问题随笔
    String java问题随笔
    java问题总结
    java问题随笔
    java一些问题的解答
    利用参数的值得返回来求和
    是懒人造就了方法——读后感
    大道至简读后感——JAVA伪代码
  • 原文地址:https://www.cnblogs.com/xiaogangfan/p/9339129.html
Copyright © 2011-2022 走看看