zoukankan      html  css  js  c++  java
  • 项目总结-推荐系统

    1、案例背景

    当今电商发展的竞争愈来愈激烈。某玩具公司销售额突破6千万后,公司的发展便遭遇瓶颈。公司现状描述,公司属于中型发展公司,资金链充足;该公司的玩具货品来源品牌代理加工工厂,玩具质量和款式以及性价比均为亮点;公司运营团队的规模20人。该玩具公司希望,可以通过我们的分析,给予突破瓶颈+提升销售额的方案。

    2、分析目的

    首先与玩具公司进行调研,了解公司发展情况;结合市场定位以及竞争分析,确定竞争对手以及制定竞争方案;对公司自身数据进行深度挖掘,优化营销方案。

    本次案例中,将针对算法建模的模块,即对公司自身数据进行深度挖掘,优化营销方案。

    3、数据说明

    共有三个数据文件。

    (1)Orders文件是用户在产生购买行为后的交易数据,该数据以订单编号为区分,所产生的数据均在一个订单编号下,时间段为2017年5月整月的数据。

    字段的说明:

      订单编号:只要是一次下单购买的商品,不管购买数量为多少,均为一个订单,均具备一个订单编号;

      买家应付金额/邮费:在购买商品理应支付的金额

      买家实付金额/邮费:买家实际支付的金额(享受折扣,以及包邮),一般在淘宝中,会有售价以及折扣价,售价为商家自认为商品所值得的价格,折扣价为实际的销售价格。

      订单状态:买家的行为决定了订单的状态,买家将宝贝加入到订单中,并提交该订单,此时为下单,此时产生的一系列数据均为下单数据;当买家实际支付之后,此时订单状态才会变为交易成功。

      宝贝种类:这一笔订单中,一共购买的宝贝总类别

      宝贝数量:这一笔订单中,宝贝的总数量

    (2)Items_orders文件为每一个商品的交易数据

      该文件为宝贝的交易数据,以宝贝类别为区分字段,如果一个订单中包含5种宝贝,此时将会以宝贝为维度,呈现5条数据。每一条数据中,包含宝贝的价格、数量等字段信息。

    (3)Items_attribute为商品的属性数据

    该数据包含宝贝的ID、标题、价格以及玩具类型、适用年龄以及品牌。

    4、Python代码实现

    4.1导入数据文件

     4.1.1查看数据

     

     

     4.1.2将数据合成一个表

     

      得到orders_items_props表

     

     4.2构建关系矩阵

     

     

     

    4.3基于商品相似度的算法推荐

    4.3.1计算物品相似度

     

         

     

     4.3.2 根据相似度推荐排名前五的商品

     

    4.3.3导出到CSV文件

     

    4.4基于用户相似度的算法推荐

  • 相关阅读:
    web安全之sql注入实例(5.0之前的)
    http和htpps
    web安全之sql注入原理
    web安全之http协议
    题解洛谷P1538【迎春舞会之数字舞蹈】
    [模板]洛谷T3375 KMP字符串匹配
    [模板]洛谷T2158 仪仗队 欧拉函数
    洛谷T1967 货车运输 Kruskal最大生成树&&倍增LCA
    [模板]洛谷T3380 二逼平衡树 线段树套BST
    [模板]洛谷T3384 树链剖分
  • 原文地址:https://www.cnblogs.com/lvzw/p/11618393.html
Copyright © 2011-2022 走看看