zoukankan      html  css  js  c++  java
  • R语言&页游渠道分析(转)

    对着满屏的游戏后台数据,需要快速了解数据特征,一种茫然无从下手的感觉?

    本文在游戏后台数据中,如何通过R语言快速的了解游戏后台的数据特征,以及统计各个数据之间的相关系数,并通过相关图来发现其中相关系数较高的数据,从而通过R得到高相关系数之间的线性回归方程,最后通过矩阵散点图来初步发现数据中的一些规律解决相应的问题。附:本文需要安装corrgram和car包

    具体代码如下:

    library(corrgram)

    library(car)

    summary(data9)

    cor(data9)

    scatterplotMatrix(data9,spread=FALSE,main="时间,横幅展示,横幅点击,注册框点击,注册数之间关系")

    corrgram(data9,order=TRUE,lower.panel=panel.shade,upper.panel=panel.pie,text.

    panel=panel.txt,main="时间,横幅展示,横幅点击,注册框点击,注册数之间关系")

    其中以某单机网的游戏广告投放后台数据为例

    通过R中的summary和cor函数可以得到图一,可以快速了解数据的基本特征和相关系数。

    为了方便快速展示数据之间的关联性,可以适当通过图形展示,提高工作效率,如图二,通过使用corrgram包中的corrgram()函数产生的相关图可以快速发现注册框点击和注册的相关系数最高,达到0.98。可以用R语言得到线性回归方程,从而发现从中的规律或者转化率:

    myLm<-lm(M[negotiated=TRUE]~Z[negotiate=TRUE],data=data9)

    myLm$coefficients

    summary(myLm)

    得到结果:(Intercept)requested[negotioted==TURE]

    20.81 0.21

    得到注册框点击Z和注册数M的基本线性回归方程:M=20.81+0.21*Z

    而下图三,载入car包中的scatterplotMatrix()函数生成的矩阵散点图,可以快速了解数据之间的规律。仅下图标记2为例,表示流量和注册数的关系,即广告流量越大,注册数越多,则渠道正常。反之,流量越大,注册数保持不变或者下降的趋势,则渠道疲劳,即该渠道对广告产生视觉疲劳,可初步考虑放弃该渠道。同理,当渠道正常,下图标记1,即时间和注册数的关系成反比,则表示用户对素材疲劳,可适当切换新素材,保持点击新鲜度。

    最后本文通过R语言产生的三个图,可以快速了解数据的基本特征,数据之间的相关性,以及数据之间的分布规律和趋势规律,从而基本达到快速了解游戏后台数据目的。

    作者:心者,审稿:fish

    转自:http://www.itongji.cn/article/012040302015.html

    ---------------------------------------------------------------------------------- 数据和特征决定了效果上限,模型和算法决定了逼近这个上限的程度 ----------------------------------------------------------------------------------
  • 相关阅读:
    「SAM」你的名字
    「疫期颓废」2
    「疫期颓废」1
    代码覆盖率简单介绍
    解决git报ssh variant 'simple' does not support setting port
    接口自动化基本流程和测试思路
    wait和sleep的区别
    vm垃圾回收算法的简单理解
    TCP-三次握手和四次挥手简单理解
    浏览器输入一个url 中间经历的过程
  • 原文地址:https://www.cnblogs.com/payton/p/4243450.html
Copyright © 2011-2022 走看看