zoukankan      html  css  js  c++  java
  • R语言——七月

    这两个月没有写什么代码。也没做什么大项目,基本就是对以前写的那个用ggplot2可视化数据的项目做一些增增补补,大部分技术难关都在ggplot2R语言EXCEL处理这里解决并总结了。然后业余帮人修改一个用RVEST写的亚马逊简陋爬虫,花了两个周末时间。

    就简单记一下最近弄的这个功能块

    功能块分区,并自定义
    这个是在处理数据的时候,需要对一批有序数字按照累积的概率进行分组,然后划分分组。
    主要用到了两个函数:cumsum(求累积分布),cut(划分区间)
    如下面的示例函数getInterval,可以把一个数组一定程度上均分

    library(dplyr)
    set.seed(100)
    data<-sample(1:1000,size=100)
    getInterval<-function(data,n=7){
    temp<-data.frame(raw=data) %>%
            arrange(raw)%>%
            mutate(accumlate=cumsum(raw),
            group=cut(accumlate,breaks=n))
            levels(temp$group)<-1:n
            temp
    }
    new<-getInterval(data)
                                
    对new做个图吧
    library(ggplot2)
    ggplot(new,aes(x=as.factor(1),y=raw,fill=group))+geom_bar(stat="identity")+
    coord_flip()+theme_classic()+mytitle("sample")

    这样子就把一个数组按照和,给平均分了。
    在我拉数的时候有点用

    七月大部分时间都在写大圣归来影评(一刷1千5,二刷5千5),关注电影票房,还有练习画画中过去了,代码这边涉猎较少。大圣的主创团队太励志了,重燃热血!

    For Your Dream!

  • 相关阅读:
    0302 随想
    1231递归下降语法分析程序设计
    《构建之法》1、2、3章读后感
    复利计算总结
    操作系统实验0
    学习进度条
    0302思考并回答一些问题
    评论
    c语言文法
    词法分析
  • 原文地址:https://www.cnblogs.com/weibaar/p/4693228.html
Copyright © 2011-2022 走看看