zoukankan      html  css  js  c++  java
  • R语言——七月

    这两个月没有写什么代码。也没做什么大项目,基本就是对以前写的那个用ggplot2可视化数据的项目做一些增增补补,大部分技术难关都在ggplot2R语言EXCEL处理这里解决并总结了。然后业余帮人修改一个用RVEST写的亚马逊简陋爬虫,花了两个周末时间。

    就简单记一下最近弄的这个功能块

    功能块分区,并自定义
    这个是在处理数据的时候,需要对一批有序数字按照累积的概率进行分组,然后划分分组。
    主要用到了两个函数:cumsum(求累积分布),cut(划分区间)
    如下面的示例函数getInterval,可以把一个数组一定程度上均分

    library(dplyr)
    set.seed(100)
    data<-sample(1:1000,size=100)
    getInterval<-function(data,n=7){
    temp<-data.frame(raw=data) %>%
            arrange(raw)%>%
            mutate(accumlate=cumsum(raw),
            group=cut(accumlate,breaks=n))
            levels(temp$group)<-1:n
            temp
    }
    new<-getInterval(data)
                                
    对new做个图吧
    library(ggplot2)
    ggplot(new,aes(x=as.factor(1),y=raw,fill=group))+geom_bar(stat="identity")+
    coord_flip()+theme_classic()+mytitle("sample")

    这样子就把一个数组按照和,给平均分了。
    在我拉数的时候有点用

    七月大部分时间都在写大圣归来影评(一刷1千5,二刷5千5),关注电影票房,还有练习画画中过去了,代码这边涉猎较少。大圣的主创团队太励志了,重燃热血!

    For Your Dream!

  • 相关阅读:
    JSP XML数据处理
    JSP 连接数据库
    JSP 发送邮件
    IDEA新建maven项目没有webapp目录解决方法
    web项目中idea控制台中文乱码的解决方法
    Spring基础-12-基于xml配置的事务
    Spring基础-11-事务细节
    Spring基础-10-源码分析
    Spring基础-09-事务
    Spring基础-08-jdbcTemplate
  • 原文地址:https://www.cnblogs.com/weibaar/p/4693228.html
Copyright © 2011-2022 走看看