安装R扩展包:install.packages("FKF")
http://www.douban.com/note/243004605/
1、输入数据
l读入有分隔符数据:A<-Scan(file=“./a.txt”,sep=“;”)
l读入首行为文件头的数据:
txt格式: z<-read.table("a1.txt",header=T)
csv格式: z1<-read.csv("ab.csv",header=T)
将数据写入本地:
write.table(iris,file='abc.csv',sep=',')
l生成规则数据:A<-1:10 ;B<-seq(1,5,0.5)
l生成随机数据:A<-rnorm(10,mean=0,sd=1)
计算日期:
> mydate=as.POSIXct(1400906973173/1000, origin = "1970-01-01 00:00:00")
> mydate
[1] "2014-05-24 12:49:33 CST"
> format(mydate, format="%Y-%m-%d %H-%M-%OS3")
[1] "2014-05-24 12-49-33.173"
> as.Date('2014-02-20')+100
[1] "2014-05-31"
2、矩阵向量计算
生成向量
v<-c(1,2,3,4,5)
查看向量长度: length(v)
> length(v)
[1] 5
查看向量的数据类型: mode(v)
> mode(v)
[1] "numeric"
注意:NA表示缺失值
生成序列函数:
> a1<-seq(-2,1,0.5)
> a1
[1] -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0
> rep("hi",5)
[1] "hi" "hi" "hi" "hi" "hi"
gl(k,n) k表示因子水平个数;n表示每个水平的重复数
> gl(2,3,labels=c("female","male"))
[1] female female female male male male
Levels: female male
l生成矩阵:A<-matrix(1:12,nrow=3,ncol=4)
l矩阵转置:t(A)
l矩阵相乘:A%*%B
l矩阵求逆:solve(A)
3、数据框:与二维矩阵类似,但是每列可以有不同类型的数据。
> my.dataset<-data.frame(site=c('A','B','A','A','B'),
+ season=c('Winter','Summer','Summer','Spring','Fall'),
+ pH=c(7.4,6.3,8.6,7.2,8.9))
> my.dataset
site season pH
1 A Winter 7.4
2 B Summer 6.3
3 A Summer 8.6
4 A Spring 7.2
5 B Fall 8.9
> my.dataset$pH
[1] 7.4 6.3 8.6 7.2 8.9
> my.dataset[my.dataset$pH>6,]
site season pH
1 A Winter 7.4
2 B Summer 6.3
3 A Summer 8.6
4 A Spring 7.2
5 B Fall 8.9
4、画图(专门显示图形的窗口)
l列出已开启的绘图设备:dev.list()
l给出正在使用的绘图设备: dev.cur()
l画图函数:plot(),pie(),hist(),barplot()等
5、功能性语句
l查看保存在内存中的变量:Ls()
l删除指定变量:rm(A)
l查看帮助:?rm
6、汇总数据
l显示变量频数 table(x)
l 输出频数直方图: barplot(table(x))
l 输出频数饼图: pie(table(x))
l 汇总后画图:barplot(table(x1,x2),beside=T,col=1:4)
l 统计量图形表示:
barplot(apply(z1[,2:3],1,mean))
pie(apply(z1[,2:3],2,mean))
boxplot(z1[,2:3])
处理数据:
sapply(UScrime[c("U1", "U2")], function(x) (c(mean = mean(x), sd = sd(x))))
sapply(UScrime[c("U1", "U2")], median)
变量的重组:
class <- state.region
> var <- state.x77[, c("Illiteracy")]
> mydata <- as.data.frame(cbind(class, var))
7、连接mysql数据库
1、 配置MySQL ODBC必须先安装MySQL ODBC driver 下载地址可以为:http://www.mysql.com/downloads/connector/odbc/
2、控制面板系统和安全管理工具 选择 “数据源(ODBC)”
enter image description here
3、完成配置后,进入R,就能用了
> library(RODBC)
> test = odbcConnect('mysqldata')
> sqlQuery(test,"select * from test.user")
转载至:http://www.ituring.com.cn/article/34860
程序实践:
导入数据:a<-read.csv("abc.csv",header=T)
sam=0
for(i in 1:115518)
{ sam=sam+a[i,1]
b[i]=a[i,2]/sam
}
导出到文档文件夹:write.csv(b, file="b.csv", row.names=FALSE)
R语言处理字符串:
http://blog.sina.com.cn/s/blog_49040b720100rlkj.html
R在Centos下安装
R语言是主要用于统计分析、绘图的语言和操作环境。
官方网站:
http://www.r-project.org/
Windows下面有直接的安装包,直接下载安装很方便,但是对于刚出的CentOS6.0上不能直接通过yum 安装R,需要自己编译。
下载页面:
http://ftp.ctex.org/mirrors/CRAN/
在编译R之前,需要通过yum安装以下几个程序:
#yum install gcc-gfortran #否则报”configure: error: No F77 compiler found”错误
#yum install gcc gcc-c++ #否则报”configure: error: C++ preprocessor “/lib/cpp” fails sanity check”错误
#yum install readline-devel #否则报”–with-readline=yes (default) and headers/libs are not available”错误
#yum install libXt-devel #否则报”configure: error: –with-x=yes (default) and X11 headers/libs are not available”错误
然后下载源代码,编译
#cd
#wget http://ftp.ctex.org/mirrors/CRAN/src/base/R-2/R-2.13.1.tar.gz
#tar zxvf R-2.13.1.tar.gz
#cd R-2.13.1
#./configure
#make
#make install
即可完成编译安装。
转载:http://blog.sina.com.cn/s/blog_6cfc336b01018wvl.html