rvest、reticulate包以及radian包
This simple mechanism allow R and Python exchange relatively complex data structures with ease.将复杂的数据结构化繁为简。
数据结构里所有对象的继承和传递。
翻译过来就是,连接R与python的一个麻烦之处在于这两种语言的不同数据类型的以及对象的传递。rPython使用的解决办法是通过json作为中间对象。即将python与R的数据以及对象先转化为json字符串(python通过simplejson这个库,R通过RJSONIO这个库)进行传递,再转化为相应语言的数据类型就可以了。(当然也有用python写好底层py脚本调用shell环境对R进行操作、或者是C语言的底层对python和R的命令进行同步编译以及同步输出)
在R和Python中对应的不同数据结构的语法解析器:
在R语言中推荐下面的程序包:
-
对于CSV文件,使用readr
-
对于JSON文件,使用jsonlite
-
对于YAML文件,使用yaml
Python中推荐:
-
对于CSV文件,使用csv
-
对于JSON文件,使用json
-
对于YAML文件,使用PyYAML
有了rPython以及rvest包之后,以后像数据抓取以及大规模运算等任务就可以交给python了,得到数据之后再传入R,然后利用R的专业的统计包进行统计分析以及作图等。