zoukankan      html  css  js  c++  java
  • 在天河二号上对比Julia,Python和R语言

    Julia是一款高级高效为技术计算(technical computing)而设计的编程语言,其语法与其他计算环境类似。其为分布式计算和并行所设计,最知名的地方在于其接近C语言的高效率。

    按开发者的话说,“我们希望这门开源语言像C一样快…像Python一样通用,像R做统计那么简单,像Perl做文本处理那么方便,像Matlab的线性代数一样强大,还和Shell一样可以把各种程序连接起来”。

    打开Julia的首页http://julialang.org/,在一长串特性介绍后面,便是和各种语言的对比测试。

     

    测试以C为标准,从结果上来看Julia的性能比Python高一个数量级,而比R语言高一到两个数量级。是否真的如此呢,笔者进行了简单测试。

    测试使用Julia官方提供的测试程序,使用炼数成金提供的天河二号资源,使用1节点1核心计算(Intel(R) Xeon(R) CPU E5-4640 0 @ 2.40GHz),Julia = 4.5,Python = 2.7.9/3.5.2,R = 3.3.2

    测试过程

    1, 首先下载官方标准测试程序https://github.com/JuliaLang/julia/tree/master/test/perf

    2, 这里测试micro-benchmark,阅读代码可知这里测试了7个项目:

    "fib" = "Recursive fibonacci"

    "parse_int" = "Integer parsing"

    "quicksort" = "Sorting of random numbers using quicksort"

    "mandel" = "Calculation of mandelbrot set"

    "pi_sum" = "Summation of a power series"

    "rand_mat_stat" = "Statistics on a random matrix"

    "rand_mat_mul" = "Multiplication of random matrices"

    可以看出这里测试了许多常见的场景如调用函数,解析string,排序,循环,随机数生成,向量操作等。代码如图。

     

    3, 登陆天河二号进行测试

    使用Xshell连接天河,并查看天河已经部署的Julia

     

    可查看天河CPU信息

    运行Julia提供的测试,结果如下:

     

    结果整理如下,附上官方benchmark

     

    可以看出Julia果然快得不可思议,转换成以Julia为标准的形式观察:

     

    基本和官方数据一致,Julia 0.4.5甚至更快,稳定地比Python快一个数量级,而R语言则在计算斐波拉契和快排时落后两个数量级。这体现了Julia开发比C简单效率接近于C地特性。作者还贴心的比较了实现randmatstat的Julia和C的代码量,这里截图并横向显示(右上角为Julia代码量)。

    总结,尽管Julia在国内并不算特别火热,但作为面向高性能计算语言,其高效易用的特点值得我们的关注。通过语言本身的设计,Julia从底层的循环到高级的编程风格应用,仅牺牲少量的性能就可以用简单的方式实现复杂的算法。

    引用:

    1. Julia主页 http://julialang.org/

    2. Julia中文社区http://julialang.cn/

    3. Julia语言:让高性能科学计算人人可http://www.csdn.net/article/2014-03-12/2818732

    最后放上一张各语言官方benchmark对比图 http://julialang.org/benchmarks/

    《大数据必知的java基础》立足于Java语言本身及Java技术开发。会涉及并贯穿有关学习大数据系统和软件必知的一些预备知识。点击下方二维码报名课程

  • 相关阅读:
    MongoDB 3.0 添加用户
    MongoDB基本命令用
    http://www.bootcss.com/
    UML之用例图
    .net 下分布式缓存(Memcached)实现
    Android系列 -- 2、视图组件View
    Android系列 -- 1、 初识android
    TP50、TP90、TP99、TP999详解
    Linux下SSD缓存加速之bcache使用
    数据中心常见电源线详细介绍
  • 原文地址:https://www.cnblogs.com/awishfullyway/p/6601497.html
Copyright © 2011-2022 走看看