zoukankan      html  css  js  c++  java
  • 出乎意料的python2 json高性能处理的最佳方案: pypy2 + python原生json库

    网上一圈发现,python2里ujson评价最高,而python3里orjson评价不错,据同事的评测,在3版本里, ujson和orjson不相上下(不清楚具体的json结构的细节,可能不是很大的数据集)

    选了一个稍微有点尺寸的 json数据做了下试验


    root@ubuntu:/home/yey/perftest# python jsonbench.py
    json.loads 51582/sec
    ujson.loads 202109/sec
    json.dumps 97214/sec
    ujson.dumps 187700/sec

    ujson的loads是json的4倍, ujson的dumps是json的2倍,似乎是不错。

    并且从网上的评价来看,ujson似乎是python2下的最佳选择了。

    在我的场景中,我需要高性能的处理,为此我引入了pypy, 看上面的结果,我想当然的使用了pypy + ujson的组合,结果却不理想,研究发现一个惊人反转:pypy+ujson < python+json < python+ujson < pypy+json

    root@ubuntu:/home/yey/perftest# pypy/bin/pypy jsonbench.py

    json.loads 403308/sec
    ujson.loads 42868/sec
    json.dumps 210220/sec
    ujson.dumps 20783/sec

    结论,如果只需要loads, 那么排名如下

    pypy+json (40w/s) 
    python+ujson(20w/s)
    python+json(5w/s)
    pypy+ujson仅有 4w/s

    如果只需要dumps,    
    pypy+json 21w/s,
    python+ujson 18w/s,  (这个结论可能跟我的实际测试不符,我的json数据集比这个测试里的更大)
    python+json 9w/s,
    pypy+ujson 2w/s

    所以:如果是python2下需要高性能处理json, 没有太复杂的转化的话,最优解是 pypy+json

    当然pypy也有一些限制,比如说某些库并不支持pypy下运行,这些需要注意。

  • 相关阅读:
    poj1088 经典dp
    poj2301
    poj1050(nyoj104 zoj1074)dp问题
    hdu1003
    poj1001(高精度)
    图的深度优先遍历DFS
    jquery中attr和prop的区别
    Apache 配置域名入口路径
    关于启动定时器和取消定时器的问题
    Web攻防之XSS,CSRF,SQL注入
  • 原文地址:https://www.cnblogs.com/yeyong/p/11855174.html
Copyright © 2011-2022 走看看