zoukankan      html  css  js  c++  java
  • 04-python进阶-map&reduce

    Map --映射

    Reduce -- 归纳

    将大数据标准化的处理

    Map 拆封任务,Reduce将结果合并

    这样是不是能够将很多计算机组成一台超级计算机呢?

    一些问题:如果任务本身就很复杂,那么拆解任务本身就是一个很打的难题。

    python 在2.6 的时候 增加了 map reduce函数

    例如我们可以这样写

    import urllib2
    urls = [
        'https://www.baidu.com',
        'http://www.douban.com'
    ]
    
    resurt = map(urllib2.urlopen,urls)
    
    #等价于
    
    resurt = []
    for url in urls:
        resurt.append(urllib2.urlopen(url))
    

     当然我们也可以加上多线程的

    import urllib2
    from  multiprocessing.dummy import Pool as ThreadPool
    urls = [
        'https://www.baidu.com',
        'http://www.douban.com'
    ]
    
    def get_html(url):
        res = urllib2.urlopen(url)
        html = res.read()
        return html
    
    pool = ThreadPool(4)
    results = pool.map(get_html,urls)
    
    pool.close()
    pool.join()
    
    print results
    

      

  • 相关阅读:
    饿了么ElementUI table遇到的问题
    Window命令行杀进程
    网络监控流量工具
    记一次Linux系统被入侵的过程
    sftp ftp文件同步方案
    清除oracle归档日志
    TCP连接复用
    Sftp搭建与配置参考
    setfacl命令
    tips
  • 原文地址:https://www.cnblogs.com/nerdlerss/p/7237104.html
Copyright © 2011-2022 走看看