zoukankan      html  css  js  c++  java
  • 【python技巧系列】在循环中处理异常并继续运行

    有一个常见的场景:有一段代码的运行时间比较长,另对应的有一个输入集合。因此通常采用循环的方式将参数从输入集合中取出来让代码运行。

    最简单的写法是这样的:

        param_set = [param1, param2, param3]
    
        for param in param_set:
            do_something(param)
    

    通常情况下这种方式会遇到一些问题。举两个我经常遇到的例子:

    1. do_something()是爬虫代码,param是页面地址。进行到param_i的时候,ip/账号被对方网站限制访问了。
    2. do_something()是某算法代码,param是算法参数。进行到param_i的时候,出现了一些异常(NaN值,分母为零...等等)。

    由于do_something()的运行时间长,或者param_set很大,显然不能让循环从头开始。这时需要在出错的循环位置将当前的输入保存下来,下一次从没有运行的输入集合里取出参数。我们可以这样写:

        param_set = {param1, param2, param3}
    
        def do_something(param):
            # Python的对象传参机制,直接修改param的值
            ...
            try:
                ...
            except:
                param_set.add(param)
                with open(file, 'w') as f:
                    pickle.dump(param_set, f)
                return 1
    
        param = param_set.pop()
        while param:
            flag = do_something(param)
            if flag == 1:
                break
            else:
                param = param_set.pop()
    

    如果需要按照一定次序取出param,则可以用列表的方式储存param_set,并将序号保留下来:

        param_set = [param1, param2, param3]
    
        def do_something(index):
            # Python的对象传参机制,直接修改param的值
            ...
            try:
                ...
            except:
                with open(file, 'w') as f:
                    pickle.dump((param_set, index), f)    
    
        for index in range(0, len(param_set)):    
            flag = do_something(param_set[index])
            if flag == 1:
                break
    
  • 相关阅读:
    搭建Apache服务器并使用自签证书实现https访问
    常见加密算法
    awk命令用法
    systemd的新特性及常见的systemd unit类型分析
    kickstart文件制作与光盘镜像制作
    grub启动引导程序配置及命令行接口详解
    Linux启动流程(CentOS6)
    Linux相关网络命令
    rpm与yum,at与crontab,sed命令使用
    腾讯明眸极速高清升级2.0,助力韩国赛事超高清5G直播
  • 原文地址:https://www.cnblogs.com/manqing/p/6673769.html
Copyright © 2011-2022 走看看