zoukankan      html  css  js  c++  java
  • python argparse:命令行参数解析详解

    简介

    本文介绍的是argparse模块的基本使用方法,尤其详细介绍add_argument内建方法各个参数的使用及其效果。

    本文翻译自argparse的官方说明,并加上一些笔者的理解

    import argparse
    
    parser = argparse.ArgumentParser(description='Process some integers.')
    parser.add_argument('integers', metavar='N', type=int, nargs='+',
                        help='an integer for the accumulator')
    parser.add_argument('--sum', dest='accumulate', action='store_const',
                        const=sum, default=max,
                        help='sum the integers (default: find the max)')
    
    args = parser.parse_args()
    print(args.accumulate(args.integers))
    

    如上示例,argparse模块的基本使用包含5个步骤:

    1. import模块:import argparse
    2. 获解析器对象:argparse.ArgumentParser
    3. 利用解析器对象内建方法,添加参数解析规则:add_argument
    4. 利用解析器对象内建方法,开始解析参数,获取解析结果对象:parse_args
    5. 从解析结果对象中,获取参数值:parse_args

    解析器类(ArgumentParser)

    在第2步中,我们通过ArgumentParser()函数的调用获取了解析器对象ArgumentParser

    在了解解析器对象的各个成员之前,我们先对一段正常的说明文本进行区间划分

    # usage字段
    usage: 程序名 [-h|--help] .....
    
    # Description字段
    程序功能描述
    
    # 位置参数说明(必选)
    positional arguments:
     ...
     
    # 可选参数说明
    optional arguments:
    ...
    
    # 补充说明字段
    ...
    

    例如

    usage: PROG [-h] [--foo [FOO]] bar [bar ...]
    
    bar help
    
    positional arguments:
     bar          bar help
    
    optional arguments:
     -h, --help   show this help message and exit
     --foo [FOO]  foo help
     
     And that's how you'd foo a bar
    

    关于位置参数与可选参数的理解,参考下一章节:添加参数解析规则

    在上述的区间划的认识下,我们再来看看解析器对象的成员及其功能

    名字 默认值 功能
    prog sys.argv[0] -h时显示的程序名
    usage - usage字段描述
    description None description字段描述
    epilog None 补充字段描述
    parents None 从父(公共)解析器中继承所有的参数选项
    formatter_class None 定制说明文本的显示风格
    prefix_class - 定制前缀字符,例如前缀"-b"改为“+b"
    add_help True 是否使能显示参数 -h --help
    allow_abbrev True 是否支持长参数
    fromfile_prefix_chars None
    argument_default None
    conflict_handler None

    比较常用的是description,例如:

    parser = argparse.ArgumentParser(description='Process some integers.')
    

    或者

    parser = argparse.ArgumentParser()
    parser.descritpioin="Process some integers."
    

    添加参数解析规则(add_argument)

    add_argument是解析器类ArgumentParser的内建方法,用于向解析器添加参数解析规则

    ArgumentParser.add_argument(name or flags...[, action][, nargs][, const][, default][, type]
    		[, choices][, required][, help][, metavar][, dest])
    

    内建方法支持以下的关键字,我们会对每一个关键字及其效果做进一步说明

    关键字 简介
    name or flags 参数名或者"-/--"开头的选项,例如foo或者-f, --foo
    action 匹配到选项后的行为
    nargs 选项跟随的参数个数
    const 在某些actionnargs下,使用的固定值
    default 默认值
    type 参数类型
    choices 可选的参数值范围
    required 选项必选or可选
    help 参数描述
    metavar 使用说明中显示的参数名
    dest 选项最终在解析结果对象中的名字

    关键字name or flags

    关键字name是什么?flags又是什么?两者有什么差别?

    name表示参数名,其赋值与位置顺序相关,因此也叫位置参数名,命令行中必须赋值

    flags表示-|--开头的参数名,命令行中可选参数

    例如:

    #可选的flags参数
    parser.add_argument('-f', '--foo')
    #必选的name位置参数
    parser.add_argument('bar0')
    parser.add_argument('bar1')
    

    这里假设--foo需要带1个参数,那么

    prog arg1 --foo arg2 arg3
    
    • arg1 是位置参数bar0的值
    • arg2 是可选参数'-f, --foo'的值
    • arg3 是位置参数bar1的值

    换句话来说,在输入的命令行中,除去所有-|--开头的参数及其带上的参数值之外,剩下的参数都为位置参数,其顺序依次对应使用add_argument注册的位置参数顺序。

    在命令行调用中,位置参数必须赋值,即每个必选参数都要有赋值;而可选参数(-|--)可根据需求选择

    关键字action

    功能如其名,关键字action控制匹配到命令行选项后的行为。参数解析后不是保存值就好了?我们继续看看。

    关键字action只支持以下值,我们稍后再详细讲解每一个值的含义:

    含义
    store 保存参数值
    store_const 关键字const配合使用,保存关键字const的值
    store_true 保存值为True
    store_false 保存值为False
    append 保存多次选项值为列表
    append_const 关键字const配合使用,保存关键字const的值为列表
    const 保存选项的出现次数
    help 效果等效于-h--help
    version 打印版本

    store

    保存参数值,这也是默认的行为,我们看个例子:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo')
    >>> parser.parse_args('--foo 1'.split())
    Namespace(foo='1')
    

    parse_args()之后,--foo选项的值就保存到了parse_args()的解析结果对象中。

    我们可以这样获取解析结果对象的值:

    args = parser.parse_args('--foo 1'.split())
    print(args.foo)
    

    总结来说,选项名成为了解析结果对象的成员,而选项对应的值则成了成员的值

    到这里,我们存在2个疑惑:

    1. 当同时支持-f--foo时,生成的成员名是什么呢?能自定义名字么?
    2. PROG -f这样不需要带参数的选项,存储的成员值是什么样的呢?

    不用急,我们继续往下看

    store_const

    在匹配到选项后,存储关键字const的值,常用于命令行中不带参数的选项。例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', action='store_const', const=42)
    >>> parser.parse_args(['--foo'])
    Namespace(foo=42)
    

    从上面的例子,我们可以看到,在匹配到--foo后,对应成员foo的保存为了const参数的值。

    但更多时候,我们不带参数的选项更多只是表示布尔型的开关,这时候我们可用store_true或者store_false

    store_true 和 store_false

    store_truestore_false是一种特殊的store_const,存储的值类型为布尔型TrueFalse。例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', action='store_true')
    >>> parser.add_argument('--bar', action='store_false')
    >>> parser.add_argument('--baz', action='store_false')
    >>> parser.parse_args('--foo --bar'.split())
    Namespace(foo=True, bar=False, baz=True)
    

    示例中有3个布尔型“开关”,可以发现有以下特点:

    1. store_true在匹配到命令选项后,保存为True;相对的,store_false保存为False
    2. 当命令行中没匹配到开关后,例如示例中的baz,则保存为store_false的相反值True

    append

    把所有值保存为一个列表,常用于支持多次选项的情况,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', action='append')
    >>> parser.parse_args('--foo 1 --foo 2'.split())
    Namespace(foo=['1', '2'])
    

    append_const

    store_const非常相似,只是把值存储为一个列表。此时如果没有指定关键字const,则默认为Noneappend_const常用于多个不同选项值需要存储到相同成员列表的情况。例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--str', dest='types', action='append_const', const=str)
    >>> parser.add_argument('--int', dest='types', action='append_const', const=int)
    >>> parser.parse_args('--str --int'.split())
    Namespace(types=[<class 'str'>, <class 'int'>])
    

    理解上文需要知道以下前提:

    1. 关键字dest用于指定成员名
    2. 参数的值可以是各种对象,包括类型对象,即示例中的str类型int类型

    在示例中,--str的常量值是str类型,以列表形式保存到types成员--int的常量值是int类型,以列表形式保存到types成员

    count

    如果我们只需要统计选项出现的次数,此处可以用count,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--verbose', '-v', action='count')
    >>> parser.parse_args(['-vvv'])
    Namespace(verbose=3)
    

    help

    打印帮助信息,功能等效于-h|--help

    version

    打印版本信息,需要配合关键字version使用,例如:

    >>> import argparse
    >>> parser = argparse.ArgumentParser(prog='PROG')
    >>> parser.add_argument('--version', action='version', version='%(prog)s 2.0')
    >>> parser.parse_args(['--version'])
    PROG 2.0
    

    关键字nargs

    关键字nargsnumber argumemts的缩写,表示选项有多少个参数,其支持以下值:

    含义
    N (an integer) 收集N个参数到列表
    '?' 无参数或单个参数
    '*' 大于等于0个参数
    '+' 大于等于1个参数
    argparse.REMAINDER 只收集不解析

    当没有指定关键字nargs时,其实际的值取决于关键字action,例如当action = "store"时,默认获取1个参数,当action = "store_true"时,选项不需要带参数。

    N (an integer)

    此处的N,表示一个整型数字,含义为选项需要提供N个参数。例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', nargs=2)
    >>> parser.add_argument('bar', nargs=1)
    >>> parser.parse_args('c --foo a b'.split())
    Namespace(bar=['c'], foo=['a', 'b'])
    

    需要注意的是,当nargs = 1时,其并不等效于关键字nargs的默认情况。例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('bar0', nargs=1)
    >>> parser.add_argument('bar1')
    >>> parser.parse_args('a b'.split())
    Namespace(bar0=['a'], bar1='b')
    

    可以发现,nargs = 1时,例如bar0,其值是一个列表,一个只有1个元素的列表;而默认情况下,就是一个元素,官方称为item

    '?'

    nargs='?'可以实现3种场景:

    1. 输入的命令行中,选项带参数时,值为附带的参数
    2. 输入的命令行中,没有改选项时,值为关键字default的值
    3. 输入的命令行中,有选项但没带参数时,值为关键字const的值(只适用于可选选项(flag))

    例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', nargs='?', const='c', default='d')
    >>> parser.add_argument('bar', nargs='?', default='d')
    >>> parser.parse_args(['XX', '--foo', 'YY'])
    Namespace(bar='XX', foo='YY')
    >>> parser.parse_args(['XX', '--foo'])
    Namespace(bar='XX', foo='c')
    >>> parser.parse_args([])
    Namespace(bar='d', foo='d')
    

    一个更常用的场景,是实现可选的输入输出文件,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('infile', nargs='?', type=argparse.FileType('r'),
    ...                     default=sys.stdin)
    >>> parser.add_argument('outfile', nargs='?', type=argparse.FileType('w'),
    ...                     default=sys.stdout)
    >>> parser.parse_args(['input.txt', 'output.txt'])
    Namespace(infile=<_io.TextIOWrapper name='input.txt' encoding='UTF-8'>,
              outfile=<_io.TextIOWrapper name='output.txt' encoding='UTF-8'>)
    >>> parser.parse_args([])
    Namespace(infile=<_io.TextIOWrapper name='<stdin>' encoding='UTF-8'>,
              outfile=<_io.TextIOWrapper name='<stdout>' encoding='UTF-8'>)
    

    上述例子中,如果命令行没有指定input,则使用标准输入stdin;如果命令行没有指定output,则使用标准输出stdout

    '*'

    nargs=2会限制一定要有2个参数,如果需要任意多个参数呢?我们可以用nargs='*',例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', nargs='*')
    >>> parser.add_argument('--bar', nargs='*')
    >>> parser.add_argument('baz', nargs='*')
    >>> parser.parse_args('a b --foo x y --bar 1 2'.split())
    Namespace(bar=['1', '2'], baz=['a', 'b'], foo=['x', 'y'])
    

    nargs=N相似,最终的值是列表类型。

    '+'

    nargs='+'nargs='*'从功能上非常相似,唯一不同的地方在于,nargs='+'要求至少要有1个参数,否则会报错。

    '?''+''*'的定义与正则表达式中的+*非常相似

    在正则表达式中,

    • ?:表示0或1个字符
    • +:表示大于等于1个字符
    • *:表示大于等于0个字符

    我们看个例子:

    >>> parser = argparse.ArgumentParser(prog='PROG')
    >>> parser.add_argument('foo', nargs='+')
    >>> parser.parse_args(['a', 'b'])
    Namespace(foo=['a', 'b'])
    >>> parser.parse_args([])
    usage: PROG [-h] foo [foo ...]
    PROG: error: the following arguments are required: foo
    

    argparse.REMAINDER

    nargs=argparse.REMAINDER常用于收集参数后传递给其他的命令行解析工具,其不会解析-|--,只是收集所有选项到列表。

    例如:

    >>> parser = argparse.ArgumentParser(prog='PROG')
    >>> parser.add_argument('--foo')
    >>> parser.add_argument('command')
    >>> parser.add_argument('args', nargs=argparse.REMAINDER)
    >>> print(parser.parse_args('--foo B cmd --arg1 XX ZZ'.split()))
    Namespace(args=['--arg1', 'XX', 'ZZ'], command='cmd', foo='B')
    

    上例中,argparse没有解析args选项的--arg1,而是全部收集到了一个列表

    关键字const

    关键字acton关键字nargs中,其实已经涉及了关键字const的所有功能。

    关键字const只是存储一个常量值,在以下两种情况下才会使用:

    1. action='store_const'或者action='append_const'
    2. nargs='?'

    当使用action='store_const'action='append_const'时,关键字const必须提供,对其他的action关键字时,默认值为None

    关键字default

    有时候,选项不带参数,或者命令行没对应选项,这时候就可以使用默认值,而关键字default存储的就是默认值。默认情况下,关键字default的值为None。例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', default=42)
    >>> parser.parse_args(['--foo', '2'])
    Namespace(foo='2')
    >>> parser.parse_args([])
    Namespace(foo=42)
    

    如果关键字default赋值的是字符串,而关键字type有指定参数类型,那么就会把字符串转为关键字type指定的类型,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--length', default='10', type=int)
    >>> parser.add_argument('--width', default=10.5, type=int)
    >>> parser.parse_args()
    Namespace(length=10, width=10.5)
    

    如果关键字nargs?或者*,那么default的值会在命令行没有参数时使用,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('foo', nargs='?', default=42)
    >>> parser.parse_args(['a'])
    Namespace(foo='a')
    >>> parser.parse_args([])
    Namespace(foo=42)
    

    关键字default也提供一种特殊用法:default=argparse.SUPPRESS。在这种情况下,如果命令行并没有匹配的选项,那么并不会在解析结果对象中添加选项对应的成员,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', default=argparse.SUPPRESS)
    >>> parser.parse_args([])
    Namespace()
    >>> parser.parse_args(['--foo', '1'])
    Namespace(foo='1')
    

    关键字type

    默认情况下,argparse解析的参数默认为字符串类型,当然也可以通过关键字type指定其他任何类型,例如floatint,甚至是文件类型file, 例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('foo', type=int)
    >>> parser.add_argument('bar', type=open)
    >>> parser.parse_args('2 temp.txt'.split())
    Namespace(bar=<_io.TextIOWrapper name='temp.txt' encoding='UTF-8'>, foo=2)
    

    如果关键字type指定的是文件类型,我们还可以通过```FileType('w')以可写形式打开文件,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('bar', type=argparse.FileType('w'))
    >>> parser.parse_args(['out.txt'])
    Namespace(bar=<_io.TextIOWrapper name='out.txt' encoding='UTF-8'>)
    

    关键字type甚至能指定为函数,经过函数处理后的返回值作为参数值,例如:

    >>> def perfect_square(string):
    ...     value = int(string)
    ...     sqrt = math.sqrt(value)
    ...     if sqrt != int(sqrt):
    ...         msg = "%r is not a perfect square" % string
    ...         raise argparse.ArgumentTypeError(msg)
    ...     return value
    ...
    >>> parser = argparse.ArgumentParser(prog='PROG')
    >>> parser.add_argument('foo', type=perfect_square)
    >>> parser.parse_args(['9'])
    Namespace(foo=9)
    >>> parser.parse_args(['7'])
    usage: PROG [-h] foo
    PROG: error: argument foo: '7' is not a perfect square
    

    关键字choices

    当我们需要限制选项的值范围,我们可以用关键字choices关键字choices限定了参数值的可选列表,如果命令行提供的参数值不在列表中,则会报错,例如:

    >>> parser = argparse.ArgumentParser(prog='game.py')
    >>> parser.add_argument('move', choices=['rock', 'paper', 'scissors'])
    >>> parser.parse_args(['rock'])
    Namespace(move='rock')
    >>> parser.parse_args(['fire'])
    usage: game.py [-h] {rock,paper,scissors}
    game.py: error: argument move: invalid choice: 'fire' (choose from 'rock',
    'paper', 'scissors')
    

    当然,需要注意的是,关键字choice的值必须符合关键字type指定的类型。

    关键字required

    默认情况下,-f--foo都是可选的,但如果需要改为必选,可以使用关键字required,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', required=True)
    >>> parser.parse_args(['--foo', 'BAR'])
    Namespace(foo='BAR')
    >>> parser.parse_args([])
    usage: argparse.py [-h] [--foo FOO]
    argparse.py: error: option --foo is required
    

    关键字help

    关键字help是选项的说明,在-h或者--help时会显示出来,例如:

    >>> parser = argparse.ArgumentParser(prog='frobble')
    >>> parser.add_argument('--foo', action='store_true',
    ...                     help='foo the bars before frobbling')
    >>> parser.add_argument('bar', nargs='+',
    ...                     help='one of the bars to be frobbled')
    >>> parser.parse_args(['-h'])
    usage: frobble [-h] [--foo] bar [bar ...]
    
    positional arguments:
     bar     one of the bars to be frobbled
    
    optional arguments:
     -h, --help  show this help message and exit
     --foo   foo the bars before frobbling
    

    当然,关键字help也支持格式化显示,%(prog)s和大部分add_argument()的关键字,包括%(default)s%(type)s,等等,例如:

    >>> parser = argparse.ArgumentParser(prog='frobble')
    >>> parser.add_argument('bar', nargs='?', type=int, default=42,
    ...                     help='the bar to %(prog)s (default: %(default)s)')
    >>> parser.print_help()
    usage: frobble [-h] [bar]
    
    positional arguments:
    bar     the bar to frobble (default: 42)
    
    optional arguments:
    -h, --help  show this help message and exit
    

    格式为%(keyword)s,如果需要显示%,就需要使用%%

    还存在一种特殊情况,假设我们不希望参数显示在--help中,我们可以用:argparse.SUPPRESS,例如:

    >>> parser = argparse.ArgumentParser(prog='frobble')
    >>> parser.add_argument('--foo', help=argparse.SUPPRESS)
    >>> parser.print_help()
    usage: frobble [-h]
    
    optional arguments:
     -h, --help  show this help message and exit
    

    关键字dest

    argparse会把解析的结果保存成解析结果对象的属性,但是,属性名是什么呢?例如,parser.add_argument(’-f', '--foo'),解析结果是保存在属性f中还是foo中?关键字dest就是用于定制属性名的。

    我们先了解默认情况下,属性名是什么?

    对位置参数而言,关键字dest默认为第一个参数名,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('bar')
    >>> parser.parse_args(['XXX'])
    Namespace(bar='XXX')
    

    对可选参数而言,关键字dest首选第一个出现的长参数名。如果没有长参数,则选择第一个短参数名。不管选择的是长参数还是短参数,都会把-|---给去掉,同时把名字中的-符号替换为_,以符合python的变量命名规则,例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('-f', '--foo-bar', '--foo')
    >>> parser.add_argument('-x', '-y')
    >>> parser.parse_args('-f 1 -x 2'.split())
    Namespace(foo_bar='1', x='2')
    >>> parser.parse_args('--foo 1 -y 2'.split())
    Namespace(foo_bar='1', x='2')
    

    我们再看看,如果定制属性名有什么效果?

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', dest='bar')
    >>> parser.parse_args('--foo XXX'.split())
    Namespace(bar='XXX')
    

    关键字metavar

    在执行-h|--help,显示的帮助信息中,如何定制选项带的参数名呢?例如:

    -t T  	loop times
    

    我希望修改显示的TTIMES,更直观。这时候我们就可以使用关键字metavar了。

    在默认情况下,对位置参数,则会直接显示参数名,对可选参数,则会转为大写。例如:

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo')
    >>> parser.add_argument('bar')
    >>> parser.parse_args('X --foo Y'.split())
    Namespace(bar='X', foo='Y')
    >>> parser.print_help()
    usage:  [-h] [--foo FOO] bar
    
    positional arguments:
     bar
    
    optional arguments:
     -h, --help  show this help message and exit
     --foo FOO
    

    上例中,位置参数bar直接显示为bar,而可选参数--foo带的参数名就转大写显示FOO

    如果我们定制显示的参数名,该怎么做呢?

    >>> parser = argparse.ArgumentParser()
    >>> parser.add_argument('--foo', metavar='YYY')
    >>> parser.add_argument('bar', metavar='XXX')
    >>> parser.parse_args('X --foo Y'.split())
    Namespace(bar='X', foo='Y')
    >>> parser.print_help()
    usage:  [-h] [--foo YYY] XXX
    
    positional arguments:
    XXX
    
    optional arguments:
    -h, --help  show this help message and exit
    --foo YYY
    

    当然,还存在一种特殊情况,就是有多个参数nargs=N,这时候关键字metavar可以以列表形式提供啦,例如:

    >>> parser = argparse.ArgumentParser(prog='PROG')
    >>> parser.add_argument('-x', nargs=2)
    >>> parser.add_argument('--foo', nargs=2, metavar=('bar', 'baz'))
    >>> parser.print_help()
    usage: PROG [-h] [-x X X] [--foo bar baz]
    
    optional arguments:
    -h, --help     show this help message and exit
    -x X X
    --foo bar baz
    

    最后,有一点要注意的时,关键字metavar关键字dest不一样的地方在于,关键字metavar仅仅只影响-h|--help的显示效果,关键dest则同时影响解析结果属性名

    获取解析结果

    action='store'中提到:选项名成为了解析结果对象的成员,而选项对应的值则成了成员的值,所以如果我们需要获取解析后的结果,直接使用解析结果的成员值就好了。例如:

    >>> parser = argparse.ArgumentParser(prog='PROG')
    >>> parser.add_argument('-x', dest='xyz')
    >>> parser.add_argument('--foo', nargs=2, metavar=('bar', 'baz'))
    >>> args = parser.parse_args("--foo a b -x c".split())
    >>> print(args.foo)
    >>> ['a', 'b']
    >>> print(args.xyz)
    >>> c
    
  • 相关阅读:
    LeetCode 79
    LeetCode 437
    LeetCode 783
    LeetCode 59
    LeetCode 每日一题 04/24
    LeetCode 5
    LeetCode 43
    简易多线程任务 往数据库插数据
    定时任务--查数据库--注解实现
    redis 简易 实现
  • 原文地址:https://www.cnblogs.com/gmpy/p/11796416.html
Copyright © 2011-2022 走看看