python拼接字符串一般有以下几种方法:
1、直接通过(+)操作符拼接
s = 'Hello'+' '+'World'+'!'
print(s)
输出结果:Hello World!
这种方式最常用、直观、易懂,是入门级的实现方式。但是,它也存在两处让人容易犯错的地方。首先,因为python中使用+拼接两个字符串时会生成一个新的字符串,生成新的字符串就需要重新申请内存,当拼接字符串较多时自然会影响效率。
其次,一些有经验的老程序员也容易犯错,他们以为当拼接次数不超过3时,使用+号连接符就会比其它方式快(ps:不少Python教程都是如此建议),但这没有任何合理根据。
事实上,在拼接短的字面值时,由于CPython中的 常数折叠 (constant folding)功能,这些字面值会被转换成更短的形式,例如'a'+'b'+'c' 被转换成'abc','hello'+'world'也会被转换成'hello world'。这种转换是在编译期完成的,而到了运行期时就不会再发生任何拼接操作,因此会加快整体计算的速度。
常数折叠优化有一个限度,它要求拼接结果的长度不超过20。所以,当拼接的最终字符串长度不超过20时,+号操作符的方式,会比后面提到的join等方式快得多,这与+号的使用次数无关。
2、通过str.join()方法拼接
strlist=['Hello',' ','World','!']
print(','.join(strlist))
输出结果:Hello, ,World,!
3、通过str.format()方法拼接
# 简洁版
s1 = 'Hello {}! {}.'.format('World', 'Python')
print(s1)
>>>Hello World! Python.
# 对号入座版
s2 = 'Hello {0}! {1}.'.format('World', 'Python')
s3 = 'Hello {name1}! {name2}.'.format(name1='World', name2='Python')
print(s2)
>>>Hello World! Python.
print(s3)
>>>Hello World! Python.
输出结果:Hello World!
这种方式使用花括号{}做占位符,在format方法中再转入实际的拼接值。容易看出,它实际上是对%号拼接方式的改进。通过这种方式拼接字符串需要注意的是字符串中{}的数量要和format方法参数数量一致,否则会报错。上例中,简洁版的花括号中无内容,缺点是容易弄错次序。对号入座版主要有两种,一种传入序列号,一种则使用key-value的方式。实战中,我们更推荐后一种,既不会数错次序,又更直观可读。
4、通过(%)操作符拼接
s = '%s %s!' % ('Hello', 'World')
print(s)
输出结果:Hello World!
这种方式与str.format()使用方式基本一致。%号格式化字符串的方式继承自古老的C语言,这在很多编程语言都有类似的实现。上例的%s是一个占位符,它仅代表一段字符串,并不是拼接的实际内容。实际的拼接内容在一个单独的%号后面,放在一个元组里。
类似的占位符还有:%d(代表一个整数)、%f(代表一个浮点数)、%x(代表一个16进制数),等等。%占位符既是这种拼接方式的特点,同时也是其限制,因为每种占位符都有特定意义,实际使用起来太麻烦了。
5、通过()多行拼接
s = (
'Hello'
' '
'World'
'!'
)
print(s)
输出结果:Hello World!
python遇到未闭合的小括号,自动将多行拼接为一行。
6、通过string模块中的Template对象拼接
from string import Template
s = Template('${s1} ${s2}!')
print(s.safe_substitute(s1='Hello',s2='World'))
输出结果:Hello World!
Template的实现方式是首先通过Template初始化一个字符串。这些字符串中包含了一个个key。通过调用substitute或safe_subsititute,将key值与方法中传递过来的参数对应上,从而实现在指定的位置导入字符串。这种方式的好处是不需要担心参数不一致引发异常,如:
from string import Template
s = Template('${s1} ${s2} ${s3}!')
print(s.safe_substitute(s1='Hello',s2='World'))
输出结果:Hello World ${s3}!
7、通过F-strings拼接
在python3.6.2版本中,PEP 498 提出一种新型字符串格式化机制,被称为“字符串插值”或者更常见的一种称呼是F-strings,F-strings提供了一种明确且方便的方式将python表达式嵌入到字符串中来进行格式化:
s1='Hello'
s2='World'
print(f'{s1} {s2}!')
输出结果:Hello World!
在F-strings中我们也可以执行函数:
def power(x):
return x*x
x=4
print(f'{x} * {x} = {power(x)}')
输出结果:4 * 4 = 16
而且F-strings的运行速度很快,比%-string和str.format()这两种格式化方法都快得多。
总结一下,我们前面说的“字符串拼接”,其实是从结果上理解。若从实现原理上划分的话,我们可以将这些方法划分出三种类型:
格式化类:%、format()、template
拼接类:+、()、join()
插值类:f-string
拼接长度不超过20时,选用+号操作符方式;长度超过20的情况,高版本选用f-string,低版本时看情况使用format()或join()方式;当要处理字符串列表等序列结构时,采用join()方式。
附几个相关PEP链接: