zoukankan      html  css  js  c++  java
  • 字符串

    字符串基本特点

    字符串的本质是:字符序列。Python 的字符串是不可变的,我们无法对原字符串做任 何修改。但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。 Python 不支持单字符类型,单字符也是作为一个字符串使用的。

    字符串的编码

    Python3 直接支持 Unicode,可以表示世界上任何书面语言的字符。Python3 的字符 默认就是 16 位 Unicode 编码,ASCII 码是 Unicode 编码的子集。
    使用内置函数 ord()可以把字符转换成对应的 Unicode 码;
    使用内置函数 chr()可以把十进制数字转换成对应的字符。

    引号创建字符串

    我们可以通过单引号或双引号创建字符串。例如:a=’abc’; b=”sxt” 使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。
    连续三个单引号或三个双引号,可以帮助我们创建多行字符串。

    空字符串和 len()函数

    Python 允许空字符串的存在,不包含任何字符且长度为 0。
    len()用于计算字符串含有多少字符。

    转义字符

    我们可以使用“+特殊字符”,实现某些难以用字符表示的效果。比如:换行等。常见的 转义字符有这些:

    转义字符描述
    (在行尾时)续行符
    反斜杠符号
    单引号
    "双引号
    退格(Backspace)
    换行
    横向制表符
    回车

    字符串拼接

    1. 可以使用+将多个字符串拼接起来。例如:’aa’+ ’bb’ ==>’aabb’。
      (1) 如果+两边都是字符串,则拼接。
      (2) 如果+两边都是数字,则加法运算。
      (3) 如果+两边类型不同,则抛出异常。
    2. 可以将多个字面字符串直接放到一起实现拼接。例如:’aa’’bb’==>’aabb’
    3. 字符串复制 使用*可以实现字符串复制

    不换行打印

    我们前面调用 print 时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行 符。我们可以自己通过参数 end = “任意字符串”。实现末尾添加任何内容:

    print("编程",end="")
    print("人生",end="###")

    运行结果:

    编程人生###

    从控制台读取字符串

    我们可以使用 input()从控制台读取键盘输入的内容。

    name = input("请输入名字:")

    运行结果:

    请输入名字:

    str()实现数字转型字符串

    str()可以帮助我们将其他数据类型转换为字符串。

    例如: str(5.20) ==>5.20str(3.14e2)==>314.0str(True) ==>True

    当我们调用 print()函数时,解释器自动调用了 str()将非字符串的对象转成了字符串。

    使用[]提取字符

    字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量, 可以提取该位置的单个字符。
    正向搜索: 最左侧第一个字符,偏移量是 0,第二个偏移量是 1,以此类推。直到 len(str)-1 为止。 反向搜索: 最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str) 为止

    replace()实现字符串替换

    字符串是“不可改变”的,我们通过[]可以获取字符串指定位置的字符,但是我们不能改变 字符串。
    字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符 串来实现。
    整个过程中,实际上我们是创建了新的字符串对象,并指向了变量 a,而不是修改了以前的 字符串。

    字符串切片 slice 操作

    切片 slice 操作可以让我们快速的提取子字符串。
    标准格式为: [起始偏移量 start:终止偏移量 end:步长 step]
    典型操作(三个量为正数的情况)如下:

    操作和说明示例结果
    [:] 提取整个字符串“abcdef”[:]“abcdef”
    [start:]从 start 索引开始到结尾“abcdef”[2:]“cdef”
    [:end]从头开始知道 end-1“abcdef”[:2]“ab”
    [start:end]从 start 到 end-1“abcdef”[2:4]“cd”
    [start : end:step]从 start 提取到 end-1,步长是 step“abcdef”[1:5:2]“bd "

    其他操作(三个量为负数)的情况:

    示例说明结果
    “abcdefghijklmnopqrstuv wxyz”[-3:] 倒数三个“xyz”
    “abcdefghijklmnopqrstuv wxyz”[-8:-3]倒数第八个到倒数第 三个(包头不包尾)‘stuvw’
    “abcdefghijklmnopqrstuv wxyz”[::-1]步长为负,从右到左 反向提取‘zyxwvutsrqpon mlkjihgfedcba’

    切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始 偏移量小于 0 则会当做 0,终止偏移量大于“长度-1”会被当成-1。例如: >>> “abcdefg”[3:50] ‘defg’ 我们发现正常输出了结果,没有报错。

    split()分割和 join()合并

    split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔 符,则默认使用空白字符(换行符/空格/制表符)。

    a = "to be or not to be"
    print(a.split())

    运行结果如下:

    ['to', 'be', 'or', 'not', 'to', 'be']

    join()的作用和 split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:

    b = ['to', 'be', 'or', 'not', 'to', 'be']
    print("*".join(a))

    运行结果如下:

    to*be*or*not*to*be

    拼接字符串要点: 使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。推荐 使用 join 函数,因为 join 函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝, 仅新建一次对象。

    字符串驻留机制和字符串比较

    字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。 Python 支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母 和数字)会启用字符串驻留机制驻留机制,在编译器中全部优化了都可以了

    >>> a = "abd_33" 
    >>> b = "abd_33"
    >>> a is b 
    True 
    >>> c = "dd#" 
    >>> d = "dd#" 
    >>> c is d 
    >False   #在编译器中是True
    >>> str1 = "aa" 
    >>> str2 = "bb" 
    >>> str1+str2 is "aabb"
    False 
    >>> str1+str2 == "aabb" 
    True 

    字符串比较和同一性

    我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。 我们使用 is / not is,判断两个对象是否同一个对象。比较的是对象的地址,即 id(obj1)是 否和 id(obj2)相等

    成员操作符

    in /not in 关键字,判断某个字符(子字符串)是否存在于字符串中。

    字符串常用方法汇总

    方法说明
    capitalize()将字符串的第一个字符转换为大写
    center(width, fillchar)返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。
    count(str, beg= 0,end=len(string))返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数
    bytes.decode(encoding=“utf-8”, errors=“strict”)Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回。
    encode(encoding=‘UTF-8’,errors=‘strict’)以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是’ignore’或者’replace’
    endswith(suffix, beg=0, end=len(string))检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False.
    expandtabs(tabsize=8)把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。
    find(str, beg=0, end=len(string))检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1
    index(str, beg=0, end=len(string))跟find()方法一样,只不过如果str不在字符串中会报一个异常.
    isalnum()如果字符串至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False
    isalpha()如果字符串至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
    isdigit()如果字符串只包含数字则返回 True 否则返回 False…
    islower()如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False
    isnumeric()如果字符串中只包含数字字符,则返回 True,否则返回 False
    isspace()如果字符串中只包含空白,则返回 True,否则返回 False.
    istitle()如果字符串是标题化的(见 title())则返回 True,否则返回 False
    isupper()如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False
    join(seq)以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
    len(string)返回字符串长度
    ljust(width[, fillchar])返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格。
    lower()转换字符串中所有大写字符为小写.
    lstrip()截掉字符串左边的空格或指定字符。
    截掉字符串左边的空格或指定字符。创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。
    max(str)返回字符串 str 中最大的字母。
    min(str)返回字符串 str 中最小的字母。
    replace(old, new [, max])把 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。
    rfind(str, beg=0,end=len(string))类似于 find()函数,不过是从右边开始查找.
    rindex( str, beg=0, end=len(string))类似于 index(),不过是从右边开始.
    rjust(width,[, fillchar])返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串
    rstrip()删除字符串字符串末尾的空格.
    split(str="", num=string.count(str))num=string.count(str))以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num+1 个子字符串
    splitlines([keepends])按照行(’ ’, ‘ ’, ’)分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。
    startswith(substr, beg=0,end=len(string))检查字符串是否是以指定子字符串 substr 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。
    strip([chars])在字符串上执行 lstrip()和 rstrip()
    swapcase()将字符串中大写转换为小写,小写转换为大写
    title()返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle())
    translate(table, deletechars="")根据 str 给出的表(包含 256 个字符)转换 string 的字符,
    要过滤掉的字符放到 deletechars 参数中
    upper()转换字符串中的小写字母为大写
    zfill (width)返回长度为 width 的字符串,原字符串右对齐,前面填充0
    isdecimal()检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。

    字符串的格式化

    format()基本用法 Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的 功能。 基本语法是通过 {} 和 : 来代替以前的 % 。 format 函数可以接受不限个参数,位置可以不按顺序。
    我们可以通过{索引}/{参数名},直接映射参数值,实现对字符串的格式化,非常方便。

    填充与对齐

    填充常跟对齐一起使用 ^、<、>分别是居中、左对齐、右对齐,后面带宽度 :号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

    数字格式化

    浮点数通过 f,整数通过 d 进行需要的格式化。如下表

    数字格式输出描述
    3.1415926{:.2f}3.14保留小数点后两位
    3.1415926{:+.2f}3.14带符号保留小数点后两位
    2.71828{:.0f}3不带小数
    5{:0>2d}05数字补零 (填充左边, 宽度为 2)
    5{:x<4d}5xxx数字补 x (填充右边, 宽度为 4)
    10{:x<4d}10xx数字补 x (填充右边, 宽度为 4)
    1000000{:,}1,000,000以逗号分隔的数字格式
    0.25{:.2%}25.00%百分比格式
    1000000000{:.2e}1.00E+09指数记法
    13{:10d}13右对齐 (默认, 宽度为 10)
    13{:<10d}13左对齐 (宽度为 10)
    13{:^10d}13中间对齐 (宽度为 10)

    可变字符串

    在 Python 中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智 能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用 io.StringIO 对象或 array 模块。

    import io
    s = "hello,world"
    sio = io.StringIO(s)
    print(sio.getvalue())
    print(sio.seek(7))
    print(sio.write("人"))
    print(sio.getvalue())

    运行结果如下:

    hello,world
    7
    1
    hello,w人rld

    注意:
    字符串的分割还有partition()这种方式。
    partition(sep) --> (head,sep,tail)
    从左向右遇到分隔符把字符串分割成两部分,返回头、分割符、尾三部分的三元组。如果没有找到分割符,就返回头、尾两个空元素的三元组。

    s1 = "I’m a good student"
    # 以'good'为分割符,返回头、分割符、尾三部分。
    s2 = s1.partition("good")
    # 没有找到分割符'abc',返回头、尾两个空元素的元组。
    s3 = s1.partition('abc')
    print(s1)
    print(s2)
    print(s3)

    运行结果如下:

    I’m a good student
    ('I’m a ', 'good', ' student')
    ('I’m a good student', '', '')
    别废话,拿你代码给我看。
  • 相关阅读:
    引用类型之Object类
    原始类型之String类型
    原始类型之Boolean类型
    引用类型之Boolean类
    引用类型之instanceof运算符
    javascript类型转换
    运算符之一元运算符
    Google Sites开始向所有人免费开放 可自由建个人主页
    在线制作"篆体印章",很酷!
    MD5 哈希计算工具类
  • 原文地址:https://www.cnblogs.com/lvxueyang/p/13707528.html
Copyright © 2011-2022 走看看