zoukankan      html  css  js  c++  java
  • 【转】Python学习---超详细字符串用法大全,好文推荐!

    来自:Python编程与实战(微信号:pthon1024),作者:Jerryning

    没有办法转,整个复制下来了

    本文要点

    • 字符串拼接

    • 拆分含有多种分隔符的字符串

    • 判读字符串a是否以字符串b开头或结尾

    • 调整字符串中文本的格式

    • 对字符串进行左,右,居中对齐

    • 删除字符串中不需要的字符

    字符串拼接

    实际场景:把列表中的数据拼接成一个字符串

    解决方案:使用 str.join() 方法

    >>> li = ['cxk', 'cxk', 'kk', 'caibi']
    >>> ''.join([str(i) for i in li])
    'cxkcxkkkcaibi'

    推荐使用生成器表达式,如果列表很大,可以节省很多内存空间

    >>> ''.join(str(i) for i in li)
    '3cxkkkcaibi'

    拆分含有多种分隔符的字符串

    实际场景:把某个字符串依据分割符号拆分不同的字段,该字符串包含多种不同的分隔符

    s = "ab;fd/ft|fs,f	df.fss*dfd;fs:uu}fsd"

    1.使用 python 中的 split() 方法,由于 split 一次处理一个分隔符,例如:

    >>> res = s.split(';')
    >>> res
    ['ab', 'fd/ft|fs,f df.fss*dfd', 'fs:uu}fsd']

    所以我们需要根据字符串中的分隔符,依次分割,可以是 map 函数!

    >>> list(map(lambda x: x.split("|"), res))
    [['ab'], ['fd/ft', 'fs,f df.fss*dfd'], ['fs:uu}fsd']]

    结果变成了一个二维列表,而我们想要的结果是一维列表,怎么办?

    创建一个临时列表保存结果。

    >>> t = []
    >>> list(map(lambda x: t.extend(x.split("|")), res))
    [None, None, None]
    >>> t
    ['ab', 'fd/ft', 'fs,f df.fss*dfd', 'fs:uu}fsd']

    结果符合我们的预期!接下来继续处理剩余的分隔符,重复动作,用 for 循环搞定!

    最终代码如下:

    def my_split(s, ds):
        res = [s]

        for d in ds:
            t = []
            list(map(lambda x: t.extend(x.split(d)), res))
            res = t
        return res

    将字符串和字符串中所有的分隔符传入,结果如下:

    s = "ab;fd/ft|fs,f	df.fss*dfd;fs:uu}fsd"
    print(my_split(s, ";/|,.}:* "))

    运行结果:['ab', 'fd', 'ft', 'fs', 'f', 'df', 'fss', 'dfd', 'fs', 'uu', 'fsd']

    2.使用 re 模块的中 split() 方法

    re() 也给我们提供了 split() 方法,可以一次性分隔字符串!

    import re

    s = "ab;fd/ft|fs,f df.fss*dfd;fs:uu}fsd"
    print(re.split('[;/|,.}:* ]', s))

    结果一致,是不是很简单粗暴!

    判读字符串a是否以字符串b开头或结尾

    实际场景:比如某目录下有一系列文件:

    编写程序给其中所有 .txt 文件和 .py 文件加上用户可执行权限

    解决方案:

    使用字符串 str.startswith() 和 str.endswith()

    找出以 .txt 和 .py 结尾的文件,其接受一个元组

    >>> import os
    >>> os.listdir(".")
    ['app', 'config', 'requirements.txt', 'run.py', '__pycache__', 'gunicorn.conf.py', 'chromedriver', 'login_after2.png', 'readme.txt', 'slide.png', 'test.py', 'logs', 'chrome-linux.zip', 'gunicorn.pid', 'asgi.py', 'chrome-linux']

    >>> [name for name in os.listdir(".") if name.endswith((".txt", ".py"))]
    ['requirements.txt', 'run.py', 'gunicorn.conf.py', 'readme.txt', 'test.py', 'asgi.py']

    调整字符串中文本的格式

    实际案列:例如在日志文件中,其中日期格式为'yyyy-mm-dd':

    我们想把其中的日期改为美国日期格式'mm/dd/yyyy'.比如 2019-06-12 改成 06/12/2019 格式

    解决方案:使用 re 中的 sub() 方法做字符串替换

    利用正则表达式中的捕获组,捕获每个部分的内容,然后在替换在替换的字符串中调整各个捕获组的顺序!

    代码如下:

    import re

    with open("info.log", "r", encoding="utf-8") as f:
        file = f.read()

    print(re.sub('(d{4})-(d{2})-(d{2})', r'2/3/1', file))

    捕获组中每组需要用括号括起来,然后默认从左至右分为组1, 组2…

    下一个参数是我们要替换的格式,用 1,2,3 分别表示组1, 组2…

    运行结果如下:

    对字符串进行左,右,居中对齐

    解决方案:

    1.使用字符串中的 str.ljust(), str.rjust(), str.center() 进行左右居中对齐!

    以上三种方法的基本用法:

    >>> s = 'abc'
    >>> s.ljust(20, '=')
    'abc================='
    >>> s.ljust(20)
    'abc           '

    三种方法都可以设置默认填充值

    2.使用内置的 format() 方法

    >>> format(s, ">20")
    '                 abc'
    >>> format(s, "<20")
    'abc                 '
    >>> format(s, "^20")
    '        abc         '

    删除字符串中不需要的字符

    实际案例

    1. 过滤掉用户输入中前后多余的空白字符:“    nick2008@gmail.com    ”

    2. 过滤掉某 windows 下编辑文本中的 “ ” :“hello world ”

    3. 去掉文本中的 unicode 组合符号(音调):nǐ hǎo mā

    解决方案

    • 使用 str.strip(), str.lstrip(), str.rstrip() 方法去掉字符串两端字符

    • 使用 str.replace() 或者正则中的 re.sub()

    • 使用字符串中 str.translate() 方法,可以同时删除多个不同的字符

    我踏过的,是不曾虚度的昨天,我去向的 ,永远是比今天更好的远方

  • 相关阅读:
    JavaScript面试库
    JS事件委托的原理和应用
    缓存ABC
    网络模型探究
    持续集成配置之Nuget
    angular应用容器化部署
    微服务随想
    .NET性能优化小技巧
    博客园博客小优化
    Emmet 简介
  • 原文地址:https://www.cnblogs.com/ANT-earth-0711/p/11189344.html
Copyright © 2011-2022 走看看