zoukankan      html  css  js  c++  java
  • Python合集之Python字符串常用操作(一)

        在上一节的合集中,我们了解了Python集合增删改及集合间运算的相关知识,本节我们将进一步了解一下Python字符串的常用操作的相关知识。

    1.拼接字符串

    使用 + 运算符可完成对多个字符串的拼接,+ 运算符可以连接多个字符串并产生一个字符串对象。

    例如:

    mot_en='Remembrance is a form of meeting. Forgetfulness is a form  of freedom. '
    mot_cn='记忆是一种相遇,遗忘是一种自由。'
    print(mot_en+'——'+mot_cn)

    注:字符串是不允许直接与其他类型的数据拼接的,否则会抛出异常信息,因此在拼接其他的数据类型时候,需要将其转换为字符串类型进行拼接。

    2.计算字符串的长度

    由于不同的字符所占字节数不同,所以要计算字符串的长度,需要先了解各个字符所占的字节数。在Python中,数字、英文、小数点、下划线和空格占一个字节,一个汉字可能会占2~4个字节,占几个字节取决于采用的编码,汉字在GBK/GB2312 编码中占2个字节,在UTF-8/unicode 编码中一般占用3个字节(或4个字节)。

    在Python中,提供了len()函数计算字符串的长度,语法格式如下:

    len(string)
    参数说明:
    string:表示要进行长度统计的字符串

    例如:

    str1='人生苦短,我用Python!'
    length=len(str1)
    print(length)

    上面的代码,执行后得到的结果是14。从这个结果中可以看出,默认情况下,通过len()函数计算字符串的长度时,不区分英文,数字和汉字,所有的字符都按一个字符去计算。

    在实际的开发中,有时需要获取字符串实际占用的字节数,即如果是采用UTF-8编码,汉字所占3个字节,采用GBK或者GB2312,汉字所占2个字节,这时可以通过encode()方法进行编码后,在进行获取。

    例如上面的例子,可以采用下面的代码,来获取采用UTF-8实际所占的字节数:

    str1='人生苦短,我用Python!'
    length=len(str1.encode())
    print(length)

    上面的代码执行后的结果为28个字节数,这是因为汉字加中文的标点符号共7个,占21个字节,英文字母加英文的标点符号占7个字节,共28个字节。

    如果要想采用GBK编码来计算上面例子的所占字节数,可以采用下面的代码:

    str1='人生苦短,我用Python!'
    length=len(str1.encode('gbk'))
    print(length)

    上面的代码执行后的结果为21个字节数,这是因为汉字加中文的标点符号共7个,占14个字节,英文字母加英文的标点符号占7个字节,共28个字节。

    花絮:

    本期的Python 字符串的常用操作就分享到这里,下期我们将继续分享Python字符串的截取及其他常用操作的相关知识,感兴趣的朋友可以关注我。

    同时也可以关注下我的个人 微信订阅号,园子里面的文章也会第一时间在订阅号里面进行推送跟更新。

  • 相关阅读:
    HQ-day17 CSS样式表基础①
    SQL 常用操作
    EXCEL 批量生成SQL
    js 顺序提交表单
    js 页面回调函数
    C# excel 常用操作
    C#关于LINQ
    JS 表单验证
    关于Cookie
    js 短信验证码功能
  • 原文地址:https://www.cnblogs.com/a-mumu/p/14410087.html
Copyright © 2011-2022 走看看