zoukankan      html  css  js  c++  java
  • 字符串

    字符串的类型

    ●bytes: 二进制

    互联网.上数据的都是以二进制的方式传输的

    str : unicode的呈现形式

    字符(Cheracter)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字

    字符集(Character set)是多个字符的集合

    字符集包括: ASCII字符集、GB2312字符集、GB18030字符集、Unicode字符集等

    ASCI编码是1个字节,而Unicode编码通常是2个字节。

    UTF-8是Unicode的实现方式之一,UTF-8是它是一 种变长的编码方式,可以是1, 2, 3个字节

    str bytes如何转化
    ●str 使用encode方法转化为bytes
    ● bytes通过decode转化为str
    ●编码方式解码方式必须一样,否则就会出现乱码

    a = "scy孙创昱"
    print( a,type(a) )
    a = a.encode()#默认编码方式是utf-8
    print( a,type(a) )
    print(a.decode())
    print(a.decode("gbk"))

    scy孙创昱 <class 'str'>
    b'scyxe5xadx99xe5x88x9bxe6x98xb1' <class 'bytes'>
    scy孙创昱
    Traceback (most recent call last):
    File "C:/Users/Administrator/PycharmProjects/untitled/test.py", line 6, in <module>
    print(a.decode("gbk"))
    UnicodeDecodeError: 'gbk' codec can't decode byte 0xb1 in position 11: incomplete multibyte sequence

    .

  • 相关阅读:
    JavaScript的关键点
    博客开始
    CCF
    java-CCF+杂七杂八
    【软件工程】需求分析V2再整理
    汇编 书上实验
    组原2
    chrome主页被绑架
    【软件工程】乱的一遭
    【我希望我能鼓起勇气】汇编语言
  • 原文地址:https://www.cnblogs.com/SunChuangYu/p/13228154.html
Copyright © 2011-2022 走看看