zoukankan      html  css  js  c++  java
  • Python编码_ASCII_Unicode_UTF-8

    获取一个字符的ASCII码值,使用内置函数 ord(),ASCII码占一个字节 ascii不能存中文

    >>> # A 和 a 分别的对应的ASCII码值是
    >>> ord('A')
    65
    >>> ord('a')
    97
    >>>

     Unicode占2个字节,它是可以存中文的,不管是英文还是中文均存储为2个字节

    # Python3.5
    
    >>> name = u'范特西'
    >>> name
    '范特西'
    >>> type(name)
    <class 'str'>
    >>> 
    # Python2.7
    
    >>> name = u'范特西'
    >>> name
    u'u8303u7279u897f'
    >>> type(name)
    <type 'unicode'>
    >>>

    Utf-8占3个字节, 如果是英文就占1个字节,如果是中文就占3个字节,utf-8是解决Unicode存储英文占容量大的问题

    >>> name = name.encode('utf-8')
    >>> len(name)
    9
    >>> name
    b'xe8x8cx83xe7x89xb9xe8xa5xbf'
    >>> 
    >>> name = u'博尔特'
    >>> name = name.encode('utf-8')
    >>> name
    b'xe5x8dx9axe5xb0x94xe7x89xb9'
    >>> name.decode('utf-8')
    '博尔特'
    >>> 

    告诉Python以Utf-8的形式去解析你的代码,在*.py文件最上面一行加上  #_*_ coding:utf-8 _*_ 即可.

    ----------- 赠人玫瑰,手有余香     如果本文对您有所帮助,动动手指扫一扫哟   么么哒 -----------


    未经作者 https://www.cnblogs.com/xin1006/ 梦相随1006 同意,不得擅自转载本文,否则后果自负
  • 相关阅读:
    Golang中使用set
    go 删除数组元素
    golang slice 简单排序
    WSGI 配置禁止反向DNS查找
    OpenStack Restful API框架介绍
    kubebuilder controller 资料学习
    package controllerutil
    JavaWeb开发好资料
    Hibernate3.6中文手册
    软件项目版本号的命名规则及格式
  • 原文地址:https://www.cnblogs.com/xin1006/p/5770953.html
Copyright © 2011-2022 走看看