zoukankan      html  css  js  c++  java
  • python编码问题

    这个主要是献给初学编程的小伙伴的:

    在python编程中,最常用的数据类型就是字符串,而且很多时候你会用到一些不属于标准ASCII字符集的字符,这个时候就容易出现编码错误的异常,这会给初学编程的小伙伴造成很大的困扰,但是如果你了解的python的Unicode,并在python编程中遵循一定的原则,这个问题就很容易解决:

    Unicode:

    Unicode是一种字符集,它为每一种现代或者古代的文字提供了统一的序列号,规定了符号的二进制代码,但是没有规定这个二进制代码应该如何存储,Unicode的编码方式是固定的大师实现方式可以根据不同的需要有不同的选择:utf-8、utf-16........

    在python中gbk编码的汉字一个汉字占两个字符

          utf-8编码的汉字一个汉字占三个字符

    实例:(请将你的名字转换成二进制编码的形式)

    #!usr/bin/env python
    #-*- coding:utf-8 -*-
    m = "李睦晨"
    for i in m:#循环遍历m中的每一个元素
        b = bytes(i, encoding="gbk")#将m中的每一个元素转换成字节的形式指定是 gbk的编码形式
        for v in b:#将b是16进制的形式转换成10进制
            b1 = bin(v)#10进制直接转换成2进制
            print(b1)
    

    注:

      1bytes = 8bit(0000,0000)8个二进制位

      1、在gbk编码中一个汉字是2个字节
        1个汉字 = 2个字节 = 16bit(16个二进制位)

      2、在utf-8的编码中一个汉字是3个字节个
        1个字母是1字节占8个2进制位 

  • 相关阅读:
    dev GridControl 代码自定义下拉框
    字符串utf-8相互转换
    .net 相关
    dev grid 样式
    winform 重置快捷写法
    winform 代码定义事件
    winform设置默认打印机
    可为空的对象必须具有一个值
    js获取当前日期之前或之后数据
    sql 快捷方法使用
  • 原文地址:https://www.cnblogs.com/mosson/p/5606306.html
Copyright © 2011-2022 走看看