zoukankan      html  css  js  c++  java
  • 数据转化和字符编码

     数字类型的转化

    1. 转化数字   int  float
    2. 数字转化字符串  print(str( ))

    3.字符串与列表相互转化  

     

    s = 'abc123呵呵'
    print(list(s))  # ['a', 'b', 'c', '1', '2', '3', '呵', '呵']  没有对应的 str(ls)
    ls = ['a', 'b', 'c', '1', '2', '3', '呵', '呵']
    n_s = ''.join(ls)
    print(n_s)  ==>abc123呵呵

    s1 = 'a b c 1 2 3 呵 呵'
    res = s1.split()
    print(res)   ==》['a', 'b', 'c', '1', '2', '3', '呵', '呵']

     

     

    s2 = 'ie=UTF-8&wd=你好帅'

    res = s2.split('&')
    print(res)  # ['ie=UTF-8', 'wd=你好帅']

    ls2 = ['ie=UTF-8', 'wd=你好帅']
    n_s2 = '@'.join(ls2)
    print(n_s2)  # ie=UTF-8@wd=你好帅

     

     

    4."ie=UTF-8&wd=你好帅" => [('ie', 'UTF-8'), ('wd', '你好帅')]

    res = []
    s4 = "ie=UTF-8&wd=你好帅"
    ls4 = s4.split('&')  # ['ie=UTF-8', 'wd=你好帅']
    for ele in ls4:  # v = ie=UTF-8 | wd=你好帅
        k, v = ele.split('=')  # k: ie  v: UTF-8
        res.append((k, v))
    print(res)

     

     

    5."ie=UTF-8&wd=你好帅" => {'ie': 'UTF-8', 'wd': '你好帅'}

    res = {}
    s5 = "ie=UTF-8&wd=你好帅"
    ls5 = s5.split('&')  # ['ie=UTF-8', 'wd=你好帅']
    for ele in ls5:  # v = ie=UTF-8 | wd=你好帅
        k, v = ele.split('=')  # k: ie  v: UTF-8
        res[k] = v
    print(res)

     

    1. [('ie', 'UTF-8'), ('wd', '你好帅')] => {'ie': 'UTF-8','wd': '你好帅'}

    res = {}
    ls6 = [('ie', 'UTF-8'), ('wd', '你好帅')]
    for k, v in ls6:
        res[k] = v
    print(res)

     

    7. .list与tuple、set直接相互转化 - 直接 类型()

    8.将汉字转化为数字

    num_map = {
        '壹': 1,
        '贰': 2,
        '仟': 1000
    }
    ls8 = ['贰', '壹', '仟']
    res = []
    for v in ls8:
        num = num_map[v]  # 通过key去映射表拿到对应的值,完成 '贰' => 2
        res.append(num)
    print(res)

    字符编码

    1. 什么是字符编码:将人识别的字符转换计算机能识别的01,转换的规则就是 字符编码表、

    2. 常用的编码表:asciiunicodeGBKShift_JISEuc-kr

    3. 编码操作:编码encode()、解码decode()

    知识储备

    电脑三大核心:cpu - 内存 - 硬盘(数据的存取过程)

    # 软件及python解释器读取文件过程:启动 - 读取 - 展示|解释执行

    # python2环境的文件头:# coding: 编码格式

    简介与发展

    1. ascii - 各国编码 - 万国编码

    2. 存取不一致的乱码现象

    3. unicodeutf-8

    核心

    编码操作:编码encode()、解码decode()

    字符与字节

    1. 字节的存储方式:8个二进制位

    2. 字符所占字节数:根据编码的不同,所占字节数可能不同

    3. 三种格式字符串:u''b''r''

    ub格式字符串转换: str(b'', encode='utf-8')bytes(u'', encode='utf-8')

    文件操作

    1. 文件操作的三步骤:打开文件 - 使用文件 - 关闭文件

    2. 文件操作三要素:文件源、操作模式、编码

    3. with语法:with open(...) as 别名, ..., open(...) as 别名: pass

    4. 重点方法:read() | write() | readline() | close() | f.flush() | f.seek()

    操作方法

    读:read() | readline() | readlines()

    写:write() | writelines() | flush()

    光标:seek() | tell()

    特征:encoding | closed

    了解:readable() | writable() | name

    案例

    1. 文件复制

    2. 文件修改

     

    了解:py文件脚本机制

  • 相关阅读:
    程序如何调取焦点轮换图的每一张图片
    做一个网站程序的小小感悟
    点击repeater的一个修改事件触发全部repeater每一行的修改事件
    将两个时间组合,结果为2015年4月8日-4月10日
    转 c# 日期函数[string.Format----GetDateTimeFormats]格式 .
    关于后台管理linkbutton按钮几个重要属性的理解
    循环repeater中的每一列,并计算数据和
    上传图片2
    isinstance和issubclass
    类和对象的绑定方法和非绑定方法
  • 原文地址:https://www.cnblogs.com/komorebi/p/10738819.html
Copyright © 2011-2022 走看看