zoukankan      html  css  js  c++  java
  • 数据转化和字符编码

     数字类型的转化

    1. 转化数字   int  float
    2. 数字转化字符串  print(str( ))

    3.字符串与列表相互转化  

     

    s = 'abc123呵呵'
    print(list(s))  # ['a', 'b', 'c', '1', '2', '3', '呵', '呵']  没有对应的 str(ls)
    ls = ['a', 'b', 'c', '1', '2', '3', '呵', '呵']
    n_s = ''.join(ls)
    print(n_s)  ==>abc123呵呵

    s1 = 'a b c 1 2 3 呵 呵'
    res = s1.split()
    print(res)   ==》['a', 'b', 'c', '1', '2', '3', '呵', '呵']

     

     

    s2 = 'ie=UTF-8&wd=你好帅'

    res = s2.split('&')
    print(res)  # ['ie=UTF-8', 'wd=你好帅']

    ls2 = ['ie=UTF-8', 'wd=你好帅']
    n_s2 = '@'.join(ls2)
    print(n_s2)  # ie=UTF-8@wd=你好帅

     

     

    4."ie=UTF-8&wd=你好帅" => [('ie', 'UTF-8'), ('wd', '你好帅')]

    res = []
    s4 = "ie=UTF-8&wd=你好帅"
    ls4 = s4.split('&')  # ['ie=UTF-8', 'wd=你好帅']
    for ele in ls4:  # v = ie=UTF-8 | wd=你好帅
        k, v = ele.split('=')  # k: ie  v: UTF-8
        res.append((k, v))
    print(res)

     

     

    5."ie=UTF-8&wd=你好帅" => {'ie': 'UTF-8', 'wd': '你好帅'}

    res = {}
    s5 = "ie=UTF-8&wd=你好帅"
    ls5 = s5.split('&')  # ['ie=UTF-8', 'wd=你好帅']
    for ele in ls5:  # v = ie=UTF-8 | wd=你好帅
        k, v = ele.split('=')  # k: ie  v: UTF-8
        res[k] = v
    print(res)

     

    1. [('ie', 'UTF-8'), ('wd', '你好帅')] => {'ie': 'UTF-8','wd': '你好帅'}

    res = {}
    ls6 = [('ie', 'UTF-8'), ('wd', '你好帅')]
    for k, v in ls6:
        res[k] = v
    print(res)

     

    7. .list与tuple、set直接相互转化 - 直接 类型()

    8.将汉字转化为数字

    num_map = {
        '壹': 1,
        '贰': 2,
        '仟': 1000
    }
    ls8 = ['贰', '壹', '仟']
    res = []
    for v in ls8:
        num = num_map[v]  # 通过key去映射表拿到对应的值,完成 '贰' => 2
        res.append(num)
    print(res)

    字符编码

    1. 什么是字符编码:将人识别的字符转换计算机能识别的01,转换的规则就是 字符编码表、

    2. 常用的编码表:asciiunicodeGBKShift_JISEuc-kr

    3. 编码操作:编码encode()、解码decode()

    知识储备

    电脑三大核心:cpu - 内存 - 硬盘(数据的存取过程)

    # 软件及python解释器读取文件过程:启动 - 读取 - 展示|解释执行

    # python2环境的文件头:# coding: 编码格式

    简介与发展

    1. ascii - 各国编码 - 万国编码

    2. 存取不一致的乱码现象

    3. unicodeutf-8

    核心

    编码操作:编码encode()、解码decode()

    字符与字节

    1. 字节的存储方式:8个二进制位

    2. 字符所占字节数:根据编码的不同,所占字节数可能不同

    3. 三种格式字符串:u''b''r''

    ub格式字符串转换: str(b'', encode='utf-8')bytes(u'', encode='utf-8')

    文件操作

    1. 文件操作的三步骤:打开文件 - 使用文件 - 关闭文件

    2. 文件操作三要素:文件源、操作模式、编码

    3. with语法:with open(...) as 别名, ..., open(...) as 别名: pass

    4. 重点方法:read() | write() | readline() | close() | f.flush() | f.seek()

    操作方法

    读:read() | readline() | readlines()

    写:write() | writelines() | flush()

    光标:seek() | tell()

    特征:encoding | closed

    了解:readable() | writable() | name

    案例

    1. 文件复制

    2. 文件修改

     

    了解:py文件脚本机制

  • 相关阅读:
    FZU 2112 并查集、欧拉通路
    HDU 5686 斐波那契数列、Java求大数
    Codeforces 675C Money Transfers 思维题
    HDU 5687 字典树插入查找删除
    HDU 1532 最大流模板题
    HDU 5384 字典树、AC自动机
    山科第三届校赛总结
    HDU 2222 AC自动机模板题
    HDU 3911 线段树区间合并、异或取反操作
    CodeForces 615B Longtail Hedgehog
  • 原文地址:https://www.cnblogs.com/komorebi/p/10738819.html
Copyright © 2011-2022 走看看