zoukankan      html  css  js  c++  java
  • 字符编码、文件处理

    """
    一:字符编码
    字符编码就是将一个字符转化成一串电脑能懂得二进制的过程就叫字符编码。
    字符编码是将字符通过固定的格式转化的过程。
    字符编码表就是字符转化的标准。
    阶段一:现代计算机起源于美国,最早诞生也是基于英文考虑的ASCII
    阶段二:为了满足中文和英文,中国人定制了GBK
    阶段三:1、能够兼容万国字符
    2、与全世界所有的字符编码都有映射关系,这样就可以转换成任意国家的字符编码
    Unicode与UTF—8
    内存中统一采用unicode,浪费空间来换取可以转换成任意编码(不乱码),
    硬盘可以采用各种编码,如utf-8,保证存放于硬盘或者基于网络传输的数据量很小,提高传输效率与稳定性。
    通常乱码主要是两种情况:
    1.保存文件与读取文件用的不是用一种编码表。
    2.保存过程中有保存时使用的编码表不能识别的字符。
    一般为了不乱码,会在文件开头指定编码表:coding;UTF-8。coding表示使用字符编码表,冒号后面接编码表。
    总结:
    1、保证不乱吗的核心法则就是,字符按照什么标准而编码的,就要按照什么标准解码,此处的标准指的就是字符编码
    2、在内存中写的所有字符,一视同仁,都是unicode编码,
    比如我们打开编辑器,输入一个“你”,我们并不能说“你”就是一个汉字,此时它仅仅只是一个符号,
    该符号可能很多国家都在使用,根据我们使用的输入法不同这个字的样式可能也不太一样。
    只有在我们往硬盘保存或者基于网络传输时,才能确定”你“到底是一个汉字,还是一个日本字,这就是unicode转换成其他编码格式的过程了

    二:文件处理:
    文件处理三种模式:r w a
    r表示的是read 只读模式。即只读文件,不可以写。
    只读模式的操作:
    read 读取全部代码
    readline 读取一行代码
    readlines 读取全部行代码
    readable 判断是否可读
    w表示的是write 只写模式。即只能写 不能读。
    只写模式的操作:
    write 将字符写入文件
    writelines 将多个内容分批次写入文件。
    writeable 判断是否可写
    文件处理两种内容:t b


    """
  • 相关阅读:
    Junit单元测试
    win7的6个网络命令
    WOJ1024 (POJ1985+POJ2631) Exploration 树/BFS
    WOJ1022 Competition of Programming 贪心 WOJ1023 Division dp
    woj1019 Curriculum Schedule 输入输出 woj1020 Adjacent Difference 排序
    woj1018(HDU4384)KING KONG 循环群
    woj1016 cherry blossom woj1017 Billiard ball 几何
    woj1013 Barcelet 字符串 woj1014 Doraemon's Flashlight 几何
    woj1012 Thingk and Count DP好题
    woj1010 alternate sum 数学 woj1011 Finding Teamates 数学
  • 原文地址:https://www.cnblogs.com/xiezuodd/p/10235751.html
Copyright © 2011-2022 走看看