zoukankan      html  css  js  c++  java
  • 文本操作


    os的使用

    上下文管理器


    自定义一个上下文管理器

    class File():
    
        def __init__(self, filename, mode):
            self.filename = filename
            self.mode = mode
    
        def __enter__(self):
            print("entering")
            self.f = open(self.filename, self.mode)
            return self.f
    
        def __exit__(self, *args):
            print("will exit")
            self.f.close()
    

    装饰器下的上下文管理器

    from contextlib import contextmanager
    
    @contextmanager
    def my_open(path, mode):
        f = open(path, mode)
        yield f
        f.close()
    
    调用:
    with my_open('out.txt', 'w') as f:
        f.write("hello , the simplest context manager")
    

    编码问题

    背景

    计算机只能处理数字,因此处理文本必须转换成数字才行,最早的计算机在设计时采用8比特作为一个字节 8bit >> 1 bytes
    而计算机采用的是二进制,所以一个字节可以表示256种不同的状态。每一个状态对应一个符号,
    从 0000 0000 -1111 1111
    美国人发明了计算机,同时制定了编码,以对应英文字符和二进制的关系,这就是ASCII码,一共规定了128个字符的编码
    128个字符表示英文足够了,但是中文有超过十万个汉字,一个字节只能表示256种符号,所以,中国使用的是GB2312作为简体中文的常见编码形式,用两个字节表示一个汉字, 256*256=65536个符号,
    但是各个国家的编码是不一样的,为了能够各国跨语言,跨平台的进行文本转换处理,就有了Unicode
    Unicode被称为统一码,万国码
    通常是两个字节,
    ASC码转Unicode码就是在之前加0
    应为在ASC中英文字母只需要一个字节就足够了,但是Unicode是两个,这样存储很浪费,
    这样为了节省空间,开发了一些中间格式的字符集,这就是通用转换格式 Unicode transformation format( UTF) 常见的有utf-8。utf-16

  • 相关阅读:
    解决多个window.onload冲突问题
    asp.net中img底部出现空白解決辦法
    学习WF起步
    ASP.NET后台注册javascript脚本方法
    WCF、Net remoting、Web service概念及区别
    WCF问答 WCF 与Web Service的区别
    C++深度探索系列:智能指针(Smart Pointer) [一] (转)
    ofstream和ifstream(详细2)转
    全面掌握const、volatile和mutable关键字(转)
    #define用法 收藏
  • 原文地址:https://www.cnblogs.com/cizao/p/11481778.html
Copyright © 2011-2022 走看看