zoukankan      html  css  js  c++  java
  • Python学习笔记Day05

    1.模块的导入

    import module1,module2
    from module1 import *   # 导入所有,易冲突
    from module1 import m1,m2,m3
    from module1 import logger as logger_long   # 重命名
    

    2.import模块的本质就是把模块.py解释一遍

    import包的本质是运行其下的__init__.py文件
    不能直接调用包下的模块,需要在init中from . import module1(相对导入)
    例:

    import package1
    package1.module1  # 无法调用
    

    importlib模块

    import importlib
    
    aa = importlib.import_module("lib.aa")
    print(aa.name)
    

    3.time,datetime模块,random模块

    time模块-时间的表示

    import time
    
    print(time.time())  # 获得当前时间戳*********s,以1974年开始计算
    
    # 不加参数默认当前时间
    print(time.localtime())  # 时间tuple,年,月,日...
    # time.struct_time(tm_year=2018, tm_mon=9, tm_mday=23, tm_hour=16, tm_min=34, tm_sec=57,
    # tm_wday=6, tm_yday=266, tm_isdst=0)   一周中的第几天,一年中的第几天,是否夏令时DST(0否)
    # 24个时区,UTC+8
    print(time.timezone)    # 时区,以s为单位
    
    t = time.localtime()
    # time.sleep(5)
    
    print(time.gmtime())    # 时间戳转换成时间tuple(UTC0),默认当前时间
    print(time.localtime())    # 时间戳转换成时间tuple(本地),默认本地当前时间
    
    print(time.mktime(t))    # 时间tuple(本地)转换成时间戳,必须填入tuple
    
    print(time.strftime("%Y-%m-%d %H:%M:%S", t))  # 将时间tuple转化成格式化字符串 2018-09-23 17:05:32
    print(time.strptime("2018-09-23 17:05:32", "%Y-%m-%d %H:%M:%S"))  # 将格式化字符串转换成时间tuple
    
    print(time.asctime())     # 时间tuple(本地)转换成格式化字符串,默认当前时间
    print(time.ctime())     # 时间戳(本地)转换成格式化字符串,默认当前时间
    
    # print(help(time.strftime))
    '''
        %Y  Year with century as a decimal number.
        %m  Month as a decimal number [01,12].
        %d  Day of the month as a decimal number [01,31].
        %H  Hour (24-hour clock) as a decimal number [00,23].
        %M  Minute as a decimal number [00,59].
        %S  Second as a decimal number [00,61].
        %z  Time zone offset from UTC.
        %a  Locale's abbreviated weekday name.
        %A  Locale's full weekday name.
        %b  Locale's abbreviated month name.
        %B  Locale's full month name.
        %c  Locale's appropriate date and time representation.
        %I  Hour (12-hour clock) as a decimal number [01,12].
        %p  Locale's equivalent of either AM or PM.
    '''
    

    datatime时间加减

    import datetime
    
    print(datetime.datetime.now())  # 当前时间  2018-09-23 17:43:05.334686
    
    print(datetime.datetime.now() + datetime.timedelta(3))  # 3天后的时间
    print(datetime.datetime.now() + datetime.timedelta(hours=3))  # 3h后的时间
    
    c_time = datetime.datetime.now()
    print(c_time.replace(minute=3, hour=2))  # 时间替换
    
    # 1.把datetime转成字符串
    def datetime_toString(dt):
        print("1.把datetime转成字符串: ", dt.strftime(dt,"%Y-%m-%d %H:%M:%S"))
    
    # 2.把字符串转成datetime
    def string_toDatetime():
        print("2.把字符串转成datetime: ", datetime.datetime.strptime("2018-09-23 17:43:05", "%Y-%m-%d %H:%M:%S"))
    

    random模块

    import random
    
    print(random.random())  # 0.6445010863311293  # 生成一个0到1的随机符点数: 0 <= n < 1.0
    print(random.uniform(1, 10))  # 9.887001463194844
    print(random.randint(1, 7))  # 生成随机整数n: a <= n <= b
    print(random.randrange(1, 100, 2))  # 从指定范围内,按指定基数递增的集合中 获取一个随机数。如:random.randrange(10, 100, 2),
    print(random.choice('liukuni'))  # random.choice从序列中获取一个随机元素。
    # 下面是使用choice的一些例子:
    print(random.choice("学习Python"))  # 学
    print(random.choice(["JGood", "is", "a", "handsome", "boy"]))  # List
    print(random.sample([1, 2, 3, 4, 5], 3))  # [1, 2, 5]   # 从指定序列中随机获取指定长度的片断。
    print(random.sample('abcdefghij', 3))  # ['f', 'h', 'd']
    items = [1, 2, 3, 4, 5, 6, 7]
    random.shuffle(items)  # 打乱
    print(items)
    
    # 生成随机验证码
    import random
    
    checkcode = ''
    for i in range(4):  # 四位验证码
        current = random.randrange(0, 4)
        if current != i:  # 随机字母
            temp = chr(random.randint(65, 90))  # 字母65~69,chr将整数转换成对应的ASCII字符
        else:  # 随机数字
            temp = random.randint(0, 9)
        checkcode += str(temp)
    print(checkcode)
    

    4. os模块,shutil模块 文件处理模块

    os模块

    import os
    
    print(os.getcwd())
    # os.chdir(r"C:DATACode")
    
    print(os.getcwd())
    # os.curdir
    print(os.getcwd())
    path = os.curdir
    print(path + 'day5')
    
    # 操作
    # os.chdir(r"C:DATACode")    #切换目录
    # print(os.getcwd())    #获取当前目录
    # print(os.curdir)    #返回当前目录
    # print(os.pardir)    #返回父目录
    # # os.makedirs(r'C:DATACodestudyday5	est')   #生成多级递归目录,上级目录不存在则创建
    # # os.removedirs(r'C:DATACodestudyday5	est')  #逐层清理空文件夹
    # os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname,上级目录不存在报错
    # os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
    
    # 获取信息
    # os.listdir('dirname')    列出所有文件和子目录,包括隐藏文件,并以列表方式打印
    # os.stat('path/filename')  获取文件/目录信息
    # os.sep    输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"
    # os.linesep    输出当前平台使用的行终止符,win下为"	
    ",Linux下为"
    "
    # os.pathsep    输出用于分割文件路径的字符串
    # os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
    # os.system("bash command")  运行shell命令,直接显示
    # os.environ  获取系统环境变量
    # os.remove()  删除一个文件
    # os.rename("oldname","newname")  重命名文件/目录
    
    # os.system('ipconfig /all')  #系统命令符
    
    # os.path.basename(__file__) #文件名
    # os.path.dirname(__file__) #目录名
    # os.path.abspath(path)  返回path规范化的绝对路径
    # os.path.split(path)  将path分割成目录和文件名二元组返回
    # os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
    # os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
    # os.path.exists(r'C:DATACodestudyday5	est') #是否存在       isfile  isdir
    # os.path.isabs(r'C:DATACodestudyday5	est') #是否绝对路径
    # os.path.join(r'C:',r'DATACodestudyday5	est') #连接   第一个绝对路径前的值将被忽略
    # os.path.getatime(r'C:DATACodestudyday5	est.txt') #最后存储时间
    # os.path.getmtime(r'C:DATACodestudyday5	est.txt') #最后修改时间
    

    shutil模块 文件处理模块,比os好

    # 内置模块shutil
    # http://www.cnblogs.com/wupeiqi/articles/4963027.html
    import shutil
    
    # f1 = open('test', 'r')
    # f2 = open('test2.txt', 'a')
    # shutil.copyfileobj(f1, f2)
    shutil.copyfile('test2.txt', 'test3.txt')  # 与上述代码作用一样
    shutil.make_archive('C:DATACodestudyday5', 'zip')
    # shutil.copystat("本节笔记","笔记3")  #拷贝状态的信息,包括:mode bits, atime, mtime, flags
    
    # shutil.copytree("test4","new_test4")   # 递归的去拷贝文件,拷贝子目录及文件
    # shutil.rmtree("new_test4") # 递归的去删除文件,删除子目录及文件
    # shutil.move(src, dst) #递归的去移动文件
    
    # shutil.make_archive("shutil_archive_test", "zip","E:PyProjectsday1")    #创建压缩包并返回文件路径
    
    import zipfile
    
    z = zipfile.ZipFile("day5.zip", "w")  # 打开
    
    z.write("p_test.py")  # 将文件压缩近z
    print("-----")  # 干点别的事
    z.write("笔记2")  # 继续压缩
    
    z.close()
    

    5.shelve 数据序列化/持久化,类似pickle

    # 序列化
    # shelve模块是一个简单的key,value将内存数据通过文件持久化的模块,可以持久化任何pickle可支持的python数据格式
    import shelve
    import datetime
    
    d = shelve.open('shelve_test')  # 打开一个文件
    
    # 数据存储,将产生三个文件dat,bak,dir
    # class Test(object):
    #     def __init__(self,n):
    #         self.n = n
    # t = Test(1213)
    # info = {'age':22,"job":'it'}
    # name = ["alex", "rain", "test"]
    #
    # d["name"] = name  # 持久化列表
    # d["info"] = info  # 持久dict
    # d['t1'] = t     # 持久化类的实例
    # d['date'] = datetime.datetime.now()
    
    
    # 数据读取
    print(d.get("name"))
    print(d.get("info"))
    print(d.get("date"))
    # print(d.get('t1'))
    
    d.close()
    

    6.xml, json数据序列化传输

    xml模块

    xml是实现不同语言或程序之间进行数据交换的协议,
    跟json差不多,但json使用起来更简单,
    不过,古时候,在json还没诞生的黑暗年代,大家只能选择用xml呀,
    至今很多传统公司如金融行业的很多系统的接口还主要是xml。

    import xml.etree.ElementTree as ET
    
    tree = ET.parse("xmltest.xml")
    root = tree.getroot()
    print(root.tag)
    
    # 遍历xml文档
    # for child in root:
    #     print(child.tag, child.attrib)
    #     for i in child:
    #         print(i.tag, i.text,i.attrib)
    
    # 只遍历year 节点
    for node in root.iter('year'):
        print(node.tag, node.text)
    
    #xml文件创建
    new_xml = ET.Element("personinfolist")
    personinfo = ET.SubElement(new_xml, "personinfo", attrib={"enrolled": "yes"})
    name = ET.SubElement(personinfo, "name")
    name.text = "Alex Li"
    age = ET.SubElement(personinfo, "age", attrib={"checked": "no"})
    sex = ET.SubElement(personinfo, "sex")
    age.text = '56'
    personinfo2 = ET.SubElement(new_xml, "personinfo", attrib={"enrolled": "no"})
    name = ET.SubElement(personinfo2, "name")
    name.text = "Oldboy Ran"
    age = ET.SubElement(personinfo2, "age")
    age.text = '19'
    
    et = ET.ElementTree(new_xml)  # 生成文档对象
    et.write("test.xml", encoding="utf-8", xml_declaration=True)
    
    ET.dump(new_xml)  # 打印生成的格式
    
    
    # 修改xml数据
    tree = ET.parse("xmltest.xml")
    root = tree.getroot()
    
    # 修改
    # for node in root.iter('year'):
    #     new_year = int(node.text) + 1
    #     node.text = str(new_year)
    #     node.set("updated_by", "Alex")
    #
    # tree.write("xmltest.xml")
    
    # 删除node
    for country in root.findall('country'):
        rank = int(country.find('rank').text)
        if rank > 50:
            root.remove(country)
    
    tree.write('output.xml')
    

    json模块 - 数据序列化

    import json
    
    # 只能处理简单的数据
    ret = 'sdas'
    json.dumps()  # 存
    json.dumps(ret, ensure_ascii=False, indent=4)  # 为方便查看,不转换成ascii码,且使用4空格缩进
    json.loads()  # 取
    
    json.dump()  # 能直接处理类文件对象(具有read()或者write()方法的对象),
    # 比如with open(...) as f的f,不需要将f.read(),就能dump
    json.load()
    
    import pickle
    
    # 处理复杂数据
    pickle.dumps()  # 保存的是二进制
    

    7.configparser模块 - 配置文件处理

    # 用于生成和修改常见配置文档
    import configparser
    
    # 创建配置文件
    config = configparser.ConfigParser()
    
    config["DEFAULT"] = {'ServerAliveInterval': '45',
                         'Compression': 'yes',
                         'CompressionLevel': '9'}
    
    config['bitbucket.org'] = {}
    config['bitbucket.org']['User'] = 'hg'
    
    config['topsecret.server.com'] = {}
    topsecret = config['topsecret.server.com']
    config['topsecret.server.com']['Host Port'] = '50022'  # mutates the parser
    topsecret['ForwardX11'] = 'no'  # same here
    config['DEFAULT']['ForwardX11'] = 'yes'
    with open('example.ini', 'w') as configfile:
        config.write(configfile)
    
    
    # 读
    conf = configparser.ConfigParser()
    conf.read("example.ini")
    
    print(conf.defaults())
    print(conf['bitbucket.org']['user'])
    #print(conf.sections())
    sec = conf.remove_section('bitbucket.org')
    conf.write(open('example.ini', "w"))
    

    8.正则表达式 Re

    import re
    
    s = '1-2*(-1388337.0476190478-'
    a = re.search(r"-[^+-]*$", s)  # 匹配
    if not a:
        print('a', a)
    
    re.match('', s)  # (从头找一个)re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
    re.search('', s)  # (找一个)re.search 扫描整个字符串并返回第一个成功的匹配。
    re.findall('', s)  # ***(找所有,返回列表)
    re.sub('', '', s)  # (替换,前者替换后者)
    pattern = re.compile('')  # (编译正则字符串,提高效率)
    pattern.search(s)  # 此处pattern具有与re一致的函数,但参数需要放进compile内
    
    r"a/nb"  # 原始字符串r,=="a//nb", 加r表示自动转义,不需加\,
    # 但用在re中可以匹配"a/nb",不能匹配"a//nb",建议使用,能忽略目标对象转义的影响
    # ‘
    ’长度为1,r’
    ’长度为2
    
    re.findall(r"a.*bc", "a
    bc", re.DOTALL)    # -> a
    bc
    re.findall(r"a(.*)bc", "a
    bc", re.DOTALL)  # -> 
    
    # 不分组时匹配的是全部,分组后匹配的是组内的内容
    

    我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式:

    line = "Cats are smarter than dogs"
    # .* 表示任意匹配除换行符(
    、
    )之外的任何单个或多个字符
    matchObj = re.match( r'(.*) are (.*?) .*', line, re.M|re.I)
    
    if matchObj:
       print ("matchObj.group() : ", matchObj.group()) # Cats are smarter than dogs
       print ("matchObj.group(1) : ", matchObj.group(1)) # Cats
       print ("matchObj.group(2) : ", matchObj.group(2)) # smarter
    else:
       print ("No match!!")
    

    匹配规则:

    '''
    ^   匹配字符串的开头
    $   匹配字符串的末尾。
    .   匹配任意字符,除了/n换行符,(贪婪),加re.DOTALL或re.S参数则可以匹配包括换行符的任意字符。
            re.sub的第4个参数不是flags ,而是counts。re.DOTALL的值是16 因此re.sub(.., re.DOTALL)将只替换16次。  
            将flags指定为关键字参数将解决您的问题:  
            re.sub(r'<fig(.*?)</fig>', ' ', xml, flags=re.DOTALL)
    *   匹配0个或多个表达式。(贪婪)
    +   匹配1个或多个表达式。(贪婪)
    ?   匹配0个或1个表达式。加在其他限定符后面表示非贪婪方式
    *?, +?, ??  *+?的非贪婪模式,匹配尽可能少的字符
       对任一特定字符进行转义
    
    w  匹配字母数字及下划线
    W  匹配非字母数字及下划线
    s  匹配任意空白字符,等价于 [	
    
    f].
    S  匹配任意非空字符
    d  匹配任意数字,等价于 [0-9].
    D  匹配任意非数字
    A  匹配字符串开始处
      匹配字符串结束处,如果是存在换行,只匹配到换行前的结束字符串。
    z  匹配字符串结束处
    G  匹配最后匹配完成的位置。
      匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
    B  匹配非单词边界。'erB' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
    
    , 	, 等.  匹配一个换行符。匹配一个制表符。等
    1...9 匹配第n个分组的内容。
    10 匹配第n个分组的内容,如果它经匹配。否则指的是八进制字符码的表达式。
    
    [...]   表示或 用来表示一组字符,单独列出:[amk] 匹配 'a','m'或'k'
    [^...]  不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
    a|b 匹配a或b
    
    {n} 精确匹配 n 个前面表达式。例如, o{2} 不能匹配 "Bob" 中的 "o",但是能匹配 "food" 中的两个 o。
    {n,}    匹配 n 个前面表达式。例如, o{2,} 不能匹配"Bob"中的"o",但能匹配 "foooood"中的所有 o。"o{1,}" 等价于 "o+"。"o{0,}" 则等价于 "o*"。
    {n, m}  匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
    
    (...)   匹配括号内的表达式,也表示一个组,分组的内容在完成匹配后可以提取出来,而且可以在后面1引用,称为回溯引用
    (?imx)  正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中的区域。re.I(忽略大小写),re.L(依赖区域设置),re.M(多行),re.S(点号匹配所有字符),re.U(依赖Unicode),re.X(详细模式)
    (?-imx) 正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
    (?: ...)    类似 (...), 但是不表示一个组
    (?imx: ...) 在括号中使用i, m, 或 x 可选标志
    (?-imx: ...)    在括号中不使用i, m, 或 x 可选标志
    (?#...) 注释.
    (?=...) 前向肯定界定符(lookahead assertion)。
        当前面的匹配条件后跟 ... 时才匹配,但不引用 ... 的内容。
    (?!...) 前向否定界定符(negative lookahead assertion)。
        当前面的匹配条件后不跟 ... 时才匹配,但不引用 ... 的内容。
    (?<=...) 后向肯定界定符(positive lookbehind assertion)。
        当后面的匹配条件前面有...时才匹配,但不引用...的内容。...只能匹配固定长度的字符串,不定长度的不能使用.
    (?<!...) 后向否定界定符(negative lookbehind assertion)。
        当后面的匹配条件前面没有...时才匹配,但不引用...的内容。
    (?(id/name)yes-pattern|no-pattern) ,
        当组id或name对应的组()匹配成功后,匹配yes-pattern的内容,否则匹配no-pattern的内容
    '''
    

    9.map模块

    http://blog.51cto.com/egon09/1840425

    10.hashlib模块 - 数据加密

    import hashlib
    
    # m = hashlib.md5()
    # m.update(b"Hello")
    # print(m.hexdigest())  #16进制md5值
    # m.update(b"It's been a long time since we spoken...")
    
    m2 = hashlib.md5()
    m2.update("HelloIt's me天王盖地虎".encode(encoding="utf-8"))
    print(m2.hexdigest())
    #
    # s2  = hashlib.sha1()
    # s2.update(b"HelloIt's me")
    # print(s2.hexdigest())
    
    #hmac,它内部对我们创建 key和内容 再进行处理然后再加密
    # 散列消息鉴别码,简称HMAC,是一种基于消息鉴别码MAC(Message Authentication Code)的鉴别机制。
    # 使用HMAC时,消息通讯的双方,通过验证消息中加入的鉴别密钥K来鉴别消息的真伪;
    # 一般用于网络通信中消息加密,前提是双方先要约定好key,就像接头暗号一样,
    # 然后消息发送把用key把消息加密,接收方用key + 消息明文再加密,
    # 拿加密后的值 跟 发送者的相对比是否相等,这样就能验证消息的真实性,及发送者的合法性了。
    import hmac
    
    h = hmac.new(b"12345","you are 250你是".encode(encoding="utf-8"))
    print(h.digest())
    print(h.hexdigest())
    

    11. 异常处理try,except

    class My_exception(Exception):
        def __init__(self,msg):
            self.messge = msg
    
        def __str__(self):
            return self.messge
    
    try:
        ll = [1,2,3,4]
        # a =ll[4]
        # raise Exception('主动触发异常')
        # raise My_exception('自定义异常')
    except (IndexError,KeyError) as e:  # 抓特定异常
        print(e)
    except My_exception as e:   # 抓自定义异常
        print(e)
    except Exception as e:  # 抓住所有异常,建议用在最后
        print(e)
    
    else:      # 没出异常
        print('一切正常')
    
    finally:    # 不管是否异常都会执行
        print('一定会走')
    

    12.assert

    a = 0
    assert a == 1  # 断言,简化if判断,不正确则抛异常
    
    print('重要代码')
  • 相关阅读:
    回到顶部
    侧边横幅特效
    中部导航吸顶
    scroll
    层次化索引MultiIndex
    pandas处理缺失值df.dropna( )的thresh参数
    pd.Index(ser2).get_indexer(ser1),返回ser1中各元素在ser2中的索引位置
    FutureWarning
    数据框索引行
    对字典dict使用最大值函数max
  • 原文地址:https://www.cnblogs.com/JeromeLong/p/13236014.html
Copyright © 2011-2022 走看看