zoukankan      html  css  js  c++  java
  • day 17 小结

    1.包 == 模块, 包拿来导入用的

    2.包就是含有__init__.py 的文件夹; 导包就是导入__init__

    3.包一定是被当作模块文件导入,模块文件 m1.py/m2.py 的搜索路径以执行文件 包的介绍.py路径为准

    import aaa
    
    print(aaa.f1)
    print(aaa.f2)
    
    print(aaa.f3)
    
    from aaa.ma import f1  # 不符合包的原则
    f1()
    

    了解

    相对导入绝对导入:只能在包中内部使用

    包的作用: 当模块内部函数过多,为了方便管理模块,把一个模块划分成多个模块,但是又不能改变导入方式,把多个模块放入一个包(文件夹)内. 未来导包就是导init

    time模块

    time模块: 提供了三种不同类型的时间(时间戳),三种不同类型的时间可以相互转换

    import time
    
    print(time.time())  # 时间戳形式
    

    格式化时间

    print(time.starftime('%Y-%m-%d %x'))
    

    结构化时间

    print(time.localtime())
    

    结构化时间 --> 格式化时间

    struct_time = time.localtime(3600*24*365)
    

    格式化时间 --> 结构化时间

    format_time = time.strftime('%Y-%m-%d %x')
    print(time.strptime(format_time,'%Y-%m-%d %x'))
    

    结构化时间 -->时间戳

    struct_time = time.localtime(3600*24*365)
    print(time.mktime(struct_time))
    

    时间戳---> 结构化时间

    time_stamp = time.time()
    prinit(time.localtime(time_stamp))
    

    datetime模块

    # datetime模块:  时间的加减
    import datetime
    
    now = datetime.datetime.now()
    print(now)
    
    # 默认3天
    print(now + datetime.timedelta(3))
    # 加3周
    print(now + datetime.timedelta(weeks=3))
    # 加3小时
    print(now - datetime.timedelta(hours=3))
    print(now + datetime.timedelta(hours=-3))
    
    print(now.replace(year=1949,month=10,day=1,hour=10,minute=1,second=0,microsecond=0))
    

    random模块

    # 随机数
    import randon
    
    # 掌握
    # 0-1
    print(random.random())
    
    # [1-3]
    print(random,randint(1,3))
    
    # 打乱
    lt = [1,2,3]
    random.shffle(lt)
    print(lt)
    
    # 随机选择一个
    print(random.choice(lt))
    
    # 只随机一次  -->梅森旋转算法
    random.seed(time.time())
    random.seed(11111111111)
    print(random.random())
    
    # 了解
    print(random.sample([1,'a','v','c',3,5],2)
    

    hashlib模块和hmac模块

    # hashlib模块:对字符加密
    
    # hmac模块:  对字符加密,并且加上密钥
    
    import hashlib
    # 迭加性
    m hashlib.md5()
    # m.update(b'hello')  # 981fe96ed23ad8b9554cfeea38cd334a
    m.update(b'hash123456')
     print(m.hexdigest())  # 对于不同的字符而言,用不重复
     # 981fe96ed23ad8b9554cfeea38cd334a
    
    # 手机号/生日/性别/qq账号/以前的密码/   --》 挖矿(算法)
    # 1 2 3 5 71113 111111111111111 - 1111111111111111111111 111111111111111111111111111111111111111111111111111
    
    hash_pwd = '0562b36c3c5a3925dbe3c4d32a4f2ba2'
    pwd_list = [
        'hash3714',
        'hash1313',
        'hash94139413',
        'hash123456',
        '123456hash',
        'h123ash',
    ]
    for pwd in pwd_list:
        m = hashlib.md5()
        m.update(pwd.encode('utf8'))
        res = m.hexdigest()
        if res == hash_pwd:
            print(f'获取密码成功:{pwd}')
    # 《动物庄园》 《1984》 《美丽新世界》: 如果不想被别人忽悠的话,看这三本书
    
    
    # hmac 密钥(加盐)
    
    import hmac
    
    m = hmac.new(b'maerzi')
    m.update(b'hash123456')  # f82317e44545b0ab087109454814b5c4
    print(m.hexdigest())
    
    m = hmac.new(b'sdfjhjk2394879ul%$$Y#($&')
    m.update(b'hash123456')  # 2a70fd0f13cb49357f40d326a4e071a2
    print(m.hexdigest())
    
    pwd_list = [
        'hash3714',
        'hash1313',
        'hash94139413',
        'hash123456',
        '123456hash',
        'h123ash',
    ]
    

    typing模块

    typing模块:与函数联用,控制函数参数的数据类型,提供了基础数据类型之外的数据类型
     
    print(type(lt) is list)
    
    from typing import Iterable, Iterator, Generator
    
    
    # print(lt == Iterable) # False
    
    def func(x: int, lt: Iterable) -> list:
        return [1, 2, 3]
    
    
    func(10, '123123')
    
    

    requests模块

    # requests: 爬虫--> 爬数据,模拟浏览器对url发送请求,拿到数据
    
    # url -->一个特定的网址  ->  永不重复
    import requests
    
    response = requests.get('https://ishuo.cn')
    data = response.text
    # print(data)
    
    
    # 正则re:从大的字符串中挑选出 具有某种形状特点的字符串
    
    import re
    
    # .*?表示所有类型的都要
    content_list = []
    content_res = re.findall('<div class="content">(.*?)</div>', data)
    for i in content_res:  # type:str
        if i.startswith('<ul>'):
            continue
        content_list.append(i)
    
    # print(content_list)
    
    
    title_list = re.findall('</span><a href="/subject/.*?">(.*?)</a>', data)
    
    # print(title_list)
    
    # title_content_dict = {}
    # for i in range(len(content_list)):
    #     title_content_dict[title_list[i]] = content_list[i]
    
    title_content_dict = {k: v for k, v in zip(title_list, content_list)}
    
    with open('duanzi.txt', 'w', encoding='utf8') as fw:
        for k, v in title_content_dict.items():
            fw.write(f'{k}:
    {v}
    
    ')
    
    
    
    
    import re
    import requests
    response = requests.get('https://ishuo.cn')
    data = response.text
    res = re.findall('<div class="content">(.*?)</div>|</span><a href="/subject/.*?">(.*?)</a>', data)
    with open('duanzi_new.txt', 'w', encoding='utf8') as fw:
        for i in res:  # type:str
            print(i)
            if i[1]:
                fw.write(i[1] + ':' + '
    
    ')
            if i[0]:
                if i[0].startswith('<ul>'):
                    continue
                fw.write(i[0] + '
    ')
    

    re模块

    re模块: 去字符找 符合某种特点的字符串

    import re
    
    s = '去字符串找符合某种特点的字符串'
    
    res = re.findall('',s)
    print(res)
    
    # 元字符
    
    s = 'acdabc'
    
    # ^ : 以...开头
    res = re.findall('^ab',s)
    print(res)
    res = re.findall('^bc',s)
    print(res)
    # $ : 以..结尾
    s = 'ab红abc'
    res = re.findall('abc',s)
    print(res)
    
    # d: 数字
    s = 'skld2352ljk'
    res = re.findall('d', s)
    print(res)
    
    # w: 非空,数字字符下划线
    s = 'skld_23  432jk'
    res = re.findall('w', s)
    print(res)
    
    # s:空,空格/	/
    
    s = 'skld_23 421jk'
    res = re.findall('s', s)
    print(res)
    
    # D: 非数字
    s = 'skld2342ljk'
    res = re.findall('D', s)
    print(res)
    
    # W: 空
    s = 'skld_23 42ljk'
    res = re.findall('W', s)
    print(res)
    
    # S:非空
    s = 'skld_23 42ljk'
    res = re.findall('S', s)
    print(res)
    
    # +:前面的一个字符至少1个
    s = 'abcdddddd abcd abc'
    print(re.findall('abcd+',s)
         
    # ?:前面的一个字符0-1个
    s = 'abcdddd abcd abc'
    print(re.findall('abcd?',s))
          
    # *:前面的一个字符至少0个
    s = 'abcdddddddddddddddddd abcd abc'
    print(re.findall('abcd*', s))
    
    # []: 中括号内的都可以
    s = 'abc bbc cbc dbc'
    print(re.findall('[abc]bc', s))
    
    # [^]: 中括号的都不可以
    s = 'abc bbc cbc dbc'
    print(re.findall('[^abc]bc', s))
    
    # |:或
    s = 'abc bbc dbc'
    print(re.findall('abc|bbc', s))
    
    # {2}:前面的字符2个
    
    s = 'abccabc abccc'
    print(re.findall('abc{2}', s))
    
    # {1,2}:前面的字符2个
    
    s = 'abccabc abccc'
    print(re.findall('abc{1,2}', s))
    

    贪婪模式

    # . (任意字符) * (0-无穷个)
    
    s= 'abcdefgbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbg'
    print(re.findall('a.*g',s))
    

    非贪婪模式

    # . (任意字符) * (0-无穷个) ? (让他进入非贪婪模式)
    s = 'abcdefgbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbg'
    print(re.findall('a.*?g',s))
    

    bug

    # . (任意字符) * (0-无穷个) ? (让他进入非贪婪模式)
    s = 'abcdefg'
    print(re.findall('.*?',s))
    

    了解:特殊构造

    # a(?=d)  :a后面是数字,但不要数字,不消耗字符串内容
    s = 'a123 aaa a234 abc'
    
    print(re.findall('a(?=d)',s))
    print(re.findall('a(?=w)',s))
    
    # 匹配邮箱:
    s = '#@#@#@nickchen121@163.com$$$$////nick@qq.com$$#$#$[]]2287273393@162.com@$2423423lksdlfj#'
    # w(字母/数字/下划线)+(0-无穷个)@ w(字母/数字/下划线)+(0-无穷个).com
    print(re.findall('w+@+.com',s))
    
    # 函数
    
    # compile
    s = 'abcd abcddd abc'
    # res = re.compile('abcd*')
    email_pattern = re.compile('w+@w+.com')
    phone_patter = re.compile('d{13}')
    print(re.findall(email_pattern, s))
    
    print(re.findall('abcd*', s))
    
    ## match:  从开头找一个,找得到就不找了 ;找不到报错 --》
    s = 'ab abcddd abc'
    res = re.match('abcd*', s)
    print(res.group())
    
    ## search: 从字符串找一个,就不找了
    s = 'ab abcddd abc'
    res = re.search('abcd*', s)
    print(res.group())
    
    ## split
    s = 'ab23423abcddd234234abcasdfjlasjdk234l23lk4j2kl34kl25k3j2kl3j5lkj'
    print(re.split('d+', s))
    
    ## sub == replace
    s = 'ab23423abcddd234234abcasdfjlasjdk234l23lk4j2kl34kl25k3j2kl3j5lkj'
    print(re.sub('d+', ' ', s))
    
    ## subn --> 替换了多少次
    s = 'ab23423abcddd234234abcasdfjlasjdk234l23lk4j2kl34kl25k3j2kl3j5lkj'
    print(re.subn('d+', ' ', s))
    
    # 补充(非常有用)
    
    ## 修饰符 --> re.S会让.匹配换行符(*****)
    s = '''abc
    abcabc*abc
    '''
    
    # .不匹配换行
    print(re.findall('abc.abc', s))  # ['abc*abc']
    print(re.findall('abc.abc', s, re.S))  # ['abc
    abc', 'abc*abc']
    
    ## 分组 --> 只要括号里的(*****)
    s = 'abc abcd abcdd'
    print(re.findall('a(.)c(d)', s))
    
    ## 有名分组(了解)
    s = 'abc abcd abcdd'
    print(re.search('a(?P<name>.)c(?P<name2>d)', s).groupdict())
    
    # 超高级用法
    s = 'abc123abc123'  # c123a
    print(re.sub('c(d+)a', ' ', s))
    print(re.sub('c(?P<name1>d+)a', ' g<name1> ', s))  # g<name1>这个东西不能替换掉
    
    

    以下必须得记住

    .*?(接收所有类型)

    贪婪和非贪婪

    findall

    re.S

    match和sarch的区别

    分组

    有名分组:给分组加名字

    哪些做了解

    杂七杂八的元字符

    特殊构造元字符

    特殊修饰符

  • 相关阅读:
    virtualbox centos安装增强工具和问题详解
    Failed to load SELinux policy. Freezing
    .net mvc项目本地调试:浏览器一直转圈无法访问
    System.Security.Cryptography.CryptographicException: 出现了内部错误
    【SymmetricDS】实现新的数据库方言
    【SymmetricDS】SymmetricDS是如何工作的
    【Java】java.util.Objects 源码学习
    【Spring-web】AsyncRestTemplate源码学习
    【Spring-web】RestTemplate源码学习——梳理内部实现过程
    【Spring-web】RestTemplate源码学习
  • 原文地址:https://www.cnblogs.com/LZF-190903/p/11604542.html
Copyright © 2011-2022 走看看