zoukankan      html  css  js  c++  java
  • Python 函数基础、有序集合、文件操作(三)

    一、set

    特点:

       set是一个无序且不重复的元素集合访问速度快;天生解决元素重复问题

    方法:

    初始化

    >>> s1 = set()
    >>> print(type(s1))
    <class 'set'>

    add()  增加元素

    >>> s1.add('tom')
    >>> print(s1)
    {'tom'}

    clear()  清空

    >>> s1.clear()
    >>> print(s1)
    set()

    差集

      循环老的序列,只要某一个元素在原序列,有就删除。对比自己没有的

    difference()  对比,显示不同的部分

    Return the difference of two or more sets as a new set.

    返回不同的部分生成新的集合。

    >>> s1  
    {1, 2, 3, 4, 'haha'}
    >>> s2 = s1.difference(['haha'])
    >>> s2
    {1, 2, 3, 4}

    difference_update()  对比,并将修改原集合,不生成新的集合

    >>> s1  
    {1, 2, 3, 4, 'haha'}

    >>> s3 = s1.difference_update(['haha'])
    >>> s1
    {1, 2, 3, 4}
    >>> s3
    >>>

    difference和differentce_update的区别:

      一个是生成新的set

      删除当前set中包含在new set里的元素

    dicard()  移除

    >>> s1.discard(1)
    >>> s1
    {2, 3, 4}

    intersection()  取交集,生成新set

    >>> s1
    {1, 2, 3, 4, 'tom', 'cow', 'cat'}
    >>> s3 = s1.intersection(['tom','cat'])
    >>> s3
    {'cat', 'tom'}

    intersetion_update()  取交集,修改原来set

    >>> s3 = s1.intersection_update(['tom','cat'])
    >>> s3     #说明没有生成新的set
    >>> s1
    {'cat', 'tom'}  #修改原set

    isdisjonint()  如果没有交集,返回True

    >>> s1
    {'tom', 1, 2, 3, 4, 'cat', 'pig'}
    >>> s3
    {'haha'}
    >>> s1.isdisjoint(s3)
    True

    issubset()  是否是子集

    >>> s1
    {'tom', 1, 2, 3, 4, 'cat', 'pig'}
    >>> s2
    {'tom', 3}
    >>> s2.issubset(s1)
    True

    s1.issuperset(s2)  是否是父集;s2是否是s1的子集,如果是则返回True,否则返回False

    >>> s1
    {'tom', 1, 2, 3, 4, 'cat', 'pig'}
    >>> s2
    {'tom', 3}
    >>> s1.issuperset(s2)
    True

    pop()  移除;移除的同时并获取这个值

    >>> s1
    {2, 3, 4, 'cat', 'pig'}
    >>> ret = s1.pop()
    >>> ret
    2
    {3, 4, 'cat', 'pig'}

    remove()  指定移除;没有返回值

    >>> s1.remove('pig')
    >>> s1
    {3, 4, 'cat'}

    对称差

      循环两次,对比前后set的不同。

    symmetric_difference()  差集,并获取新对象

    >>> s1
    {3, 4, 'cat'}
    >>> s2
    {'tom', 3}
    >>> s1.symmetric_difference(s2)
    {'tom', 'cat', 4}

    symmetric_difference_update()  差集,改变原来;对比两个集合,取不同部分返回给原来的集合

    >>> s1 = set('abcd')
    >>> s2 = set('bcdf')
    >>> s1.symmetric_difference_update(s2)
    >>> s1
    {'f', 'a'}
    >>> s2
    {'b', 'f', 'c', 'd'}

    union()  并集

    >>> s2 = set('bcdf')
    >>> s1 = set('abcd')
    >>> s1.union(s2)
    {'b', 'a', 'd', 'c', 'f'}

    update()  更新

    >>> s1.update([2])
    >>> s1
    {'b', 2, 'a', 'h', 'd', 'c'}

    二、collection系列

    1、计数器

    首先需要导入 collections模块 

    Counter()  统计

    import collections

    >>> st1 = collections.Counter('asdasdqwcadfqwqwfadf')
    >>> st1
    Counter({'a': 4, 'd': 4, 'f': 3, 'q': 3, 'w': 3, 's': 2, 'c': 1})

    most_common()   取出出现前X个

    >>> print(st1.most_common(4))
    [('a', 4), ('d', 4), ('f', 3), ('q', 3)]

    >>> for k in st1.elements():
    ...     print(k)
    ...
    c
    a
    a

    .......

    >>> for k,v in st1.items():
    ...     print(k,v)
    ...
    c 1
    a 4
    f 3
    q 3
    w 3
    s 2
    d 4

      elements,等于原生的值。传入的是什么就是什么;

      st1,就是处理过封装过的数据。

    update()  增加

    >>> st1 = collections.Counter('asdasdasdasdsadasqweqw')
    >>> st1
    Counter({'a': 6, 's': 6, 'd': 5, 'q': 2, 'w': 2, 'e': 1})
    >>> st1.update(['tom','a','asd'])
    >>> st1
    Counter({'a': 7, 's': 6, 'd': 5, 'q': 2, 'w': 2, 'tom': 1, 'asd': 1, 'e': 1})

    subtract()  删除

      如果存在就减1,不存在为-1

    >>> st1 = collections.Counter('aabbccddeef')
    >>> st1
    Counter({'b': 2, 'e': 2, 'c': 2, 'a': 2, 'd': 2, 'f': 1})
    >>> st1.subtract(['a','dd'])
    >>> st1
    Counter({'b': 2, 'e': 2, 'c': 2, 'd': 2, 'f': 1, 'a': 0, 'dd': -1})

    2、有序字典

    >>> dic = collections.OrderedDict()
    >>> dic = dict()
    >>> dic['k1'] = 'aa'
    >>> dic['k2'] = 'bb'
    >>> dic['k3'] = 'cc'
    >>> dic
    {'k2': 'bb', 'k1': 'aa', 'k3': 'cc'}

    move_to_end()  移动一个到最后面
    >>> dic = collections.OrderedDict()
    >>> dic['k1'] = 'aa'
    >>> dic['k2'] = 'bb'
    >>> dic['k3'] = 'cc'

    >>>dic.move_to_end('k1')

    OrderedDict([('k2', 'bb'), ('k3', 'cc'), ('k1', 'aa')])

    pop()  删除

    >>> dic.pop('k1')
    'aa'
    >>> dic
    OrderedDict([('k2', 'bb'), ('k3', 'cc')])

    update()  增加

    >>> dic.update({'k1':'1111','k100':'100'})
    >>> dic
    OrderedDict([('k2', 'bb'), ('k3', 'cc'), ('k1', '1111'), ('k100', '100')])

    3、默认字典

    >>> dic = collections.defaultdict(list)
    >>> dic['k1'].append('tom')
    >>> dic
    defaultdict(<class 'list'>, {'k1': ['tom']})

    from collections import defaultdicevalues = [11,22,33,44,55,66,77,88,99,]

    my_dict = defaultdict(list)

    my_dict = {}

    for value in values:

      if value > 66:

        my_dict['k1'].append(value)

      else:

        my_dict[''k2].append(value)

    4、可命名元组

    >>> MytupleClass = collections.namedtuple('MytupleClass',['x','y','z'])
    >>> st1 = MytupleClass(11,22,33)

    >>> print(st1.x)
    11

    >>> print(st1.y)

    22

    >>> print(st1.z)
    33

    5、队列

    >>> d = collections.deque()
    >>> d
    deque([])
    >>> d.append('1')
    >>> d
    deque(['1'])
    >>> d.appendleft('11')
    >>> d.appendleft('22')
    >>> d
    deque(['22', '11', '1'])

    count()  统计

    >>> d
    deque(['11', '22', '11', '1'])

    >>> d.count('11')
    2


    单向队列

      先进先出

    import queue

    q = queue.Queue()

    q.put('123')

    q.put('678'

    print(q.qsize())

    2

    print(q.get())

    >>> print(q.get())
    123
    >>> print(q.get())
    678
    >>> print(q.get())

    6、深浅拷贝

    copy.copy()

      只拷贝一层

    >>> s1 = 'aa'

    >>> s2 = s1
    >>> print(id(s1))
    4558601776
    >>> print(id(s2))
    4558601776

    >>> n1 = [1,2,'aa','bb',{'kk':'vv'}]
    >>> n1
    [1, 2, 'aa', 'bb', {'kk': 'vv'}]
    >>> n2 = n1
    >>> print(id(n1))
    4558122952
    >>> print(id(n2))
    4558122952

    copy.deepcopy()

      拷贝所有层
    a

    三、函数基础

      学习函数之前,为了实现某个特定功能,需要根据业务逻辑从上到下实现功能,套用无数个if...else或者while循环,需要相当长的代码来实现。并且在开发过程中会出现许多重复的代码,引入函数后就可以避免这一乱象。

    1、自定义函数

      Python的函数是通过赋值传递的,参数通过赋值传递给函数。def语句将创建一个函数对象并将其赋值给一个变量名,def语句的一般格式如下:

    def function_name(arg1,arg2[,...]):

      statement

    [return value]

      def:表示函数的关键字

      函数名:函数的名称,根据名称来调用函数

      函数体:函数中进行一系列的逻辑计算,封装的一些功能

      参数:为函数体提供数据

      返回值:当函数执行完毕后,可以给调用者返回数据。但返回值不是必须的,如果没有return语句,则默认返回值为None。

    示例:

    #有返回值
    def
    test():   st1 = 'tom'   st2 = 'cat'   return st1,st2 reg = test() print(reg) #输出结果 ('tom', 'cat')
    #无返回值
    def
    test(): st1 = 'tom' st2 = 'cat' reg = test() print(reg) #运行结果 None

    参数:

      普通参数

      默认参数

      动态参数

      Python函数的两种类型参数,一种是函数定义里的形参,一种是调用函数时传入的实参。

    在函数的内部,实参会被赋值给形参。

      作为实参传入到函数的变量名称和函数定义里形参的名字没有关系。函数里面只关心形参的值,而不去关心它在调用前叫什么名字。

    异常处理:

      try/except 捕获异常并处理

    try:  

      block
    except [exception,[data…]]:
       block

      执行try下的语句,如果引发异常,则执行过程会跳到第一个except语句;

      如果第一个except中定义的异常与引发的异常匹配,则执行该except中的语句;

      如果不匹配则执行下一个except。

    import smtplib
    from email.mime.text import MIMEText
    from email.utils import formataddr
    
    def mail(f_user,t_user):
        res = True
        try:
            msg = MIMEText('邮件内容','plain','utf-8')
            msg['From'] = formataddr(['wo',f_user])
            msg['To'] = formataddr(['Test',t_user])
            msg['Subject'] = '主题'
            server = smtplib.SMTP('smtp.163.com',25)
            server.login(f_user,'hahah@163.com')
            server.sendmail(f_user,[t_user,],msg.as_string())
            server.quit()
        except Exception:
            res = False
        return ret
    res = mail('xxxxx@163.com','xxxxx@163.com')
    if res == True:
        print("Success!")
    else:
        print("Try again!")

      代码执行解析:

      1、传两个值给mail()分别为发送者和接受者邮箱;

      2、执行mail(),指定res为True,如果执行后面发送邮件功能正常运行,那么就不再执行except;

         如果发送邮件失败,执行except,并将res = False;

      3、如果res 返回值为True,打印“Success!”,否则打印“Try again!”

     动态参数

      当函数的参数不确定时,可以使用*args和**kwargs。*args没有key值,**kwargs有key值

      示例:

    def show(*args):
        print(args,type(args))
    show('enenen')
    #运行结果
    ('enenen',) <class 'tuple'>

    # *args可以当作可容纳多个变量组成的list或tuple
    def show(**args):
        print(args,type(args))
    show(k1  = 22)
    #运行结果
    {'k1': 22} <class 'dict'>
    def show(*args,**kwargs):
        print(args,type(args))
        print(kwargs,type(kwargs))
    show(2,3,4,232,4343,n1=20,k1='tom')
    #运行结果
    (2, 3, 4, 232, 4343) <class 'tuple'>
    {'n1': 20, 'k1': 'tom'} <class 'dict'>

      写参数的时候,一个*放在前面,两个*放后面。

    def show(*args,**kwargs):
        print(args,type(args))
        print(kwargs,type(kwargs))
    l = [1,2,3,3434,343,]
    d = {'k1':100,'k2':20}
    show(*l,**d)
    #运行结果
    (1, 2, 3, 3434, 343) <class 'tuple'>
    {'k2': 20, 'k1': 100} <class 'dict'
    动态参数格式化
    s1 = '{0} is {1}' res = s1.format('tom','cat') print(res) #运行结果 tom is cat
    s1 = '{0} is {1}'
    l = ['tom','cat']
    res = s1.format(*l)
    print(res)
    #运行结果
    tom is cat
    s1 = '{name} is {age}'
    d1 = {'name':'tom','age':11}
    res = s1.format(**d1)
    print(res)
    #运行结果
    tom is 11

     四、文件操作

      详情见http://www.cnblogs.com/xiajie/p/5081122.html 补充部分:

    read():读取指定数目个字节到字符串中,负数将读取至文件末尾,默认是-1

    >>> file_obj = open('test.txt','r')
    >>> file_obj.read()
    'dfdff\n'
    >>> file_obj.seek(0)
    >>> file_obj.read(0)
    ''
    >>> file_obj.read(1)
    'd'
    >>> file_obj.read(2)
    'fd'
    >>> file_obj.read(-1)
    'ff\n'

    readline():读取文件的一行,包括行结束符,可以制定size参数的值,默认是-1

    >>> file_obj = open('test.txt','r')
    >>> file_obj.readline()
    'xxx\n'
    >>> file_obj.readline(2)
    'ha'
    >>> file_obj.readline(-1)
    'enene\n'

    readlines():读取所有剩余的行,然后作为一个字符串列表返回

        
    >>> file_obj.seek(0)
    >>> file_obj.readlines()
    ['xxx\n', 'haha\n', 'enene\n']

    文件的指针定位与查询

    (1)文件指针:

          文件被打开后,其对象保存在 f 中, 它会记住文件的当前位置,以便于执行读、写操作,这个位置称为文件的指针( 一个从文件头部开始计算的字节数 long 类型 )。

    (2)文件打开时的位置:

          以"r"   "r+"   "rb+" 读方式, "w"   "w+"   "wb+"写方式 打开的文件,

         一开始,文件指针均指向文件的头部。

    (3) 获取文件指针的值:

          L = f.tell()

    (4) 移动文件的指针

           f.seek(   偏移量, 选项 )

          选项 =0 时, 表示将文件指针指向从文件头部到 "偏移量"字节处。

          选项 =1 时, 表示将文件指针指向从文件的当前位置,向后移动 "偏移量"字节。

          选项 =2 时, 表示将文件指针指向从文件的尾部,,向前移动 "偏移量"字节。

      

    >>> file_obj.seek(0)
    >>> file_obj.tell()
    0
    >>> file_obj.seek(5)
    >>> file_obj.tell()
    5
     
    >>> file_obj.seek(5,1)
    >>> file_obj.tell()
    10
    >>> file_obj.seek(5,2)
    >>> file_obj.tell()
    57
    >>> file_obj.seek(5,0)
    >>> file_obj.tell()
    5
  • 相关阅读:
    EasyUI笔记(三)Window窗口
    EasyUI笔记(二)Layout布局
    从零构建Flink SQL计算平台
    从零构建Flink SQL计算平台
    Hystrix压测
    Java对象属性复制备忘
    Java垃圾回收手册翻译
    一次虚拟机升级和参数调整记录
    获取不同虚拟机参数的终极方法
    Dataset数据的XML持久化处理
  • 原文地址:https://www.cnblogs.com/xiajie/p/5137149.html
Copyright © 2011-2022 走看看