zoukankan      html  css  js  c++  java
  • Python中sort与sorted函数

    python中列表的内置函数sort()可以对列表中的元素进行排序,而全局性的sorted()函数则对所有可迭代的序列都是适用的;

    并且sort()函数是内置函数,会改变当前对象,而sorted()函数只会返回一个排序后的当前对象的副本,而不会改变当前对象。

    sort

    原型:sort(fun,key,reverse=False)

    参数fun是表明此sort函数是基于何种算法进行排序的,一般默认情况下python中用的是归并排序,并且一般情况下我们是不会重写此参数的,所以基本可以忽略;

    参数key用来指定一个函数,此函数在每次元素比较时被调用,此函数代表排序的规则,也就是你按照什么规则对你的序列进行排序;

    参数reverse是用来表明是否逆序,默认的False情况下是按照升序的规则进行排序的,当reverse=True时,便会按照降序进行排序。

     1 #coding:utf-8  
     2 from operator import attrgetter,itemgetter  
     3   
     4 list1 = [(2,'huan',23),(12,'the',14),(23,'liu',90)]  
     5   
     6 #使用默认参数进行排序,即按照元组中第一个元素进行排序  
     7 list1.sort()  
     8 print list1  
     9 #输出结果为[(2, 'huan', 23), (12, 'the', 14), (23, 'liu', 90)]  
    10   
    11 #使用匿名表达式重写key所代表的函数,按照元组的第二个元素进行排序  
    12 list1.sort(key=lambda x:(x[1]))  
    13 print list1  
    14 #[(2, 'huan', 23), (23, 'liu', 90), (12, 'the', 14)]  
    15   
    16 #使用匿名表达式重写key所代表的函数,按照元组的第三个元素进行排序  
    17 list1.sort(key=lambda x:(x[2]))  
    18 print list1  
    19 #[(12, 'the', 14), (2, 'huan', 23), (23, 'liu', 90)]  
    20   
    21 #使用匿名函数重写key所代表的函数,先按照元组中下标为2的进行排序,  
    22 # 对于下标2处元素相同的,则按下标为0处的元素进行排序  
    23 list1.sort(key=lambda x:(x[2],x[0]))  
    24 print list1  
    25 #[(12, 'the', 14), (2, 'huan', 23), (23, 'liu', 90)]  
    26   
    27 #使用operator模块中的itemgetter函数进行重写key所代表的函数,按照下标为1处的元素进行排序  
    28 list1.sort(key=itemgetter(1))  
    29 print list1  
    30 #[(2, 'huan', 23), (23, 'liu', 90), (12, 'the', 14)]  
    31   
    32 #使用operator模块中的itemgetter函数进行重写key所代表的函数,按照下标为2处的元素进行排序  
    33 list1.sort(key=itemgetter(2))  
    34 print list1  
    35 # [(12, 'the', 14), (2, 'huan', 23), (23, 'liu', 90)]  
    36   
    37 # 此处可以类比lambda中的排序方法,就不再解释  
    38 list1.sort(key=itemgetter(2,0))  
    39 print list1  
    40 #[(12, 'the', 14), (2, 'huan', 23), (23, 'liu', 90)]  

    sorted

    原型sorted(iterable, cmp=None, key=None, reverse=False)

    对于sorted()函数中key的重写,和sort()函数中是一样的,所以刚刚对于sort()中讲解的方法,都是适用于sorted()函数中

    cmp函数:

     1 # 排序算法:  
     2 # 排序也是在程序中经常用到的算法。  
     3 # 无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。  
     4 # 如果是数字,我们可以直接比较,但如果是字符串或者两个dict呢?直接比较数学上的大小是没有意义的,因此,比较的过程必须通过函数抽象出来。  
     5 # 通常规定,对于两个元素x和y,如果认为x < y,则返回-1,如果认为x == y,则返回0,如果认为x > y,则返回1,  
     6 # 这样,排序算法就不用关心具体的比较过程,而是根据比较结果直接排序  
     7   
     8 # Python内置的sorted()函数就可以对list进行排序:  
     9 print(sorted([34, 5, 7, 2, 8, 13]))  
    10   
    11 print('-----------------------------------------------------------------------------------')  
    12   
    13 # sorted()函数也是一个高阶函数,它还可以接收一个比较函数来实现自定义的排序。  
    14 # 比如,如果要倒序排序,我们就可以自定义一个reversed_self函数  
    15 # 传入自定义的比较函数reversed_self,就可以实现倒序排序  
    16 def reversed_self(x, y):  
    17     if x > y:  
    18         return -1  
    19     if x < y:  
    20         return 1  
    21     return 0  
    22 res = sorted([34, 5, 7, 2, 8, 13], reversed_self)  
    23 print(res)  
    24   
    25 print('-----------------------------------------------------------------------------------')  
    26   
    27 # 默认情况下,对字符串排序,是按照ASCII的大小比较的,由于'Z' < 'a',结果,大写字母Z会排在小写字母a的前面。  
    28 # 现在,我们提出排序应该忽略大小写,按照字母序排序。要实现这个算法,不必对现有代码大加改动,只要我们能定义出忽略大小写的比较算法就可以  
    29 # Python upper() 方法将字符串中的小写字母转为大写字母。  
    30 def ignore_case(x1, x2):  
    31     u1 = x1.upper()  
    32     u2 = x2.upper()  
    33     if u1 < u2:  
    34         return -1  
    35     if u1 > u2:  
    36         return 1  
    37     return 0  
    38 # 忽略大小写来比较两个字符串,实际上就是先把字符串都变成大写(或者都变成小写),再比较  
    39 res1 = sorted(['bob', 'about', 'Zoo', 'Credit'], ignore_case)  
    40 print(res1)  

    sort与sorted函数比较

    sorted() 作用于任意可迭代的对象,而 sort() 一般作用于列 表。

    因此下面的例子中针对元组使用 sort() 方法会抛出 AttributeError,而使用 sorted() 函数则 没有这个问题。

    >>> a = (1,2,4,2,3)
    >>> a.sort()
    Traceback (most recent call last):
     File "<stdin>", line 1, in <module>
    AttributeError: 'tuple' object has no attribute 'sort'
    >>> sorted(a)
    [1, 2, 2, 3, 4]
    当排序对象为列表的时候两者适合的场景不同。sorted() 函数会返回一个排序后的列表,原有列表保持不 变;而 sort() 函数会直接修改原有列表,函数返回为 None。
    >>> a=['1',1,'a',3,7,'n']
    >>> sorted(a)
    [1, 3, 7, '1', 'a', 'n']
    >>> a
    ['1', 1, 'a', 3, 7, 'n']
    >>> print a.sort()
    None
    >>> a
    [1, 3, 7, '1', 'a', 'n']
    因此如果实际应用过程中需要保留原有列表,使用 sorted() 函数较为适合,否则可以选 择 sort() 函数,因为 sort() 函数不需要复制原有列表,消耗的内存较少,效率也较高。
    无论是 sort() 还是 sorted() 函数,传入参数 key 比传入参数 cmp 效率要高。cmp 传入 的函数在整个排序过程中会调用多次,函数开销较大;而 key 针对每个元素仅作一次处理, 因此使用 key 比使用 cmp 效率要高。

    sorted的强大功能

    • 对字典进行排序(中根据字典的值进行排序)

      >>> phonebook = {'Linda': '7750', 'Bob': '9345', 'Carol': '5834'}
      >>> from operator import itemgetter
      >>> sorted_pb = sorted(phonebook.iteritems(),key=itemgetter(1))
      >>> print sorted_pb
      [('Carol', '5834'), ('Linda', '7750'), ('Bob', '9345')]

      ps: iteritems()方法返回字典的迭代器对象。 operator.itemgetter()函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号)。看例子

      a = [1,2,3] 
      >>> b=operator.itemgetter(1)      //定义函数b,获取对象的第1个域的值
      >>> b(a) 
      2 
      >>> b=operator.itemgetter(1,0)  //定义函数b,获取对象的第1个域和第0个的值
      >>> b(a) 
      (2, 1)
      
      要注意,operator.itemgetter函数获取的不是值,而是定义了一个函数,通过该函数作用到对象上才能获取值。
    • 多维list排序

      实际情况下也会碰到需要对多个字段进行排序的情况,如根据学生的成绩、对应的等级依次排序。当然这在 DB 里面用 SQL 语句很容易做到,但使用多维列表联合 sorted() 函数也可以轻易达到类似的效果。
      >>> from operator import itemgetter
      >>> gameresult = [['Bob',95.00,'A'],['Alan',86.0,'C'['Mandy',82.5,'A'],['Rob',86,'E']] # 分别表示学生的姓名,成绩,等级
      >>> sorted(gameresult , key=operator.itemgetter(2, 1))
      [['Mandy', 82.5, 'A'], ['Bob', 95.0, 'A'], ['Alan', 86.0, 'C'], ['Rob', 86, 'E']] # 当第二个字段成绩相同的时候按照等级从低到高排序
    • 字典中混合list排序

      如果字典中的 key 或者值为列表,需要对列表中的某一个位置 的元素排序也是可以做到的。看例子:

      针对字典 mydict 的 value 结构 [n,m] 中的 m 按照从小到大的顺序排列。

      >>> mydict = { 'Li'   : ['M',7],
      ...            'Zhang': ['E',2],
      ...            'Wang' : ['P',3],
      ...            'Du'   : ['C',2],
      ...            'Ma'   : ['C',9],
      ...            'Zhe'  : ['H',7] }
      >>>
      >>> from operator import itemgetter
      >>> sorted(mydict.iteritems(), key=lambda (k,v): operator.itemgetter(1)(v))
      [('Zhang', ['E', 2]), ('Du', ['C', 2]), ('Wang', ['P', 3]), ('Li',['M', 7]), ('Zhe', ['H', 7]), ('Ma', ['C', 9])]
    • 字典中混合list排序

      列表中的每一个元素为字典形式,需要针对字典的多个key 值进行排序也不难实现。
      看例子:
      
      针对 list 中的字典元素按照 rating 和 name进行排序的实现方法。
      >>> gameresult = [
          { "name":"Bob", "wins":10, "losses":3, "rating":75.00 },
      ... { "name":"David", "wins":3, "losses":5, "rating":57.00 },
      ... { "name":"Carol", "wins":4, "losses":5, "rating":57.00 },
      ... { "name":"Patty", "wins":9, "losses":3, "rating": 71.48 }]
      >>> from operator import itemgetter
      >>> sorted(gameresult , key=operator.itemgetter("rating","name"))
      [
      {'wins': 4, 'losses': 5, 'name': 'Carol', 'rating': 57.0}, 
      {'wins': 3, 'losses': 5, 'name': 'David', 'rating': 57.0}, 
      {'wins': 9, 'losses': 3, 'name': 'Patty','rating': 71.48}, 
      {'wins': 10, 'losses': 3, 'name': 'Bob', 'rating': 75.0}]

       PS python2 与python3区别

    • sorted(iterable, cmp=None, key=None,reverse=False)      ## Python 2.x
      
      sorted(iterable, key=None,reverse=False)                ## Python 3.x

      由此可看出,Python3.x取消了 cmp参数, 所以如果想给 sorted()函数传参的话,就剩下 key,和reverse了。

      也就是说我们无法直接传入多个参数的函数进行排序

      如果直接写的话,会发现

      ## 报错信息如下:
      TypeError: must use keyword argument for key function
      类型错误: 必须使用关键字参数。

      那么我们该如何解决这个问题呢?

      那就是使用functools中的cmp_to_key,即在开头加上

      from functools import cmp_to_key

    • from functools import cmp_to_key
      def desc(color1_list,color2_list): if len(color1_list) == 0: return -1 else: if len(color2_list) == 0: return 1 if color1_list[0] > color2_list[0]: return 1 else: return -1 sameList = sorted(sameTypeList,key = cmp_to_key(desc))
  • 相关阅读:
    时间复杂度
    随机数生成
    promise封装异步函数
    谷歌浏览器占用cpu过高,如何解决?
    大二层网络
    kubernetes 二进制安装部署手册
    SeaWeedfs 分布式网络文件存储介绍
    seaweedfs基本使用
    SeaweedFS基本介绍
    Linux下shell通用脚本启动jar(微服务)
  • 原文地址:https://www.cnblogs.com/kefeiGame/p/8940892.html
Copyright © 2011-2022 走看看