数据结构和算法-14-排序不支持原生比较的对象

问题描述

如果我们想排序类型相同的对象,但是他们不支持原生的比较操作,怎么办呢?

解决方案

内置的 sorted() 函数有一个关键字参数 key ,可以传入一个 callable 对象给它, 这个 callable对象对每个传入的对象返回一个值,这个值会被 sorted 用来排序这些对象。

比如,

如果在应用程序里面有一个 User 实例序列,并且我们希望通过他们的 user_id 属性进行排序,怎么办呢?

我们可以提供一个以 User 实例作为输入并输出对应 user_id 值的 callable 对象。

代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
from operator import attrgetter


class User:
def __init__(self, user_id):
self.user_id = user_id

def __repr__(self):
return 'User({})'.format(self.user_id)


def test_sorted_not_compare():
users = [User(23), User(3), User(99)]

# 看一下顺序
print(users) # [User(23), User(3), User(99)]

# 使用 lambda
print(sorted(users, key=lambda u: u.user_id)) # [User(3), User(23), User(99)]

# 使用 operator.attrgetter() 结果是相同的,但速度更快,还可以同时比较多个字段。
assert sorted(users, key=lambda u: u.user_id) == sorted(users, key=attrgetter('user_id'))

扩展讨论

选择使用 lambda 函数或者是 attrgetter() 可能取决于个人喜好

但是,

attrgetter() 函数通常会运行的点,并且还能同时允许多个字段进行比较。这个跟 operator.itemgetter() 函数作用于字典类型很类似。

例如,如果 User 实例还有一个 first_namelast_name 属性,那么可以向下面这样排序:

1
by_name = sorted(users, key=attrgetter('last_name', 'first_name'))

同样需要注意的是,本文用到的技术同样适用于像 min()max() 之类的函数。

比如:

1
2
3
4
5
>>> min(users, key=attrgetter('user_id'))
User(3)
>>> max(users, key=attrgetter('user_id'))
User(99)
>>>
毕小烦 wechat
「请扫一扫上面的二维码,关注老毕的微信公众号」
「您的赞赏是老毕持续创作的动力」