问题
- 想要一个能将键(key)映射到多个值的字典(即所谓的一键多值字典[multidict])
解决方案
- 字典是一种关联容器,每个键都映射到一个单独的值上。如果想让键映射到多个值,需要将这多个值保存到另一个容器如列表或集合中。例如,可能像这样创建字典:
d = { 'a' : [1, 2, 3], 'b' : [4, 5], } e = { 'a' : [1, 2, 3], 'b' : [4, 5], }
- 要使用列表还是集合完全取决于应用的意图。如果希望保留元素插入的顺序,就用列表。如果希望消除重复元素(且不在意它们的顺序),就用集合。
- 为了能方便的创建这样的字典,可以利用collections模块中的defaultdice类。defaultdict的一个特点就是它会自动初始化第一个值,这样只需关注添加元素即可。例如:
from collections import defaultdict d = defaultdict(list) d['a'].append(1) d['a'].append(2) d['b'].append(4) print(d) defaultdict(<class 'list'>, {'a': [1, 2], 'b': [4]}) from collections import defaultdict d = defaultdict(set) d['a'].add(1) d['a'].add(2) d['b'].add(4) print(d) defaultdict(<class 'set'>, {'a': {1, 2}, 'b': {4}})
- 关于defaultdict,需要注意的一个地方是,它会自动创建字典表项以待稍后的访问(即使用这些表项当前在字典中还没有找到)。如果不想要这个功能,可以在普通的字典上调用setdefault()方式来取代。例如:
d = {} d.setdefault('a', []).append(1) d.setdefault('a', []).append(2) d.setdefault('b', []).append(3) print(d) {'b': [3], 'a': [1, 2]}
- 然而,许多程序员觉得使用setdefault()有点不自然---更别提每次调用它时还会创建一个初始值的新实例了(例子中的空列表[])。
讨论
- 原则上,构建一个一键多值字典是很容易的。但是如果试着自己对第一个值做初始化操作,就会变得很杂乱。例如,可能会写下面的代码:
d = {} for key, value in pairs: if key not in d: d[key] = [] d[key].append(value)
- 使用defaultdict后代码会清晰很多:
d = defaultdict(list) for key, value in pairs: d[key].append(value)
- 这一节的内容同数据处理中的记录归组问题有很强的关联