数据结构和算法-20-合并多个字典或映射

问题描述

我们想把多个字典或者映射合并,然后再执行某些操作(如:查找或校验某些 key 是否存在)。

应该如何做呢?

解决方案

使用 collections 模块中的 ChainMap 类。

示例代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from collections import ChainMap


def test_chainmap():
"""合并多个字典"""

a_dict = {'x': 1, 'z': 3}
b_dict = {'y': 2, 'z': 4}
# 合并两个字典(映射),从逻辑上变成了一个
cm = ChainMap(a_dict, b_dict)
assert cm['x'] == 1
assert cm['y'] == 2
assert cm['z'] == 3
# 遇到重复的 key,总是返回第一次出现的 value
# 因此不管访问几次,cm['z'] 总是返回字典 a 中的 value。
assert cm['z'] == 3

扩展讨论

一个 ChainMap 接受多个字典并将它们在逻辑上变为一个字典。

然后,

这些字典并不是真的合并在一起了, ChainMap 类只是在内部创建了一个容纳这些字典的列表重新定义了一些常见的字典操作来遍历这个列表。

ChainMap的字典操作

使用 ChainMap 合并后,大部分字典操作都是可以正常使用的。

示例代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
def test_chainmap_operate():
"""ChainMap的字典操作"""

a_dict = {'x': 1, 'z': 3}
b_dict = {'y': 2, 'z': 4}
cm = ChainMap(a_dict, b_dict)

assert len(cm) == 3
assert list(cm.keys()) == ['x', 'y', 'z']
assert list(cm.values()) == [1, 2, 3]

# ChainMap的更新操作
cm['z'] = 10
cm['w'] = 40
# 结果只影响列表中第一个字典,也就是 a_dict
assert a_dict == {'w': 40, 'x': 1, 'z': 10}
# ChainMap的删除操作
del cm['x']
# 结果也只影响列表中第一个字典,也就是 a_dict
assert a_dict == {'w': 40, 'z': 10}

ChainMap 对于编程语言中的作用范围变量(比如 globals , locals 等)是非常有用的。

ChainMap更多的用法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
>>> values = ChainMap()
>>> values['x'] = 1
>>> # 添加一个新的映射
>>> values = values.new_child()
>>> values['x'] = 2
>>> # 添加一个新的映射
>>> values = values.new_child()
>>> values['x'] = 3
>>> values
ChainMap({'x': 3}, {'x': 2}, {'x': 1})
>>> values['x']
3
>>> # 放弃最后的映射
>>> values = values.parents
>>> values['x']
2
>>> #放弃最后的映射
>>> values = values.parents
>>> values['x']
1
>>> values
ChainMap({'x': 1})
>>>

update vs ChainMap

也许你可能想使用 update() 合并两个字典。

比如:

1
2
3
4
5
6
7
8
9
10
11
>>> a = {'x': 1, 'z': 3 }
>>> b = {'y': 2, 'z': 4 }
>>> merged = dict(b)
>>> merged.update(a)
>>> merged['x']
1
>>> merged['y']
2
>>> merged['z']
3
>>>

这样也OK,但它需要你创建一个完全不同的字典对象(或者是破坏现有字典结构)。而且,如原字典做了更新,合并后的新字典并不会同步更新。

比如:

1
2
3
>>> a['x'] = 13
>>> merged['x']
1

ChainMap 使用的是原来的字典,它不是创建新的字典,所以避免了上面所说的结果。

比如:

1
2
3
4
5
6
7
8
9
>>> a = {'x': 1, 'z': 3 }
>>> b = {'y': 2, 'z': 4 }
>>> merged = ChainMap(a, b)
>>> merged['x']
1
>>> a['x'] = 42
>>> merged['x'] # Notice change to merged dicts
42
>>>
毕小烦 wechat
「请扫一扫上面的二维码,关注老毕的微信公众号」
「您的赞赏是老毕持续创作的动力」