哈希字典?

为了缓存目的，我需要从字典中存在的GET参数生成一个缓存键。

目前，我正在使用sha1(repr(sorted(my_dict.items()))) (sha1()是一个内部使用hashlib的方便方法)，但我很好奇是否有更好的方法。

当前回答

您可以使用地图库来做到这一点。具体来说,地图。FrozenMap

import maps
fm = maps.FrozenMap(my_dict)
hash(fm)

要安装地图，只需执行:

pip install maps

它也处理嵌套的dict大小写:

import maps
fm = maps.FrozenMap.recurse(my_dict)
hash(fm)

免责声明:我是地图库的作者。

2018-11-08 19:08:59

其他回答

使用sorted(d.s items())并不足以获得稳定的repr。d中的一些值也可以是字典，它们的键仍然会以任意顺序出现。只要所有的键都是字符串，我更喜欢使用:

json.dumps(d, sort_keys=True)

也就是说，如果散列需要在不同的机器或Python版本之间保持稳定，我不确定这是万无一失的。您可能希望添加分隔符和ensure_ascii参数，以保护自己不受对默认值的任何更改的影响。我很感激你的评论。

2014-02-25 02:29:57

如果你的字典不是嵌套的，你可以用字典的项创建一个frozenset，并使用hash():

hash(frozenset(my_dict.items()))

与生成JSON字符串或字典表示相比，这需要的计算量要小得多。

更新:请参阅下面的评论，为什么这种方法可能不会产生稳定的结果。

2011-05-04 13:24:33

解决这个问题的一种方法是用字典的元素创建一个元组:

hash(tuple(my_dict.items()))

2020-03-19 21:48:45

下面的代码避免使用Python hash()函数，因为它不会在重新启动Python时提供一致的散列(参见Python 3.3中的散列函数在会话之间返回不同的结果)。make_hashable()将对象转换为嵌套的元组，make_hash_sha256()也将repr()转换为base64编码的SHA256散列。

import hashlib
import base64

def make_hash_sha256(o):
    hasher = hashlib.sha256()
    hasher.update(repr(make_hashable(o)).encode())
    return base64.b64encode(hasher.digest()).decode()

def make_hashable(o):
    if isinstance(o, (tuple, list)):
        return tuple((make_hashable(e) for e in o))

    if isinstance(o, dict):
        return tuple(sorted((k,make_hashable(v)) for k,v in o.items()))

    if isinstance(o, (set, frozenset)):
        return tuple(sorted(make_hashable(e) for e in o))

    return o

o = dict(x=1,b=2,c=[3,4,5],d={6,7})
print(make_hashable(o))
# (('b', 2), ('c', (3, 4, 5)), ('d', (6, 7)), ('x', 1))

print(make_hash_sha256(o))
# fyt/gK6D24H9Ugexw+g3lbqnKZ0JAcgtNW+rXIDeU2Y=

2017-02-10 05:09:30

使用DeepDiff模块中的DeepHash

from deepdiff import DeepHash
obj = {'a':'1',b:'2'}
hashes = DeepHash(obj)[obj]

2021-11-24 02:24:13

推荐文章

最新文章

标签