Python 如何让 set 保持插入顺序(Python 3.7 前后差异)

Python标准库无有序set,但可通过dict.fromkeys(3.7+)、OrderedDict(全版本)或list+set双结构实现去重且保持插入顺序;需动态操作可选ordered-set库。

Python 的 set 本身不保证插入顺序——这是它的设计特性,不是 bug。但实际使用中,很多人希望“去重且有序”,尤其在 Python 3.7 之前,set 的迭代顺序完全取决于哈希值和底层实现,不可靠。下面分情况说明如何实现“保持插入顺序的去重集合”效果。

Python 3.7+:用 dict.fromkeys() 模拟有序 set

从 Python 3.7 开始,dict 保证插入顺序(CPython 3.6 已实现,但 3.7 被正式写入语言规范)。利用这一点,可以用字典的键来模拟有序集合:

  • ordered_set = list(dict.fromkeys([3, 1, 4, 1, 5, 3]))[3, 1, 4, 5]
  • 如果只需要可迭代、去重、有序的容器,直接用 dict.fromkeys(...).keys(),它返回一个视图对象,行为接近 set(支持 inlen),且保持顺序
  • 注意:dict.fromkeys(seq).keys() 不支持原地增删,如需动态操作,建议封装成类或改用第三方库

Python 3.6 及更早:手动维护列表 + 集合双结构

没有内置有序 set 支持,常见做法是组合 list(记顺序)和 set(查存在),确保 O(1) 查重、O(n) 插入(平均仍很快):

  • 初始化:seen = set(); ordered = []
  • 添加元素时先检查:if x not in

    seen: seen.add(x); ordered.append(x)
  • 适合一次性构建后只读的场景;若频繁增删,可封装为简易类,重载 add__contains__ 等方法

跨版本通用方案:用 collections.OrderedDict

OrderedDict 在所有 Python 3.x 版本中都保持键的插入顺序,且自 Python 3.7 起其行为已与普通 dict 一致,但仍可安全使用:

  • from collections import OrderedDict
  • ordered_set = list(OrderedDict.fromkeys([3,1,4,1,5]))
  • 优点:语义清晰、兼容性好;缺点:相比 dict.fromkeys 略微多一点开销,但通常可忽略

需要真正可变有序 set?考虑第三方库 ordered-set

如果项目允许引入依赖,ordered-set 是成熟选择:

  • ordered-set
  • pip install ordered-set
  • from ordered_set import OrderedSet —— 支持完整 set 接口 + 顺序保证
  • 内部用双向链表 + dict 实现,增删查均为均摊 O(1)

总之,标准库中没有“有序 set”类型,但通过 dict、OrderedDict 或双结构,完全可以按需构造出行为符合预期的有序去重容器。选哪种方式,取决于你的 Python 版本、是否需要动态修改、以及是否接受外部依赖。