pathlib.Path 如何递归获取所有 .py 文件(不使用 os.walk)

最直接方式是用 Path("dir").rglob("*.py") 获取所有.py文件;需加 is_file() 过滤目录,用 "venv" not in p.parts 排除虚拟环境,大小写无关时可用 p.suffix.lower() == ".py"。

pathlib.Path 递归获取所有 .py 文件,最直接的方式是使用 rglob()

方法。

rglob() 匹配 .py 文件

rglob()Path 对象的内置方法,支持通配符、自动递归遍历子目录,语义清晰且无需手动处理路径拼接或循环逻辑。

  • 写法简洁:Path("your_dir").rglob("*.py")
  • 返回的是生成器,内存友好;如需列表可转为 list()
  • 匹配的是文件名(含扩展名),不区分大小写?注意:默认区分大小写(.py 不会匹配 .PY

只保留普通文件(排除目录)

rglob("*.py") 可能返回同名目录(极少见但合法),稳妥起见建议过滤出真正的文件:

  • is_file() 判断:[p for p in Path("src").rglob("*.py") if p.is_file()]
  • 也可链式调用:list(Path("src").rglob("*.py")) 再过滤,但推荐一步到位

忽略特定目录(如 __pycache__venv

rglob() 本身不支持排除路径,但可通过条件过滤实现:

  • 检查路径中是否包含敏感段:if "__pycache__" not in str(p) and "venv" not in str(p)
  • 更健壮的方式是用 parts 检查路径组件:if "__pycache__" not in p.parts and "venv" not in p.parts
  • 组合示例:[p for p in Path("src").rglob("*.py") if p.is_file() and "venv" not in p.parts]

补充:大小写无关匹配(如需兼容 .PY.Py

rglob() 不支持正则或 ignore-case,但可以分两次查再去重:

  • list(Path("src").rglob("*.py")) + list(Path("src").rglob("*.PY")) + list(Path("src").rglob("*.Py"))
  • 或统一转小写判断:[p for p in Path("src").rglob("*") if p.is_file() and p.suffix.lower() == ".py"](稍慢但灵活)