Python yield from 和 yield 的性能与语义区别

yield from 会隐式展开迭代器并透传协程方法,支持双向通信与子生成器返回值捕获;yield 仅产出单个值,无法代理协程交互。

yield from 会隐式展开迭代器,yield 只产出单个值

语义上最根本的区别在于: yield 每次只把一个对象“扔出来”,而 yield from 接收一个可迭代对象(比如列表、生成器、range),并自动逐个 yield 它的每个元素。它不是语法糖,而是有明确的委托协议——会触发迭代器的 __next__sendthrowclose 等方法的透传。

这意味着如果你写:

def gen1():
    yield from [1, 2, 3]

def gen2():
    for x in [1, 2, 3]:
        yield x

二者行为一致,但 gen1 少一层 Python 循环解释开销;而如果你用 gen2 手动模拟 yield from 对协程的委托(比如处理 send()),代码会立刻变得冗长且易错。

yield from 在协程中支持双向通信,yield 不行

这是容易被忽略的关键点:yield from 是为协程设计的,能自动将调用方的 send(value)throw(exc)close() 转发给子生成器,并把子生成器的返回值(StopIteration.value)暴露给外层。普通 yield 完全不具备这个能力。

  • yield 手动代理协程通信,需自己捕获 GeneratorExit、重抛异常、处理 return 值,极易漏逻辑
  • yield from subgen() 后,如果 subgenreturn "done" 结束,外层生成器会收到 StopIteration("done")
  • 若在 yield from 表达式后接赋值(如 res = yield from subgen()),res 就是子生成器的返回值

性能差异取决于

子迭代器类型,不是绝对快或慢

对纯数据序列(如 listtuple),yield from 通常比等价的 for + yield 快 10%–30%,因为绕过了 Python 字节码循环和局部变量查找;但对轻量级生成器(比如 (x for x in range(100))),差别微乎其微。

真正影响性能的是「是否触发额外对象创建」:

  • yield from range(1000) → 直接用 C 实现的 range_iterator,零内存分配
  • for x in range(1000): yield x → 每次循环都走 Python 的 FOR_ITER 指令,多几条字节码
  • yield from my_slow_generator() → 如果 my_slow_generator 本身耗时,yield from 不会加速它,只是减少调度开销

常见误用:把 yield from 用在非迭代器或单个值上

运行时报错很直接:TypeError: 'int' object is not iterableTypeError: cannot 'yield from' a non-generator object(Python 3.12+ 更严格)。典型错误包括:

  • yield from 42 —— 数字不可迭代
  • yield from some_func() —— 如果 some_func 返回 None 或非迭代对象,立刻崩溃
  • yield from [x for x in data] —— 列表推导式先构建完整列表,吃内存;应改用生成器表达式:yield from (x for x in data)
  • 在异步函数里误写 yield from await coro() —— 混淆了 async/await 和生成器协议,该用 await 而非 yield from

真正难调试的是嵌套多层 yield from 后异常堆栈变浅、return 值被吞掉,或者子生成器提前 close() 导致外层状态不一致——这些都不是性能问题,而是语义契约没被理解透。