如何使用python协程中gevent模块?

gevent通过协程实现高效并发,先打补丁monkey.patch_all()使阻塞操作非阻塞,再用gevent.spawn创建协程,并发执行任务,结合Pool控制并发数,适用于IO密集型场景如网络请求。

Python中的gevent模块是一个基于协程的并发库,它使用greenlet(轻量级协程)实现异步编程,通过monkey patching将标准库中的阻塞操作变为非阻塞,从而实现高效的并发处理。下面介绍如何使用gevent进行常见操作。

安装与基础用法

首先需要安装gevent:

pip install gevent

最简单的gevent程序如下:

import gevent
from gevent import monkey

# 打补丁,让标准库中的阻塞操作变成非阻塞
monkey.patch_all()

def task(name, duration):
    print(f"Task {name} starting")
    gevent.sleep(duration) # 模拟IO等待
    print(f"Task {name} finished")

# 创建多个协程任务
jobs = [
    gevent.spawn(task, "A", 2),
    gevent.spawn(task, "B", 1),


# 等待所有任务完成
gevent.joinall(jobs)

Monkey Patching 的作用

gevent的核心是monkey patching。Python的标准库如socket、time、threading等默认是阻塞的,gevent通过monkey.patch_all()替换这些模块中的阻塞函数为协作式版本。

例如:

from gevent import monkey
monkey.patch_socket() # 只打补丁socket
# 或者更常用:
monkey.patch_all()

注意:必须在导入其他模块之前调用patch,否则无效。通常放在文件最开始。

实际应用:并发请求网络资源

使用gevent可以轻松实现高并发HTTP请求:

import gevent
from gevent import monkey
monkey.patch_all() # 打补丁,支持requests等库

import requests

def fetch(url):
    print(f"Fetching {url}")
    response = requests.get(url)
    print(f"{url} -> {response.status_code}")

urls = [
    "https://httpbin.org/delay/1",
    "https://httpbin.org/delay/2",
    "https://httpbin.org/get"
]

# 并发执行
gevent.joinall([gevent.spawn(fetch, url) for url in urls])

原本串行需要几秒的操作,现在几乎同时发起,总耗时由最长的那个决定。

控制并发数量:使用Pool

当任务过多时,可以用gevent.pool.Pool限制并发数:

from gevent.pool import Pool

def worker(url):
    response = requests.get(url)
    return f"{url}: {response.status_code}"

pool = Pool(5) # 最多5个并发
results = pool.map(worker, urls)

for result in results:
    print(result)

Pool也支持异步方式:pool.spawn() + gevent.joinall()。

基本上就这些。gevent的优势在于写法接近同步代码,逻辑清晰,适合IO密集型任务,比如爬虫、API调用、长轮询服务等。掌握patch机制和spawn/joinall模式,就能高效利用gevent实现并发。