如何用Golang实现多协程数据聚合_Golang 多协程数据聚合实践

使用 channel 汇聚协程结果,通过定义 Result 结构体统一返回格式,启动多个协程将数据写入 resultCh,主协程循环接收并聚合结果,最终合并为 aggregated 切片。

在高并发场景下,Golang 的协程(goroutine)和通道(channel)机制非常适合用来并行获取数据并进行聚合处理。实现多协程数据聚合的关键在于:合理划分任务、使用 channel 汇总结果、避免资源竞争,并控制并发数量。下面是一个实用的实践方案。

1. 使用 channel 汇聚协程结果

每个协程完成任务后,将结果发送到一个公共的 channel 中,主协程从该 channel 读取所有数据并进行合并。

定义一个结果结构体来统一返回格式:

type Result struct {
    Data []string
    Err  error
}

启动多个协程执行任务,结果通过 resultCh 传出:

resultCh := make(chan Result, 3)

go func() { data, err := fetchDataFromSourceA() resultCh <- Result{Data: data, Err: err} }()

go func() { data, err := fetchDataFromSourceB() resultCh <- Result{Data: data, Err: err} }()

go func() { data, err := fetchDataFromSourceC() resultCh <- Result{Data: data, Err: err} }()

主协程接收所有结果:

var aggregated []string
for i := 0; i < 3; i++ {
    result := <-resultCh
    if result.Err != nil {
        log.Printf("task failed: %v", result.Err)
        continue
    }
    aggregated = append(aggregated, result.Data...)
}

2. 控制并发数防止资源耗尽

当任务数量较大时,直接起万级协程会导致系统负载过高。可使用带缓冲的 channel 实现信号量机制,限制最大并发数。

semaphore := make(chan struct{}, 10) // 最多 10 个并发

var wg sync.WaitGroup resultCh := make(chan Result, len(tasks))

for _, task := range tasks { wg.Add(1) go func(t Task) { defer wg.Done() semaphore <- struct{}{} // 获取许可 defer func() { <-semaphore }() // 释放许可

    data, err := processTask(t)
    resultCh <- Result{Data: data, Err: err}
}(task)

}

// 所有任务启动后关闭 resultCh go func() { wg.Wait() close(resultCh) }()

// 主协程收集结果 var aggregated []string for result := range resultCh { if result.Err == nil { aggregated = append(aggregated, result.Data...) } }

3. 超时控制与错误处理

长时间阻塞会影响整体性能,建议加入 context 超时控制。

ctx, cancel := context.WithTimeout(context.Background(), 3*time.Second)
defer cancel()

go func() { time.Sleep(4 * time.Second) // 模拟慢请求 select { case resultCh <- Result{Err: errors.New("timeout")}: case <-ctx.Done(): } }()

主逻辑监听 ctx.Done() 可提前退出:

select {
case result := <-resultCh:
    // 处理结果
case <-ctx.Done():
    return nil, ctx.Err()
}

4. 实际应用场景示例

比如从多个 API 接口拉取用户信息并合并:

  • 每个协程调用一个微服务接口
  • 结果统一写入 channel
  • 主流程等待全部返回或超时
  • 对成功结果做去重、排序等聚合操作

这种方式显著提升响应速度,尤其适用于网关层聚合数据返回给前端。

基本上就这些。核心是利用 channel 解耦生产和消费,配合 sync.WaitGroup 和 context 实现安全、可控的并发聚合。不复杂但容易忽略错误处理和限流。实际项目中可封装成通用 worker pool 模式复用。