Golang 标准库 tips之waitgroup详解

waitgroup 用于线程同步，很多场景下为了提高并发需要开多个协程执行，但是又需要等待多个协程的结果都返回的情况下才进行后续逻辑处理，这种情况下可以通过 waitgroup 提供的方法阻塞主线程的执行，直到所有的 goroutine 执行完成。
本文目录结构：

waitgroup 不能被值拷贝
add 需要在 wait 之前调用
使用 channel 实现 waitgroup 的功能
add 和 done 数量问题
waitgroup 和 channel 控制并发数
waitgroup 和 channel 实现提前退出
waitgroup 和 channel 返回错误
使用 errgroup 返回错误
使用 errgroup 实现提前退出
改善版的 errgroup

waitgroup 不能被值拷贝

wg 作为一个参数传递的时候，我们在函数中操作的时候还是操作的一个拷贝的变量，对于原来的 wg 是不会改变。
这一点可以从 waitgroup 实现的源码定义的 struct 能能看出来，waitgroup 的 struct 就两个字段，第一个字段就是 nocopy，表明这个结构体是不希望直接被复制的。nocopy 是的实现是一个空的 struct{}，主要的作用是嵌入到结构体中作为辅助 vet 工具检查是否通过 copy 赋值这个 waitgroup 实例，如果有值拷贝的情况，会被检测出来，我们一般的 lint 工具也都能检测出来。
在某些情况下，如果 waitgroup 需要作为参数传递到其他的方法中，一定需要使用指针类型进行传递。

可以用以下一个例子来说明：

add 需要在 wait 之前调用

waitgroup 结构体提供了三个方法，add、done、wait，add 的作用是用来设置waitgroup的计数值(子goroutine的数量)；done的作用用来将 waitgroup 的计数值减 1，其实就是调用add(-1)；wait 的作用是检测 waitgroup 计数器的值是否为 0，如果为 0 表示所有的 goroutine 都运行完成，否则会阻塞等待计数器的值为0(所有的 groutine都执行完成)之后才运行后面的代码。
所以在 waitgroup 调用的时候一定要保障 add 函数在 wait 函数之前执行，否则可能会导致 wait 方法没有等到所有的结果运行完成而被执行完。也就是我们不能在 grountine 中来执行 add 和 done，这样可能当前 grountine 来不及运行，外层的 wait 函数检测到满足条件然后退出了。

使用 channel 实现 waitgroup 的功能

如果想要实现主线程中等待多个协程的结果都返回的情况下才进行后续调用，也可以通过带缓存区的 channel 来实现，实现的思路是需要先知道等待 groutine 的运行的数量，然后初始化一个相同缓存区数量的 channel，在 groutine 运行结束之后往 channel 中放入一个值，并在主线程中阻塞监听获取 channel 中的值全部返回。

add 和 done 数量问题

需要保障 add 的数量和 done 的数量一致，如果 add 数量小于 done 数量的情况下，调用 wait 方法会检测到计数器的值为负数，程序会报 panic；如果 add 数量大于 done 的数量，会导致 wait 循环阻塞后面的代码得不到执行。
add 数量小于 done 数量：

add 数量大于 done 数量：

waitgroup 和 channel 控制并发数

使用 waitgroup 可以控制一组 groutine 同时运行并等待结果返回之后再进行后续操作，虽然 groutine 对资源消耗比较小，但是大量的 groutine 并发对系统的压力还是比较大，所以这种情况如果需要控制 waitgroup 中 groutine 并发数量控制，就可以使用缓存的 channel 控制同时并发的 groutine 数量。

根据使用 channel 实现 waitgroup 的功能的思路，我们上面的代码也可以通过两个 channel 进行改造来实现。

waitgroup 和 channel 实现提前退出

用 waitgroup 协调一组并发 goroutine 的做法很常见，但 waitgroup 本身也有其不足:
waitgroup 必须要等待控制的一组 goroutine 全部返回结果之后才往下运行，但是有的情况下我们希望能快速失败，也就是这一组 goroutine 中只要有一个失败了，那么就不应该等到所有 goroutine 结束再结束任务，而是提前结束以避免资源浪费，这个时候就可以使用 channel 配合 waitgroup 实现提前退出的效果。

waitgroup 和 channel 返回错误

waitgroup 除了不能快速失败之外还有一个问题就是不能在主线程中获取到 groutine 出错时返回的错误，这种情况下就可以用到 channel 进行错误传递，在主线程中获取到错误。

使用 errgroup 返回错误

正是由于 waitgroup 有以上说的一些缺点，go 团队在实验仓库(golang.org/x)增加了 errgroup.group 的功能，相比 waitgroup 增加了错误传递、快速失败、超时取消等功能，相对于通过 channel 和 waitgroup 组合实现这些功能更方便，也更加推荐。
errgroup.group 结构体也比较简单，在 sync.waitgroup 的基础之上包装了一个 error 以及一个 cancel 方法，err 的作用是在 goroutine 出错的时候能够返回，cancel 方法的作用是在出错的时候快速失败。
errgroup.group 对外暴露了3个方法，withcontext、go、wait，没有了 add、done 方法，其实 add 和 done 是在包装在了 errgroup.group 的 go 方法里面了，我们执行的时候不需要关心。

以下是使用 errgroup.group 来实现返回 goroutine 错误的例子：

需要注意的一点是通过 errgroup.group 来返回 err 只会返回其中一个 groutine 的错误，而且是最先返回 err 的 groutine 的错误，这一点是通过 errgroup.group 的 erronce 来实现的。

使用 errgroup 实现提前退出

使用 errgroup.group 实现提前退出也比较简单，调用 errgroup.withcontext 方法获取 errgroup.group 对象以及一个可以取消的 withcancel 的 context，并且将这个 context 方法传入到所有的 groutine 中，并在 groutine 中使用 select 监听这个 context 的 done() 事件，如果监听到了表明接收到了 cancel 信号，然后退出 groutine 即可。需要注意的是 eg.go 一定要返回一个 err 才会触发 errgroup.group 执行 cancel 方法。

改善版的 errgroup

使用 errgroup.group 的 withcontext 我们注意到在返回 eg 对象的同时还会返回另外一个可以取消的 context 对象，这个 context 对象的功能就是用来传递到 eg 需要同步的 groutine 中有一个发生错误时取消整个同步的 groutine，但是有不少同学可能会不经意将这个 context 传到其他的非 eg 同步的业务代码groutine 中，这样会导致非关联的业务代码莫名其妙的收到 cancel 信息，类似如下的写法：

另外不管是 waitgroup 还是 errgroup.group 都不支持控制最大并发限制以及 panic 恢复的功能，因为我们不能保障我们通过创建的 groutine 不会出现异常，如果没有在创建的协程中捕获异常，会直接导致整个程序退出，这是非常危险的。
这里推荐一下 bilbil 开源的微服务框架 go-kratos/kratos 自己实现了一个改善版本的 errgroup.group，其实现的的思路是利用 channel 来控制并发，并且创建 errgroup 的时候不会返回 context 避免 context 往非关联的业务方法中传递。

到此这篇关于golang 标准库 tips之waitgroup详解的文章就介绍到这了,更多相关golang waitgroup内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com！

黄山市民网：https://www.huangshanshimin.com/