zoukankan      html  css  js  c++  java
  • 十二. Go并发编程sync/errGroup

    一.序

    这一篇算是并发编程的一个补充,起因是当前有个项目,大概の 需求是,根据kafka的分区(partition)数,创建同等数量的 消费者( goroutine)从不同的分区中消费者消费数据,但是总有某种原因导致,某一个分区消费者创建失败,但是其他分区消费者创建失败。 最初的逻辑是,忽略分区失败的逻辑,将成功创建的分区消费者收集,用于获取消息进行数据处理。 代码就不在这里展示。

    问题其实很明确: 如果在初始化分区消费者时,只要有一个消费创建失败,那么初始化工作就算失败,程序应该panic,退出。

    但是当初设计时,消费者负责从kafka上游的某个topic获取到数据,然后经过数据处理后,再通过生产者将处理后的数据发送到下游的topic中,由于当时设计时,代码耦合比较重,导致无法通过初始化工作做这些,只能在启动生产者后, 再创建消费者,这就导致 创建消费者-->获取数据-->处理数据 杂糅到了一起。 这个问题一直到最近才有时间想着来解决。

    比如有三个分区创建了三个分区的消费者,每个分区的消费者对应从自己的分区重获取数据,三个分区最初使用waitGroup进行控制三个分区创建,只有当三个分区都创建完成后才会执行后续逻辑。 但是 waitgroup并不能很好的解决:只要一个 goroutine 出错我们就不再等其他 goroutine 了,就默认创建分区消费者失败了,所以此时便想到了 errGroup

    二.errGroup

    errGroup 是google开源的基础扩展库。使用时先进行下载

    go get -u golang.org/x/sync
    

    2.1 函数签名

    type Group struct {
    	// contains filtered or unexported fields
    }
    
        func WithContext(ctx context.Context) (*Group, context.Context)
        func (g *Group) Go(f func() error)
        func (g *Group) Wait() error
    

    整个包就一个 Group 结构体

    • 通过WaitContext 可以创建一个带取消的group
    • Go 方法传入一个 func() error 内部会启动一个goroutine 去处理
    • Wait 类似WaitGroupWait 方法,等待所有的 goroutine结束后退出,返回的错误是一个出错的 err

    三.源码

    3.1 Group

    type Group struct {
        // context 的 cancel 方法
    	cancel func()
    
        // 复用 WaitGroup
    	wg sync.WaitGroup
    
    	// 用来保证只会接受一次错误
    	errOnce sync.Once
        // 保存第一个返回的错误
    	err     error
    }
    

    3.2 WaitContext

    func WithContext(ctx context.Context) (*Group, context.Context) {
    	ctx, cancel := context.WithCancel(ctx)
    	return &Group{cancel: cancel}, ctx
    }
    

    WithContext 就是使用 WithCancel 创建一个可以取消的 context 将 cancel 赋值给 Group 保存起来,然后再将 context 返回回去

    注意这里有一个坑,在后面的代码中不要把这个 ctx 当做父 context 又传给下游,因为 errgroup 取消了,这个 context 就没用了,会导致下游复用的时候出错

    3.3 Go

    func (g *Group) Go(f func() error) {
    	g.wg.Add(1)
    
    	go func() {
    		defer g.wg.Done()
            
            // 通过执行传入的匿名函数返回的错误值判断是否需要执行cancel
    		if err := f(); err != nil {
    		    // 这一点很重要,确保错误只会被执行一次
    			g.errOnce.Do(func() {
    				g.err = err
    				if g.cancel != nil {
    					g.cancel()
    				}
    			})
    		}
    	}()
    }
    

    Go 方法是一个封装,相当于go 关键字的加强,会启动一个携程,然后利用waitgroup 来控制是否结束,如果有一个非 nilerror 出现就会保存起来并且如果有 cancel 就会调用 cancel 取消掉,使 ctx 返回

    3.4 Wait

    func (g *Group) Wait() error {
    	g.wg.Wait()
    	if g.cancel != nil {
    		g.cancel()
    	}
    	return g.err
    }
    

    Wait 方法其实就是调用 WaitGroup 等待,如果有 cancel 就调用一下

    四. 案例

    基于 errgroup 实现一个 http server 的启动和关闭 ,以及 linux signal 信号的注册和处理,要保证能够 一个退出,全部注销退出。

    package main
    
    import (
    	"context"
    	"fmt"
    	"log"
    	"net/http"
    	"os"
    	"os/signal"
    	"syscall"
    	"time"
    
    	"golang.org/x/sync/errgroup"
    )
    
    func main() {
    	g, ctx := errgroup.WithContext(context.Background())
    
    	mux := http.NewServeMux()
    	mux.HandleFunc("/ping", func(w http.ResponseWriter, r *http.Request) {
    		_, _ = w.Write([]byte("pong"))
    	})
    
    	// 模拟单个服务错误退出
    	serverOut := make(chan struct{})
    	mux.HandleFunc("/shutdown", func(w http.ResponseWriter, r *http.Request) {
    		serverOut <- struct{}{}
    	})
    
    	server := http.Server{
    		Handler: mux,
    		Addr:    ":8099",
    	}
    
    	// g1
    	// g1 退出了所有的协程都能退出么?
    	// g1 退出后, context 将不再阻塞,g2, g3 都会随之退出
    	// 然后 main 函数中的 g.Wait() 退出,所有协程都会退出
    	g.Go(func() error {
    		err := server.ListenAndServe() // 服务启动后会阻塞, 虽然使用的是 go 启动,但是由于 g.WaitGroup 试得其是个阻塞的 协程
    		if err != nil {
    			log.Println("g1 error,will exit.", err.Error())
    		}
    		return err
    	})
    
    	// g2
    	// g2 退出了所有的协程都能退出么?
    	// 到调用 `/shutdown`接口时, serverOut 无缓冲管道写入数据, case接收到数据后执行server.shutdown, 此时 g1 httpServer会退出
    	// g1退出后,会返回error,将error加到g中,同时会调用 cancel()
    	// g3 中会 select case ctx.Done, context 将不再阻塞,g3 会随之退出
    	// 然后 main 函数中的 g.Wait() 退出,所有协程都会退出
    	g.Go(func() error {
    		select {
    		case <-ctx.Done():
    			log.Println("g2 errgroup exit...")
    		case <-serverOut:
    			log.Println("g2, request `/shutdown`, server will out...")
    		}
    
    		timeoutCtx, cancel := context.WithTimeout(context.Background(), 3*time.Second)
    		// 这里不是必须的,但是如果使用 _ 的话静态扫描工具会报错,加上也无伤大雅
    		defer cancel()
    
    		err := server.Shutdown(timeoutCtx)
    		log.Println("shutting down server...")
    		return err
    	})
    
    	// g3
    	// g3 捕获到 os 退出信号将会退出
    	// g3 退出了所有的协程都能退出么?
    	// g3 退出后, context 将不再阻塞,g2 会随之退出
    	// g2 退出时,调用了 shutdown,g1 会退出
    	// 然后 main 函数中的 g.Wait() 退出,所有协程都会退出
    	g.Go(func() error {
    		quit := make(chan os.Signal, 0)
    		signal.Notify(quit, syscall.SIGINT, syscall.SIGTERM)
    
    		select {
    		case <-ctx.Done():
    			log.Println("g3, ctx execute cancel...")
    			log.Println("g3 error,", ctx.Err().Error())
    			// 当g2退出时,已经有错误了,此时的error 并不会覆盖到g中
    			return ctx.Err()
    		case sig := <-quit:
    			return fmt.Errorf("g3 get os signal: %v", sig)
    		}
    	})
    
    	// g.Wait 等待所有 go执行完毕后执行
    	fmt.Printf("end, errgroup exiting, %+v\n", g.Wait())
    }
    
    

    运行测试

    D:\gopath\src\Go_base\daily_test\errorGroup>go run demo.go
    
    1. 浏览器输入http://127.0.0.1:8099/shutdown

      • 控制台输出
      2021/12/11 10:52:03 g2, request `/shutdown`, server will out...
      2021/12/11 10:52:03 g1 error,will exit. http: Server closed
      2021/12/11 10:52:03 g3, ctx execute cancel...
      2021/12/11 10:52:03 g3 error, context canceled // 间隔了3s
      2021/12/11 10:52:06 shutting down server...
      end, errgroup exiting, http: Server closed
      
      • 从执行结果可以看出,这种退出可以保证每个goroutine都能在完成正在执行的工作后退出
    2. 在terminal 按ctrl + c

      • 输出
      2021/12/11 10:55:51 g2 errgroup exit...
      2021/12/11 10:55:51 g1 error,will exit. http: Server closed
      2021/12/11 10:55:51 shutting down server...
      end, errgroup exiting, g3 get os signal: interrupt
      

    分析都在代码注释中

    五. 参考

    1. https://lailin.xyz/post/go-training-week3-errgroup.html
    2. https://pkg.go.dev/golang.org/x/sync/errgroup
    ♥永远年轻,永远热泪盈眶♥
  • 相关阅读:
    321list,元组,range**数字是不可迭代的!
    320作业
    320基础数据类型初始
    319作业
    316作业
    319 Python基础之格式化输出、逻辑运算符、编码、in not in、while else、
    windows查看端口占用指令
    2016年学习计划
    刷算法的时候有没有必要自写测试用例?
    我们为什么不能只用O记号来谈论算法?
  • 原文地址:https://www.cnblogs.com/failymao/p/15677782.html
Copyright © 2011-2022 走看看