zoukankan      html  css  js  c++  java
  • Golang并发模型:轻松入门流水线FAN模式

     前一篇文章《Golang并发模型:轻松入门流水线模型》,介绍了流水线模型的概念,这篇文章是流水线模型进阶,介绍FAN-IN和FAN-OUT,FAN模式可以让我们的流水线模型更好的利用Golang并发,提高软件性能。但FAN模式不一定是万能,不见得能提高程序的性能,甚至还不如普通的流水线。我们先介绍下FAN模式,再看看它怎么提升性能的,它是不是万能的。

    FAN-IN和FAN-OUT模式

    Golang的并发模式灵感来自现实世界,这些模式是通用的,毫无例外,FAN模式也是对当前世界的模仿。以汽车组装为例,汽车生产线上有个阶段是给小汽车装4个轮子,可以把这个阶段任务交给4个人同时去做,这4个人把轮子都装完后,再把汽车移动到生产线下一个阶段。这个过程中,就有任务的分发,和任务结果的收集。其中任务分发是FAN-OUT,任务收集是FAN-IN。

    • FAN-OUT模式:多个goroutine从同一个通道读取数据,直到该通道关闭。OUT是一种张开的模式,所以又被称为扇出,可以用来分发任务。
    • FAN-IN模式:1个goroutine从多个通道读取数据,直到这些通道关闭。IN是一种收敛的模式,所以又被称为扇入,用来收集处理的结果。

    fan-in和fan-out.png

    FAN-IN和FAN-OUT实践

    我们这次试用FAN-OUT和FAN-IN,解决《Golang并发模型:轻松入门流水线模型》中提到的问题:计算一个整数切片中元素的平方值并把它打印出来。

    • producer()保持不变,负责生产数据。
    • squre()也不变,负责计算平方值。
    • 修改main(),启动3个square,这3个squre从producer生成的通道读数据,这是FAN-OUT。
    • 增加merge(),入参是3个square各自写数据的通道,给这3个通道分别启动1个协程,把数据写入到自己创建的通道,并返回该通道,这是FAN-IN。

    FAN模式流水线示例

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    package main

    import (
    "fmt"
    "sync"
    )

    func producer(nums ...int) <-chan int {
    out := make(chan int)
    go func() {
    defer close(out)
    for _, n := range nums {
    out <- n
    }
    }()
    return out
    }

    func square(inCh <-chan int) <-chan int {
    out := make(chan int)
    go func() {
    defer close(out)
    for n := range inCh {
    out <- n * n
    }
    }()

    return out
    }

    func merge(cs ...<-chan int) <-chan int {
    out := make(chan int)

    var wg sync.WaitGroup

    collect := func(in <-chan int) {
    defer wg.Done()
    for n := range in {
    out <- n
    }
    }

    wg.Add(len(cs))
    // FAN-IN
    for _, c := range cs {
    go collect(c)
    }

    // 错误方式:直接等待是bug,死锁,因为merge写了out,main却没有读
    // wg.Wait()
    // close(out)

    // 正确方式
    go func() {
    wg.Wait()
    close(out)
    }()

    return out
    }

    func main() {
    in := producer(1, 2, 3, 4)

    // FAN-OUT
    c1 := square(in)
    c2 := square(in)
    c3 := square(in)

    // consumer
    for ret := range merge(c1, c2, c3) {
    fmt.Printf("%3d ", ret)
    }
    fmt.Println()
    }

    3个squre协程并发运行,结果顺序是无法确定的,所以你得到的结果,不一定与下面的相同。

    1
    2
    ➜  awesome git:(master) ✗ go run hi.go
    1 4 16 9

    FAN模式真能提升性能吗?

    相信你心里已经有了答案,可以的。我们还是使用老问题,对比一下简单的流水线和FAN模式的流水线,修改下代码,增加程序的执行时间:

    • produer()使用参数生成指定数量的数据。
    • square()增加阻塞操作,睡眠1s,模拟阶段的运行时间。
    • main()关闭对结果数据的打印,降低结果处理时的IO对FAN模式的对比。

    普通流水线

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    // hi_simple.go

    package main

    import (
    "fmt"
    )

    func producer(n int) <-chan int {
    out := make(chan int)
    go func() {
    defer close(out)
    for i := 0; i < n; i++ {
    out <- i
    }
    }()
    return out
    }

    func square(inCh <-chan int) <-chan int {
    out := make(chan int)
    go func() {
    defer close(out)
    for n := range inCh {
    out <- n * n
    // simulate
    time.Sleep(time.Second)
    }
    }()

    return out
    }

    func main() {
    in := producer(10)
    ch := square(in)

    // consumer
    for _ = range ch {
    }
    }

    使用FAN模式的流水线

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    // hi_fan.go
    package main

    import (
    "sync"
    "time"
    )

    func producer(n int) <-chan int {
    out := make(chan int)
    go func() {
    defer close(out)
    for i := 0; i < n; i++ {
    out <- i
    }
    }()
    return out
    }

    func square(inCh <-chan int) <-chan int {
    out := make(chan int)
    go func() {
    defer close(out)
    for n := range inCh {
    out <- n * n
    // simulate
    time.Sleep(time.Second)
    }
    }()

    return out
    }

    func merge(cs ...<-chan int) <-chan int {
    out := make(chan int)

    var wg sync.WaitGroup

    collect := func(in <-chan int) {
    defer wg.Done()
    for n := range in {
    out <- n
    }
    }

    wg.Add(len(cs))
    // FAN-IN
    for _, c := range cs {
    go collect(c)
    }

    // 错误方式:直接等待是bug,死锁,因为merge写了out,main却没有读
    // wg.Wait()
    // close(out)

    // 正确方式
    go func() {
    wg.Wait()
    close(out)
    }()

    return out
    }

    func main() {
    in := producer(10)

    // FAN-OUT
    c1 := square(in)
    c2 := square(in)
    c3 := square(in)

    // consumer
    for _ = range merge(c1, c2, c3) {
    }
    }

    多次测试,每次结果近似,结果如下:

    • FAN模式利用了7%的CPU,而普通流水线CPU只使用了3%,FAN模式能够更好的利用CPU,提供更好的并发,提高Golang程序的并发性能。
    • FAN模式耗时4s,普通流水线耗时10s。在协程比较费时时,FAN模式可以减少程序运行时间,同样的时间,可以处理更多的数据。
    1
    2
    3
    4
    5
    ➜  awesome git:(master) ✗ time go run hi_simple.go
    go run hi_simple.go 0.17s user 0.18s system 3% cpu 10.389 total
    ➜ awesome git:(master) ✗
    ➜ awesome git:(master) ✗ time go run hi_fan.go
    go run hi_fan.go 0.17s user 0.16s system 7% cpu 4.288 total

    也可以使用Benchmark进行测试,看2个类型的执行时间,结论相同。为了节约篇幅,这里不再介绍,方法和结果贴在Gist了,想看的朋友瞄一眼,或自己动手搞搞。

    FAN模式一定能提升性能吗?

    FAN模式可以提高并发的性能,那我们是不是可以都使用FAN模式?

    不行的,因为FAN模式不一定能提升性能。

    依然使用之前的问题,再次修改下代码,其他不变:

    • squre()去掉耗时。
    • main()增加producer()的入参,让producer生产10,000,000个数据。

    简单版流水线修改代码

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    // hi_simple.go

    func square(inCh <-chan int) <-chan int {
    out := make(chan int)
    go func() {
    defer close(out)
    for n := range inCh {
    out <- n * n
    }
    }()

    return out
    }

    func main() {
    in := producer(10000000)
    ch := square(in)

    // consumer
    for _ = range ch {
    }
    }

    FAN模式流水线修改代码

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    // hi_fan.go
    package main

    import (
    "sync"
    )

    func square(inCh <-chan int) <-chan int {
    out := make(chan int)
    go func() {
    defer close(out)
    for n := range inCh {
    out <- n * n
    }
    }()

    return out
    }

    func main() {
    in := producer(10000000)

    // FAN-OUT
    c1 := square(in)
    c2 := square(in)
    c3 := square(in)

    // consumer
    for _ = range merge(c1, c2, c3) {
    }
    }

    结果,可以跑多次,结果近似:

    1
    2
    3
    4
    ➜  awesome git:(master) ✗ time go run hi_simple.go    
    go run hi_simple.go 9.96s user 5.93s system 168% cpu 9.424 total
    ➜ awesome git:(master) ✗ time go run hi_fan.go
    go run hi_fan.go 23.35s user 11.51s system 297% cpu 11.737 total

    从这个结果,我们能看到2点。

    • FAN模式可以提高CPU利用率。
    • FAN模式不一定能提升效率,降低程序运行时间。

    优化FAN模式

    既然FAN模式不一定能提高性能,如何优化?

    不同的场景优化不同,要依具体的情况,解决程序的瓶颈。

    我们当前程序的瓶颈在FAN-IN,squre函数很快就完成,merge函数它把3个数据写入到1个通道的时候出现了瓶颈,适当使用带缓冲通道可以提高程序性能,再修改下代码

    • merge()中的out修改为:

      1
      out := make(chan int, 100)

    结果:

    1
    2
    ➜  awesome git:(master) ✗ time go run hi_fan_buffered.go 
    go run hi_fan_buffered.go 19.85s user 8.19s system 323% cpu 8.658 total

    使用带缓存通道后,程序的性能有了较大提升,CPU利用率提高到323%,提升了8%,运行时间从11.7降低到8.6,降低了26%。

    FAN模式的特点很简单,相信你已经掌握了,如果记不清了看这里,本文所有代码在该Github仓库

    FAN模式很有意思,并且能提高Golang并发的性能,如果想以后运用自如,用到自己的项目中去,还是要写写自己的Demo,快去实践一把。

    完整示例代码

    本文所有代码都在仓库,可查看完整示例代码:https://github.com/Shitaibin/golang_pipeline_step_by_step

    原文章转摘自:

    https://github.com/Shitaibin

    https://lessisbetter.site/2018/11/28/golang-pipeline-fan-model/

    并发系列文章推荐

  • 相关阅读:
    Redis缓存穿透和雪崩
    Redis主从复制
    Redis发布订阅
    IO多路复用
    Synchronized解读
    日志导致jvm内存溢出相关问题
    tomcat及springboot实现Filter、Servlet、Listener
    MySQL主从复制针对trigger的特殊处理
    二、变量/常量/数据类型
    Ubuntu21.04 / Linux Mint20.2 安装 TradingView分析软件
  • 原文地址:https://www.cnblogs.com/show58/p/12674524.html
Copyright © 2011-2022 走看看