zoukankan      html  css  js  c++  java
  • Golang slice、array 源码

    前言​

      在golang中有很多的数据结构是很常用的数据结构,比如array,slice,map等,其中最为常用的就是array和slice还有map了,理论上来讲array和slice在数据结构上是一种结构,都是顺序结构,但是由于array的固定长度特性,在有些时候对于需要动态的长度的使用情况很不友好,此时就需要利用slice进行对固定长度数组的代替。

    什么是Slice

    官方解释如下:
    
    ​   Slices wrap arrays to give a more general, powerful, and convenient interface to sequences of data. Except for items with explicit dimension such as transformation matrices, most array programming in Go is done with slices rather than simple arrays.
    
    大概意思如下:
    
      Slice是一个经过包装的array,其可为数据序列提供更通用,更强大和更方便的接口。 除了具有明确维数的项(例如转换矩阵)外,Go中的大多数数组编程都是使用切片而不是简单数组完成的。

      切片个人认为有点像c++标准库中的vector,只不过是底层的实现方式可能有些许不同(不太了解c++,如果有大佬知道vector的底层实现的话,可以解惑一下),slice是一个把go数组进行了包装的一个结构体,但是这个结构体只是在编译等其他层面能看到,在我们使用过程中只需要像定义数组那样定义就可以在编译期间被转换为slice结构体。接下来我来解析一下slice的相关结构体源代码以及操作源代码。

    代码解析

    slice的结构体

     1 // slice 结构体,这个结构体会在编译期间构建
     2 // 如果想在运行期间使用的话可以使用其对应的reflect结构体
     3 // 即reflect.SliceHeader
     4 type slice struct {
     5     // 一个指向底层数组的指针
     6     array unsafe.Pointer
     7     // slice当前元素个数 即len()时返回的数
     8     len   int
     9     // slice的容量 即cap()时返回的数
    10     cap   int
    11 }

    slice的初始化

    slice的初始化方式分为三种:

    1. 下标初始化方式:a:=slice[:] // 这个slice是一个其他以创建好的slice。这种创建方式时最接近底层的创建方式,在编译期间该语句会被转换为编译器的OpSliceMake操作,该操作会调用SliceMake操作,SliceMake操作会接受四个参数创建新的切片,元素类型、数组指针、切片大小和容量,这与上一章所展示的slice的结构体的字段构成相同,另外下标初始化方式不会对原数组中的数据进行复制,而是直接引用指向原数组的指针,这会导致在修改切片a时,对原切片slice也会产生影响。
    2. 字面量初始化方式:```a:=[]int{1,2,3}``,过程如下
    • 该方法在编译期间创建首先会生成一个长度为3(该长度根据字面量数量自动推断)的数组
    • 给这个数组的元素进行赋值
    • 而后会new出一个新的长度为3(该长度根据字面量数量
    • 自动推断)的数组的指针
    • 将这个指针按照最基本的下标初始化方式进行赋值给slice
    1 var arr [3]int
    2 arr[0] = 1
    3 arr[1] = 2
    4 arr[2] = 3
    5 var arrp *[3]int = new([3]int)
    6 *arrp = arr
    7 slice := arrp[:]

      3. 通过关键字make([]int,3,3)创建切片:通过make关键字进行切片初始化,首先会在编译阶段对其传入的len与cap进行校验,校验其是否为负值,是否len>cap,并且通过判断切片的大小以及是否逃逸来确定其是否会初始化在堆上,如果当切片足够小并且没有发生逃逸时,会创建一个cap值的数组,然后像字面量初始化方式一样对其进行初始化,如果cap为0,则按照len的值创建对应长度的数组。如果发生逃逸或者切片过大时,会调用runtime.makeslice()函数进行堆上的切片内存分配。runtime.makeslice代码如下:

     1 // 该函数传入需要初始化的切片的类型,长度以及容量,返回的指针会通过调用方组建成一个完成的slice结构体
     2 func makeslice(et *_type, len, cap int) unsafe.Pointer {
     3   // 判断类型,和容量的乘积会不会超过可分配内存的大小,以及长度是否为0和容量是否小于长度
     4     mem, overflow := math.MulUintptr(et.size, uintptr(cap))
     5     if overflow || mem > maxAlloc || len < 0 || len > cap {
     6         mem, overflow := math.MulUintptr(et.size, uintptr(len))
     7         if overflow || mem > maxAlloc || len < 0 {
     8             panicmakeslicelen()
     9         }
    10         panicmakeslicecap()
    11     }
    12     // 如果都正常,则调用此函数申请返回一个连续 切片中元素大小×切片容量 长度的内存空间的指针
    13     return mallocgc(mem, et, true)
    14 }

    访问元素

      slice的访问元素是通过slice结构体中

    对应索引的元素地址=指向底层数组的指针+对应元素的占用字节数∗索引

      编译器会通过对应索引的元素地址返回其中对应的值,即直接进行地址访问

    追加和扩容

    ​  slice相比于array的一大优点就是可以根据使用情况动态的进行扩容,来适应随时增加的数据,在追加时,通过调用append函数来针对slice进行尾部追加,如果此时slice的cap值小于当前len加上append中传入值的数量,那么就会出发扩容操作,append函数没有明确的函数体,而是通过编译期间被转换。当append发现需要扩容时,则会调用runtime.growslice方法,该方法源代码如下(以去除一些无用代码):

     1 func growslice(et *_type, old slice, cap int) slice {
     2     // 如果需求的容量小于就容量则报错
     3   // 理论上来讲不应该出现这个问题
     4     if cap < old.cap {
     5         panic(errorString("growslice: cap out of range"))
     6     }
     7     // append 没法创建一个nil指针的但是len不为0的切片
     8     if et.size == 0 {
     9         return slice{unsafe.Pointer(&zerobase), old.len, cap}
    10     }
    11     
    12     newcap := old.cap
    13     doublecap := newcap + newcap
    14   // 如果需求容量大于双倍的旧容量那就直接使用需求容量
    15     if cap > doublecap {
    16         newcap = cap
    17     } else {
    18     // 如果当前len小于1024则容量直接翻倍,否则按照1.25倍去递增直到满足需求容量
    19         if old.len < 1024 {
    20             newcap = doublecap
    21         } else {
    22             for 0 < newcap && newcap < cap {
    23                 newcap += newcap / 4
    24             }
    25             if newcap <= 0 {
    26                 newcap = cap
    27             }
    28         }
    29     }
    30 
    31     var overflow bool
    32     var lenmem, newlenmem, capmem uintptr
    33 // 在扩容时不能单单按照len来判断扩容所需要的内存长度
    34 // 还要根据切片的元素类型去进行内存对齐
    35 // 当元素的占用字节数为1,8 或者2的倍数时会进行内存对对齐
    36 // 内存对齐策略按照向上取整方式进行
    37 // 取整的目标时go内存分配策略中67个class分页中的大小进行取整
    38     switch {
    39     case et.size == 1:
    40         lenmem = uintptr(old.len)
    41         newlenmem = uintptr(cap)
    42         capmem = roundupsize(uintptr(newcap))
    43         overflow = uintptr(newcap) > maxAlloc
    44         newcap = int(capmem)
    45     case et.size == sys.PtrSize:
    46         lenmem = uintptr(old.len) * sys.PtrSize
    47         newlenmem = uintptr(cap) * sys.PtrSize
    48         capmem = roundupsize(uintptr(newcap) * sys.PtrSize)
    49         overflow = uintptr(newcap) > maxAlloc/sys.PtrSize
    50         newcap = int(capmem / sys.PtrSize)
    51     case isPowerOfTwo(et.size):
    52         var shift uintptr
    53         if sys.PtrSize == 8 {
    54             // Mask shift for better code generation.
    55             shift = uintptr(sys.Ctz64(uint64(et.size))) & 63
    56         } else {
    57             shift = uintptr(sys.Ctz32(uint32(et.size))) & 31
    58         }
    59         lenmem = uintptr(old.len) << shift
    60         newlenmem = uintptr(cap) << shift
    61         capmem = roundupsize(uintptr(newcap) << shift)
    62         overflow = uintptr(newcap) > (maxAlloc >> shift)
    63         newcap = int(capmem >> shift)
    64     default:
    65         lenmem = uintptr(old.len) * et.size
    66         newlenmem = uintptr(cap) * et.size
    67         capmem, overflow = math.MulUintptr(et.size, uintptr(newcap))
    68         capmem = roundupsize(capmem)
    69         newcap = int(capmem / et.size)
    70     }
    71 
    72 // 如果所需要的内存超过了最大可分配内存则panic
    73     if overflow || capmem > maxAlloc {
    74         panic(errorString("growslice: cap out of range"))
    75     }
    76 
    77     var p unsafe.Pointer
    78   // 如果当前元素类型不是指针,则会将超出切片当前长度的位置清空
    79   // 并在最后使用 将原数组内存中的内容拷贝到新申请的内存中。
    80     if et.ptrdata == 0 {
    81         p = mallocgc(capmem, nil, false)
    82         memclrNoHeapPointers(add(p, newlenmem), capmem-newlenmem)
    83     } else {
    84     // 如果是指针会根据进行gc方面对其进行加以保护以免空指针在分配期间被gc回收
    85         p = mallocgc(capmem, et, true)
    86         if lenmem > 0 && writeBarrier.enabled {
    87             bulkBarrierPreWriteSrcOnly(uintptr(p), uintptr(old.array), lenmem-et.size+et.ptrdata)
    88         }
    89     }
    90     memmove(p, old.array, lenmem)
    91     //该函数最终会返回一个新的切片
    92     return slice{p, old.len, newcap}
    93 }

    slice的拷贝

      slice的拷贝也是针对切片提供的接口,可以通过调用copy()函数将src切片中的值拷贝到dst切片中,通过该函数进行的切片拷贝后,针对dst切片进行的操作不会对src产生任何的影响,其拷贝长度是按照src与dst切片中最小的len长度去计算的,runtime.slicecopy源代码如下:

    func slicecopy(toPtr unsafe.Pointer, toLen int, fmPtr unsafe.Pointer, fmLen int, width uintptr) int {
        if fmLen == 0 || toLen == 0 {
            return 0
        }
    
        n := fmLen
        if toLen < n {
            n = toLen
        }
    
        if width == 0 {
            return n
        }
        
        size := uintptr(n) * width
        if size == 1 {  
        // 如果就1个元素 直接赋值过去就好了
            *(*byte)(toPtr) = *(*byte)(fmPtr)
        } else {
        // 直接进行内存的拷贝,如果slice数据量过大将会影响性能
            memmove(toPtr, fmPtr, size)
        }
        return n
    }
    you are the best!
  • 相关阅读:
    Eclipse使用之将Git项目转为Maven项目, ( 注意: 最后没有pom.xml文件的, 要转化下 )
    静态类型语言,动态类型语言的区别
    UT, FT ,E2E 测试的意思
    git tag 用法 功能作用
    java 常用异常及作用
    git checkout -b 分支name 分支的新建, 切换, 删除, 查看
    项目上有红色感叹号, 一般就是依赖包有问题, remove依赖,重新加载,maven的也行可认删除,自己也会得新加载
    密码学初级教程(五)消息认证码MAC-Message Authentication Code
    密码学初级教程(六)数字签名 Digital Signature
    密码学初级教程(四)单向散列函数-指纹-
  • 原文地址:https://www.cnblogs.com/linguoguo/p/15490195.html
Copyright © 2011-2022 走看看