浅谈Golang Slice切片如何扩容的实现
一、Slice数据结构是什么?
切片(slice)是 Golang 中一种比较特殊的数据结构,这种数据结构更便于使用和管理数据集合。切片是围绕动态数组的概念构建的,可以按需自动增长和缩小。切片(slice)是可以看做是一个长度可变的数组。
切片(slice)自身并不是动态数组或者数组指针。它内部实现的数据结构通过指针引用底层数组,设定相关属性将数据读写操作限定在指定的区域内。
切片(slice)是对数组一个连续片段的引用,所以切片是一个引用类型。
二、详细代码
1.数据结构
slice的结构体由3部分构成,Pointer 是指向一个数组的指针,len 代表当前切片的长度,cap 是当前切片的容量。cap 总是大于等于 len 的。
通常我们在对 slice 进行 append 等操作时,可能会造成slice的自动扩容。
代码如下(示例):
type slice struct { array unsafe.Pointer len int cap int }
2.扩容原则
- 如果切片的容量小于1024个元素,那么扩容的时候slice的cap就乘以2;一旦元素个数超过1024个元素,增长因子就变成1.25,即每次增加原来容量的四分之一。
- 如果扩容之后,还没有触及原数组的容量,那么,切片中的指针指向的位置,就还是原数组,如果扩容之后,超过了原数组的容量,那么,Go就会开辟一块新的内存,把原来的值拷贝过来,这种情况丝毫不会影响到原数组。
3.如何理解扩容规则一
规则一:
如果切片的容量小于1024个元素,那么扩容的时候slice的cap就乘以2;一旦元素个数超过1024个元素,增长因子就变成1.25,即每次增加原来容量的四分之一。
1.当小于1024个元素时
代码如下(示例):
func main() { // 建立容量为 2 的 切片 addCap := make([]string, 0, 2) // 插入一个数,占一个容量 addCap = append(addCap, "1") // 打印此时的地址 fmt.Println("addCap 1", addCap, cap(addCap), &addCap[0]) // 插入一个数,占一个容量 // 再打印此时的地址 addCap = append(addCap, "1") fmt.Println("addCap 2", addCap, cap(addCap), &addCap[0]) // 插入一个数,占一个容量 // 再打印此时的地址 addCap = append(addCap, "1") // 此时三个数已经超出容量,那么切片容量将扩容,此时地址也将变成新的地址 fmt.Println("addCap 3", addCap, cap(addCap), &addCap[0]) }
结果(示例):
2.当大于1024个元素时
代码如下(示例):
func main() { // 建立容量为 1022 的 切片 addCap1024 := make([]int, 1022, 1024) // 插入一个数,占一个容量 容量 1023 addCap1024 = append(addCap1024, 1) // 打印此时的地址 fmt.Println("addCap1024 1", cap(addCap1024), &addCap1024[0]) // 插入一个数,占一个容量 // 再打印此时的地址 addCap1024 = append(addCap1024, 1) fmt.Println("addCap1024 2", cap(addCap1024), &addCap1024[0]) // 插入一个数,占一个容量 // 再打印此时的地址 addCap1024 = append(addCap1024, 1) // 此时三个数已经超出容量1024,那么切片容量将扩容,此时地址也将变成新的地址 fmt.Println("addCap1024 3", cap(addCap1024), &addCap1024[0]) }
结果(示例):
此时容量Cap 增加了 1280 - 1024 = 256 ,也就是 1024 的 25 %
即 增长因子就变成1.25,即每次增加原来容量的四分之一。
4.如何理解扩容规则二
规则一:
如果扩容之后,还没有触及原数组的容量,那么,切片中的指针指向的位置,就还是原数组,如果扩容之后,超过了原数组的容量,那么,Go就会开辟一块新的内存,把原来的值拷贝过来,这种情况丝毫不会影响到原数组。
1.简单理解内存地址更换
代码如下(示例):
func main() { // 建立容量为 2 的 切片 addCap := make([]string, 0, 2) // 插入一个数,占一个容量 addCap = append(addCap, "1") // 打印此时的地址 fmt.Println("addCap 1", addCap, cap(addCap), &addCap[0]) // 插入一个数,占一个容量 // 再打印此时的地址 addCap = append(addCap, "1") fmt.Println("addCap 2", addCap, cap(addCap), &addCap[0]) // 将 oth 的指针指向切片地址 // 再打印此时的地址 和 addCap 一样,即未触及容量时,还是原数组 oth := addCap[0:1] fmt.Println("oth 1",oth,cap(oth),&oth[0]) //此时修改原数组 oth 所指向的地址不变,但第一个数的值已经更改 3 addCap[0] = "3" fmt.Println("oth 2",oth,cap(oth),&oth[0]) // 插入一个数,占一个容量 // 再打印此时的地址 addCap = append(addCap, "1") //此时再修改 已经是扩容后的新地址 原数组将保持不变 即oth 所指向的地址的值不变 addCap[0] = "4" // 此时三个数已经超出容量,那么切片容量将扩容,此时地址也将变成新的地址,第一个数也将修改为 4 fmt.Println("addCap 3", addCap, cap(addCap), &addCap[0]) // 但 oth 依然保留着原数组的指针地址,所以依然还是 3 fmt.Println("oth 3",oth,cap(oth),&oth[0]) }
结果(示例):
此时容量Oth 指向原切片位置,而扩容后的新的切片指向了新的位置,做的修改将无法影响原切片。
总结
通过以上两个例子可以轻松了解在Golang中切片扩容的主要形式。而因为切片的底层也是是在连续的内存块中分配的,所以切片还能获得索引、迭代以及为垃圾回收优化的好处,非常适合我们深入学习。