指针使用总结

2023-04-15T14:11:51+08:00

skyler

写这篇文章的目的是记录一下平时在使用golang的过程中对于指针和值这两个概念的理解。虽然golang是值传递，但是在使用的过程中还是会有需要注意的点。

结构体的方法定义与结构体的初始化

2个问题

给结构体定义方法的时候是使用指针还是使用值
使用结构体的时候是初始化指针还是值

这2个问题经过叉乘就变成了4个问题

使用值定义的结构体方法，初始化的时候也是使用的值
使用值定义的结构体方法，初始化的时候使用的是指针
使用指针定义的结构体方法，初始化的时候也是使用的指针
使用指针定义的结构体方法，初始化的时候使用的是值

我们一个个看

使用值定义的结构体方法，初始化的时候也是使用的值

type Test1 struct {
	Val int
}

func (t Test1) Set(new int) {
	t.Val = new
}

func main() {
	test := Test1{Val: 1}
	test.Set(10)
	fmt.Println(test.Val)
}

结果

这种情况比较好理解，在调用Set的时候相当于把一个Test1的副本传给了函数，因此修改只在函数内生效，在函数外不生效。

使用值定义的结构体方法，初始化的时候使用的是指针

type Test2 struct {
	Val int
}

func (t Test2) Set(new int) {
	t.Val = new
}

func main() {
	test := &Test2{Val: 1}
	test.Set(10)
	fmt.Println(test.Val)
}

结果

从结果来看，调用Set的时候相当于把一个Test2对应的结构体的副本传给了函数，而不是把Test2这个指针的副本，为了验证这个猜想，我们修改一下代码，在main和Set里面打印出结构体的地址

type Test2 struct {
	Val int
}

func (t Test2) Set(new int) {
	fmt.Printf("in set %p\n", &t)
	t.Val = new
}

func main() {
	test := &Test2{Val: 1}
	fmt.Printf("in main %p\n", &(*test))
	test.Set(10)
}

结果

in main 0xc0000120b8
in set 0xc0000120c8

我们的猜想是对的，虽然在外面定义的是指针，但是定义方法的时候使用的是值，在调用的时候会复制指针对应的值复制给方法，而不是复制指针自身

使用指针定义的结构体方法，初始化的时候也是使用的指针

package main

import "fmt"

type Test3 struct {
	Val int
}

func (t *Test3) Set(new int) {
	t.Val = new
}

func main() {
	test := &Test3{Val: 1}
	test.Set(10)
	fmt.Println(test.Val)
}

结果

但是有个疑问，传递给函数的是指针还是指针的副本呢？我觉得应该是指针的副本，还是验证一下把

package main

import "fmt"

type Test3 struct {
	Val int
}

func (t *Test3) Set(new int) {
	fmt.Printf("in set %p\n", t)
	t.Val = new
}

func main() {
	test := &Test3{Val: 1}
	fmt.Printf("in main %p\n", test)
	test.Set(10)
}

in main 0xc000090020
in set 0xc000090020

我想当然了，并不会复制，而是直接使用的原指针。想想也合理，如果在这个地方复制一个指针没有任何意义。。。

使用指针定义的结构体方法，初始化的时候使用的是值

package main

import "fmt"

type Test4 struct {
	Val int
}

func (t *Test4) Set(new int) {
	t.Val = new
}

func main() {
	test := Test4{Val: 1}
	test.Set(10)
	fmt.Println(test.Val)
}

结果

之前有看过别人的blog，说是这种情况会panic，但是我得到的结果是修改成功了，可能是go的版本不一致导致的把，我使用的是1.20版本。从结果看函数获取的应该是外面结构体的地址，我们修改代码来验证一下

package main

import "fmt"

type Test4 struct {
	Val int
}

func (t *Test4) Set(new int) {
	fmt.Printf("in set %p\n", t)
	t.Val = new
}

func main() {
	test := Test4{Val: 1}
	fmt.Printf("in main %p\n", &test)
	test.Set(10)
}

结果

in main 0xc000094020
in set 0xc000094020

证明我们的猜想是对的，这种情况会把结构体的地址传递给函数。

我们可以得出结论是：对于结构体内部的数据修改是否成功取决于定义函数的方式是使用的指针还是值，使用指针定义才会修改成功，与初始化结构体的方式没有关系。初始化的方式决定了下层函数是否与当前函数使用的是同一个数值，我们再看个例子

package main

import (
	"sync"
)

func main() {
	wg := sync.WaitGroup{}
	wg.Add(2)

	for i := 0; i < 2; i++ {
		go func(wg sync.WaitGroup) {
			defer wg.Done()
		}(wg)
	}

	wg.Wait()
}

结果

fatal error: all goroutines are asleep - deadlock!

因为初始化是使用的是值，所以传递给协程的是值得副本，wg.Add(2)与wg.Done()这两个wg是不一样的。要想改很简单，改成指针就好了

package main

import (
	"sync"
)

func main() {
	wg := &sync.WaitGroup{}
	wg.Add(2)

	for i := 0; i < 2; i++ {
		go func(wg *sync.WaitGroup) {
			defer wg.Done()
		}(wg)
	}

	wg.Wait()
}

或者干脆作为闭包使用外面的公共变量

func main() {
	wg := sync.WaitGroup{}
	wg.Add(2)

	for i := 0; i < 2; i++ {
		go func() {
			defer wg.Done()
		}()
	}

	wg.Wait()
}

也可以使用指针的方式初始化wg := &sync.WaitGroup{}，因为sync.WaitGroup的所有方法都是使用指针定义的。

闭包的引用

一个函数内引用了外部的局部变量，这种现象，就称之为闭包。

package main

import "fmt"

func toSum() func(int) int {
	sum := 0
	return func(x int) int {
		sum += x
		return sum
	}
}

func main() {
	f := toSum()
	fmt.Println(f(2))
	fmt.Println(f(2))
}

结果

2
4

首先编译器肯定会把sum这个变量分配到堆上。直观上来看sum是个具体的值，每一次调用闭包函数，sum的值都应该是0。但是从运行结果看，闭包对外部变量的引用存的是这个变量的指针而不是值。我们修改代码验证一下

package main

import "fmt"

func toSum() func(int) int {
	sum := 0
	return func(x int) int {
		fmt.Printf("%p\n", &sum)
		sum += x
		return sum
	}
}

func main() {
	f := toSum()
	f(2)
	f(2)
}

结果

0xc000090020
0xc000090020

验证了猜想，闭包对外部的变量是通过指针引用的方式建立关系的，即使变量定义的时候是个值

defer的引用

其实与上面的闭包的引用很相似，只不过之前在开发的时候在这里遇到过问题所以想记录一下，上代码

package main

import "fmt"

func toSum() int {
	sum := 0
	defer fmt.Println(sum)

	sum = 100
	return sum
}

func main() {
	toSum()
}

结果

如果改成

package main

import "fmt"

func toSum() int {
	sum := 0
	defer func() {
		fmt.Println(sum)
	}()

	sum = 100
	return sum
}

func main() {
	toSum()
}

结果

以为第一个例子是一个语句，所以在执行defer fmt.Println(sum)的时候直接复制的sum的值给fmt.Println，当时值是0，因此最终打印的也是0。第二个例子是使用了闭包，其内部保留的是对sum的应用，也就是存放的是指针，因此最终打印的是100。

map的寻址

先看一个例子

func main() {
	users := make(map[int]User)
	users[1] = User{ID: 1, Name: "John"}
	fmt.Println(users[1].Name)
	users[1].Name = "peter"
}

结果

./main.go:14:2: cannot assign to struct field users[1].Name in map

也就是说我们可以读取users[1].Name但是不能修改它。因为对值的修改本质上是对某一片内存地址的存放的数据的修改，修改前得先获取内存地址，在golang中是不允许获取map的值的地址的，我们修改一下代码

func main() {
	users := make(map[int]User)
	users[1] = User{ID: 1, Name: "John"}
	fmt.Printf("%p\n", &users[1])
}

./main.go:13:22: invalid operation: cannot take address of users[1] (map index expression of type User)

因为map在使用的过程当中可能会发生扩容，而这个扩容的过程是渐进式的，我们看一下map的结构

// map的基础数据结构
type hmap struct {
	count     int
	flags     uint8
	B         uint8
	noverflow uint16
	hash0     uint32
	buckets   unsafe.Pointer
	oldbuckets unsafe.Pointer效
	nevacuate  uintptr
	extra *mapextra
}

迁移的过程也就是逐渐的把元素从oldbuckets->buckets转移的过程，假设可以寻址修改，那么

获取了key1的地址address1
map开始扩容，并且key1已经从oldbuckets迁移到了buckets,新地址为address2
使用原始的key1的地址address1写数据。。。很显然，这是不对的。

因此结论就是map的渐进式扩容策略导致其数据不可以被寻址

正常的做法一般是先取出来赋值给一个变量，然后再把变量写回去

package main

import "fmt"

type User struct {
	ID   int
	Name string
}

func main() {
	users := make(map[int]User)
	users[1] = User{ID: 1, Name: "John"}
	user1 := users[1]
	user1.Name = "peter"
	users[1] = user1

	fmt.Println(users[1].Name)
}

结果

peter

这种方式很好理解，其实还有另外一种方式，就是使用指针作为map的值

package main

import "fmt"

type User struct {
	ID   int
	Name string
}

func main() {
	users := make(map[int]*User)
	users[1] = &User{ID: 1, Name: "John"}
	users[1].Name = "peter"

	fmt.Println(users[1].Name)
}

我们还是用最开始的例子一步步分解

获取了key1的地址address1，它的value是具体的User结构体的地址obj_address1
map开始扩容，并且key1已经从oldbuckets迁移到了buckets,新地址为address2,它的value是具体的User结构体的地址肯定也是obj_address1
使用原始的key1的地址address1写数据，其实就是对obj_address1所对应的对象就行修改，与使用address2进行修改是一样的

slice寻址

与map类似，slice在使用过程中也有可能发生扩容，那么是不是slice也是不能寻址的呢？我们先写个代码实验一下

package main

import "fmt"

func main() {
	a := make([]int, 10)
	fmt.Printf("%p\n", &a[0])
}

结果

0xc000026050

很显然，slice的元素是可以寻址的，也是可以直接修改的。因为slice的扩容是原子的，假设下面的代码会触发slice扩容

a = append(a, 1)

那么当append函数返回的时候就已经扩容好了，并不像map那样有个渐进式的过程。

上一页缓存

下一页字典和切片的扩容