atomic
包中包含了很多原子型操作。它们均基于运行时中 runtime/internal/atomic
的实现。
atomic.Value
提供了一种具备原子存取的结构。
其自身的结构非常简单:
// Value 提供了相同类型值的原子 load 和 store 操作
// 零值的 Load 会返回 nil
// 一旦 Store 被调用,Value 不能被复制
type Value struct {
v interface{}
}
它仅仅只是对要存储的值进行了一层封装。我们来看它的 Load 方法:
// ifaceWords 定义了 interface{} 的内部表示。
type ifaceWords struct {
typ unsafe.Pointer
data unsafe.Pointer
}
// Load 返回最近存储的值集合
// 如果已经没有 Value 调用 Store 则会返回 nil
func (v *Value) Load() (x interface{}) {
// 获得自身结构的指针,因为 v 存储的是任意类型
// 在 go 中,interface 的内存布局有类型指针和数据指针两部分表示
vp := (*ifaceWords)(unsafe.Pointer(v))
// 获得存储值的类型指针
typ := LoadPointer(&vp.typ)
// 如果存储的类型为 nil 或者呈正在存储的状态(全 1,在 Store 中解释)
if typ == nil || uintptr(typ) == ^uintptr(0) {
// 则说明 Value 当前没有保存值
return nil
}
// 否则从 data 字段中读取数据
data := LoadPointer(&vp.data)
xp := (*ifaceWords)(unsafe.Pointer(&x))
// 将复制得到的 typ 给到 x
xp.typ = typ
// 将复制出来的 data 给到 x
xp.data = data
return
}
从这个 Load 方法中我们了解到了 Go 中的 interface{}
本质上有两段内容组成,一个是 type 区域,另一个是实际的数据区域。
这个 Load 方法的实现,本质上就是将内部存储的类型和数据都复制一份并返回(避免逃逸)。
再来看 Store。
// Store 将 Value 的值设置为 x
// Store 的 Value x 必须为相同的类型
// Store 不同类型会导致 panic,nil 也是如此
func (v *Value) Store(x interface{}) {
// nil 直接 panic
if x == nil {
panic("sync/atomic: store of nil value into Value")
}
// Value 存储值的指针
vp := (*ifaceWords)(unsafe.Pointer(v))
// 要存储的 x 的指针
xp := (*ifaceWords)(unsafe.Pointer(&x))
for {
// 读 Value 存储值的类型
typ := LoadPointer(&vp.typ)
// 如果类型还是 nil
if typ == nil {
// 说明这是第一次存储
// 禁止当前 goroutine 可以被抢占,来保证第一次存储顺利完成
// 否则会导致 GC 发现一个假类型
runtime_procPin()
// 先存一个标志位(全 1)
if !CompareAndSwapPointer(&vp.typ, nil, unsafe.Pointer(^uintptr(0))) {
// 如果没有成功,则标志为可抢占,下次再试
runtime_procUnpin()
continue
}
// 如果标志位设置成功,则将数据存入
StorePointer(&vp.data, xp.data)
StorePointer(&vp.typ, xp.typ)
// 存储成功,再标志位可抢占,直接返回
runtime_procUnpin()
return
}
// 如果第一次保存正在进行,则等待 continue
if uintptr(typ) == ^uintptr(0) {
continue
}
// 第一次存储完成,检查类型是否正确,不正确直接 panic
if typ != xp.typ {
panic("sync/atomic: store of inconsistently typed value into Value")
}
// 不替换类型,直接保存数据
StorePointer(&vp.data, xp.data)
return
}
}
可以看到 atomic.Value
的存取通过 unsafe.Pointer(^uintptr(0))
作为第一次存取的标志位,当 atomic.Value
进行第一次存储时,会将当前 goroutine 设置为不可抢占,并将要存储类型进行标记,再存入实际的数据与类型。当存储完毕后,即可解除不可抢占,返回。
在不可抢占期间,有并发的 goroutine 再此存储时,如果标记没有被类型替换掉,则说明第一次存储还未完成,由 for 循环进行等待。
sync.Map 中大量运用了 atomic.CompareAndSwapPointer
,其上下文情景中具有 for 循环,这实质上是 CAS 算法:
for {
复制旧数据
基于旧数据构造新数据
if CompareAndSwap(内存地址,旧数据,新数据) {
break
}
}
CompareAndSwapPointer
操作假设内存地址中的数据是旧数据,如果确实是旧数据,则替换为新数据,否则下次再试,从而达到无锁情况下原子操作的目的。
借助于 atomic.CompareAndSwapPointer
,我们就能轻易实现这种无锁型算法。
我们简单看过了两个属于公共包的方法 atomic.Value
和 atomic.CompareAndSwapPointer
,我们来看一下运行时实现:
//go:linkname sync_atomic_CompareAndSwapUintptr sync/atomic.CompareAndSwapUintptr
func sync_atomic_CompareAndSwapUintptr(ptr *uintptr, old, new uintptr) bool
//go:linkname sync_atomic_CompareAndSwapPointer sync/atomic.CompareAndSwapPointer
//go:nosplit
func sync_atomic_CompareAndSwapPointer(ptr *unsafe.Pointer, old, new unsafe.Pointer) bool {
if writeBarrier.enabled {
atomicwb(ptr, new)
}
return sync_atomic_CompareAndSwapUintptr((*uintptr)(noescape(unsafe.Pointer(ptr))), uintptr(old), uintptr(new))
}
可以看到该函数在运行时中是没有方法本体的,说明其实现由编译器完成。那么我们来看一下编译器究竟干了什么:
package main
import (
"sync/atomic"
"unsafe"
)
func main() {
var p unsafe.Pointer
newP := 42
atomic.CompareAndSwapPointer(&p, nil, unsafe.Pointer(&newP))
v := (*int)(p)
println(*v)
}
编译结果:
TEXT sync/atomic.CompareAndSwapUintptr(SB) /usr/local/Cellar/go/1.11/libexec/src/sync/atomic/asm.s
asm.s:31 0x1001070 e91b0b0000 JMP runtime/internal/atomic.Casuintptr(SB)
:-1 0x1001075 cc INT $0x3
(...)
TEXT runtime/internal/atomic.Casuintptr(SB) /usr/local/Cellar/go/1.11/libexec/src/runtime/internal/atomic/asm_amd64.s
asm_amd64.s:44 0x1001b90 e9dbffffff JMP runtime/internal/atomic.Cas64(SB)
:-1 0x1001b95 cc INT $0x3
(...)
可以看到 atomic.CompareAndSwapUintptr
本质上转到了 runtime/internal/atomic.Cas64
,我们来看一下它的实现:
// bool runtime∕internal∕atomic·Cas64(uint64 *val, uint64 old, uint64 new)
// Atomically:
// if(*val == *old){
// *val = new;
// return 1;
// } else {
// return 0;
// }
TEXT runtime∕internal∕atomic·Cas64(SB), NOSPLIT, $0-25
MOVQ ptr+0(FP), BX
MOVQ old+8(FP), AX
MOVQ new+16(FP), CX
LOCK
CMPXCHGQ CX, 0(BX)
SETEQ ret+24(FP)
RET
可以看到,实现的本质是使用 CPU 的 LOCK
+CMPXCHGQ
指令:首先将 ptr 的值放入 BX,将假设的旧值放入 AX,
要比较的新值放入 CX。然后 LOCK CMPXCHGQ 与累加器 AX 比较并交换 CX 和 BX。
因此原子操作本质上均为使用 CPU 指令进行实现(理所当然)。由于原子操作的方式比较单一,很容易举一反三, 其他操作不再穷举。
Go under the hood | CC-BY-NC-ND 4.0 & MIT © changkun