GMP模型

Author： hideyoshi
发布时间：November 6, 2023
4210 views
No comments
24102 words
Categories：程序

1 概念梳理

1.1 线程

通常语义中的线程，指的是内核级线程，核心点如下

是操作系统最小调度单元
创建、销毁、调度交由内核完成，cpu需完成用户态与内核态间的切换
可充分利用多核，实现并行

1.2 协程

协程，又成为用户级线程，核心点如下

线程纯在映射关系，为M:1
创建、销毁、调度在用户太完成，对内核透明，所以更新
从属同一个线程，无法并行，一个线程阻塞会导致从属同一个线程的所有协程无法执行

1.3 Goroutine

Goroutine，经Golang优化后的特殊协程，核心特点如下：

与线程存在映射关系，为M:N
创建、销毁、调度在用户太完成，对内核透明，足够轻便
可利用多个线程，实现并行
通过调度器的斡旋、实现和线程间的动态绑定和灵活调度
栈空间大小可动态扩缩，因地制宜

2 gmp模型

GMP = goroutine + machine + processor (+ 一套有机组合的机制)，下面先单独拆出每个来解释

2.1 g

g 即 goroutine ，是golang 中对协程的抽象
g 有自己的运行栈、状态、以及执行的任务函数（用户通过go func 指定）
g 需要绑定到p才能执行，在g的视角中，p就是他的cpu

2.2 p

p即processor，是golang中的调度器
p是gmp的中枢，借由p承上启下，实现g和m之间的动态有机结合
对于g而已，p是其cpu，g只有被p调用，才得以执行
对m而言，p是执行代理，为其提供必要信息的同时（可执行的g、内存分配情况等），并隐藏了繁杂的调度细节
p的数量决定了g最大并行数量，可由用户通过GOMAXPROCS进行设定（超过cpu核数时无意义）

2.3 m

m即machine，是golang中对协程的抽象
m不直接执行g，而是先和p绑定，尤其实现代理
借由p的存在，m无需和g绑死，也无需记录g的状态信息，因此g在全生命周期中可以实现跨m执行

2.4 gmp

gmp

GMP宏观模型如上图所示，下面对其要点和细节进行逐一介绍

M 是线程的抽象；g是goroutine；p是承下启下的调度器
M调度G前，需要和P绑定
全局有多个M和多个P，但同时并行的G的最大数量等于P的数量
G的存放队列有三类；P的本地队列；全局队列；和wait队列（图中未展示，为IO阻塞就绪态goroutine队列）
M调度G时，优先取本地队列，全局队列，最后取wait队列；这样的好处是：去本地队列时，可以接近无锁化，减少全局锁竞争
放置不同P的闲忙差异过大，设立work-stealing机制，本地队列为空的P可以尝试从其他P本地独立额偷取一般的G补充到自身队列

3 核心数据结构

3.1 g

type g struct{
    // ...
    m  *m
    sched gobuf
    // ...
}

type gobuf struct{
    sp unitptr
    pc unitptr
    ret unitptr 
    bp unitptr
}

m : 在p的代理，负责执行当前g的m
sched.sp:保存CPU的rep寄存器的值，指向函数调用栈栈顶
sched.pc:保存CPU的rpi寄存器的值，指向程序下一条执行指令的地址
sched.ret:保存系统调用的返回值
sched.bp:保存CPU的rbp寄存器的是，存储函数栈针的起始位置

其中g的生命周期有以下集中状态组成：

life

const{
    _Gidle = itoa
    _Grunnable
    _Grunning
    _Gsyscall
    _Gwaiting
    _Gdead
    _Gcopystack
    _Gpreempted
}

_Gidle值为0，为协程开始创建的状态，此时尚未完成初始化
_Grunnable值为1，协程再待执行队列中，等待被执行
_Grunning值为2，协程正在执行，同一个时刻一个p中只有一个g处于此状态
_Gsyscall值为3，协程正在执行系统调用
_Gwaiting值为4，协程处于挂起状态，需要等待被唤醒 gc、channel 通信或者锁操作时经常会进入这种状态
_Gdead职位6，协程处于刚初始化完成或者已经被销毁，会处于这种状态
_Gcopaystack值为8，协程正处于扩容流程中
_Greempted值为9，协程被抢占后的状态

3.2 m

type m struct{
    g0 *g //goroutine with cheduling stack
    tls [tlsSlots]unitptr // thread-local storage
}

g0:一类特殊的调度协程，不用执行用户函数，负责执行g之间的切换调度，与m的关系为1:1
tls:hread-local storage，线程本地存储，存储内容支队当前线程可见，线程本地存储的是m.tls的地址，m.tls[0]存储的是当前运行的g，因此线程可以通过g找到当前m、p、g0等信息

3.3 p

type p struct{
    runqhead unit32
    runqtail unit32
    runq    [256]guintptr
    
    runnext guintptr
}

runq:本地goroutine队列，最大长度为256
runqhead：队列头部
runqtail：队列尾部
runnext：下一个可执行的goroutine

3.4 schedt

type schedt struct{
    //...
    lock mutex
    //...
    runq gQueue
    runqsize int32
    //...
}

sched 是全局goroutine队列的封装

lock；一把操作全局队列时使用的锁
runq：全局goroutine队列
runqsize：全局goroutine队列的容量

4 调度流程

4.1两种g的转换

g转换

如3.2小节中谈及的，goroutine的类型可以分为两类

负责调度普通g的g0，执行固定的调度流程，与m的关系一对一
负责执行用户函数的普通g

m通过p调度执行的goroutine永远在普通的g和g0之间切换，当g0找到可执行的g时，会调用gogo的方法，调度g执行用户定义的任务；当g需要主动让渡或者调度是，会触发mcall方法，将执行权重新交还个g0

gogo和mcall可以理解为对偶关心，其定义位于runtime/stubs.go文件中

func gogo(buf *gobuf)
//...
func mall(fn func(*g))

4.2 调度类型

通常，调度指的是由g0按照特定策略找到下一个可执行g的过程，而本小节谈及的调度类型是广义上的"调度"，指的是调度器p实现执行一个g切换到另一个g的过程

这种广义"调度"可分为几种类型

（1）主动调度

一种用户主动执行让渡的方式，主要方式是，用户在执行代码中调用了runtime.Gosched方法，此时当前g会当让出执行全，主动进行队列等待下次调度执行

代码位于 runtime/proc.go

func Gosched(){
    checkTimeouts()
    mcall(gosched_m)
}

（2）被动调度

因当前不满足某种执行条件，g可能会陷入阻塞态无法被调度，知道关注的条件达成后，g才从阻塞中被唤醒，重新进入可执行队列等待被调度

常见的被动调度触发方式因channel操作或互斥锁操作陷入阻塞等操作，底层会走进gopark方法

代码位于runtime/proc.go

func gopark(unlockf func(*g, unsafe.Pointer) bool, lock unsafe.Pointer, reason waitReason, traceEv byte, traceskip int) {
    // ...
    mcall(park_m)
}

goready方法通常与gopark方法成对出现，能够将g从阻塞态中恢复，重新进入等待执行的状态

代码位于runtime/proc.go

func goready(gp *g, traceskip int) {
    systemstack(func() {
        ready(gp, traceskip, true)
    })
}

（3）正常调度

g中的执行任务已完成，g0会将当前g置为死亡状态，发起新一轮调度

（4）抢占调度：

倘若g执行系统调用超过指定时长，且全局p资源比较紧缺，此时将p和g解绑，抢占出来用与其他g的调度。等g完成系统调用后，会重新进入可执行队列中等待被调度

值得一提的是，前3中调度方式都是由m下的g0完成，唯独抢占调度不同

因为发起系统调用是需要打破用户态的边界进入内核状态，此时m也会因系统调用陷入僵直，无法主动完成抢占调度行为

因此，在golang进程会有一个全局监控协程monitor g的存在，这个g会越过p直接与一个m进行绑定，不断轮询对所有p的执行状况进行监控，倘若发现满足抢占调度的条件，则会从第三方的角度出手干预，主动发起该动作

4.3宏观调度流程

集齐各部分理论碎片之后，我们可以尝试对 gmp 的宏观调度流程进行整体串联：

以g0->g->g0的一轮循环为例进行串联
g0执行schedule()函数，寻找用于执行的g
g0执行execute()方法，更新当前g、p的状态信息，并调用gogo()方法，将执行权交给g；
g因主动让渡( gosche_m() )、被动调度( park_m ) 、正常结束( goexit0() )等原因、调用m_call()函数，执行权重新回到g0手中
g0执行schedule()函数，开启新的一轮循环

4.4 schedule

调度流程的主干方法位于 runtime/proc.go中的schedule函数，此时的执行权位于g0手中

func schedule(){
    //...
    gp, inheritTime, tryWakeP := findRunnable() // blocks until work is available
    //...
    execute(gp,inheritTime)
}

寻找下一个执行的goroutine
执行改goroutine

4.5 findRunnable

调度流程中，一个非常核心的步骤，就是为了m寻找到下一个执行的g，这部分内容位于runtime/proc.go的findRunnable方法中

func findRunnable()(gp *g,inheritTIme,tryWakeP bool){
    _g_ := getg()
   
top:
    _p_ := _g_.m.p.ptr()
    // ...
    if _p_.schedtick%61 == 0 && sched.runqsize > 0 {
        lock(&sched.lock)
        gp = globrunqget(_p_, 1)
        unlock(&sched.lock)
        if gp != nil {
            return gp, false, false
        }
    }
    
    // ...
    if gp, inheritTime := runqget(_p_); gp != nil {
        return gp, inheritTime, false
    }
    
    // ...
    if sched.runqsize != 0 {
        lock(&sched.lock)
        gp := globrunqget(_p_, 0)
        unlock(&sched.lock)
        if gp != nil {
            return gp, false, false
        }
    }




    if netpollinited() && atomic.Load(&netpollWaiters) > 0 && atomic.Load64(&sched.lastpoll) != 0 {
        if list := netpoll(0); !list.empty() { // non-blocking
            gp := list.pop()
            injectglist(&list)
            casgstatus(gp, _Gwaiting, _Grunnable)
            return gp, false, false
        }
    }


    // ...
    procs := uint32(gomaxprocs)
    if _g_.m.spinning || 2*atomic.Load(&sched.nmspinning) < procs-atomic.Load(&sched.npidle) {
        if !_g_.m.spinning {
            _g_.m.spinning = true
            atomic.Xadd(&sched.nmspinning, 1)
        }




        gp, inheritTime, tnow, w, newWork := stealWork(now)
        now = tnow
        if gp != nil {
            // Successfully stole.
            return gp, inheritTime, false
        }
        if newWork {
            // There may be new timer or GC work; restart to
            // discover.
            goto top
        }
        if w != 0 && (pollUntil == 0 || w < pollUntil) {
            // Earlier timer to wait for.
            pollUntil = w
        }
    }


    // 
}

（1）p每执行61次调度，会从全局队列中获取一个goroutine进行执行，并将一个全局队列中的goroutine填充到当前p的本地队列中

 if _p_.schedtick%61 == 0 && sched.runqsize > 0 {
        lock(&sched.lock)
        gp = globrunqget(_p_, 1)
        unlock(&sched.lock)
        if gp != nil {
            return gp, false, false
        }
 }

除了获取一个g用于执行外，还会额外将一个g从全局队列转移到p的本地队列，让全局队列中的g也会得到充分执行的机会

func globrunqget(_p_ *p, max int32) *g {
    if sched.runqsize == 0 {
        return nil
    }


    n := sched.runqsize/gomaxprocs + 1
    if n > sched.runqsize {
        n = sched.runqsize
    }
    if max > 0 && n > max {
        n = max
    }
    if n > int32(len(_p_.runq))/2 {
        n = int32(len(_p_.runq)) / 2
    }


    sched.runqsize -= n


    gp := sched.runq.pop()
    n--
    for ; n > 0; n-- {
        gp1 := sched.runq.pop()
        runqput(_p_, gp1, false)
    }
    return gp
}

将一个 g 由全局队列转移到 p 本地队列的执行逻辑位于 runqput 方法中：

func runqput(_p_ *p, gp *g, next bool) {
    // ...




retry:
    h := atomic.LoadAcq(&_p_.runqhead) // load-acquire, synchronize with consumers
    t := _p_.runqtail
    if t-h < uint32(len(_p_.runq)) {
        _p_.runq[t%uint32(len(_p_.runq))].set(gp)
        atomic.StoreRel(&_p_.runqtail, t+1) // store-release, makes the item available for consumption
        return
    }
    if runqputslow(_p_, gp, h, t) {
        return
    }
    // the queue is not full, now the put above must succeed
    goto retry

I 取得 p 本地队列队首的索引，同时对本地队列加锁：

h := atomic.LoadAcq(&_p_.runqhead)

II 倘若 p 的局部队列未满，则成功转移 g，将 p 的对尾索引 runqtail 值加 1 并解锁队列.

  if t-h < uint32(len(_p_.runq)) {
        _p_.runq[t%uint32(len(_p_.runq))].set(gp)
        atomic.StoreRel(&_p_.runqtail, t+1) // store-release, makes the item available for consumption
        return
   }

III 倘若发现本地队列 runq 已经满了，则会返回来将本地队列中一半的 g 放回全局队列中，帮助当前 p 缓解执行压力，这部分内容位于 runqputslow 方法中.

func runqputslow(_p_ *p, gp *g, h, t uint32) bool {
    var batch [len(_p_.runq)/2 + 1]*g
    // First, grab a batch from local queue.
    n := t - h
    n = n / 2
    
    // ...
    for i := uint32(0); i < n; i++ {
        batch[i] = _p_.runq[(h+i)%uint32(len(_p_.runq))].ptr()
    }
    if !atomic.CasRel(&_p_.runqhead, h, h+n) { // cas-release, commits consume
        return false
    }
    
    batch[n] = gp


    // Link the goroutines.
    for i := uint32(0); i < n; i++ {
        batch[i].schedlink.set(batch[i+1])
    }
    var q gQueue
    q.head.set(batch[0])
    q.tail.set(batch[n])


    // Now put the batch on global queue.
    lock(&sched.lock)
    globrunqputbatch(&q, int32(n+1))
    unlock(&sched.lock)
    return true

（2）尝试从 p 本地队列中获取一个可执行的 goroutine，核心逻辑位于 runqget 方法中：

    if gp, inheritTime := runqget(_p_); gp != nil {
        return gp, inheritTime, false
    }

func runqget(_p_ *p) (gp *g, inheritTime bool) {
    if next != 0 && _p_.runnext.cas(next, 0) {
        return next.ptr(), true
    }




    for {
        h := atomic.LoadAcq(&_p_.runqhead) // load-acquire, synchronize with other consumers
        t := _p_.runqtail
        if t == h {
            return nil, false
        }
        gp := _p_.runq[h%uint32(len(_p_.runq))].ptr()
        if atomic.CasRel(&_p_.runqhead, h, h+1) { // cas-release, commits consume
            return gp, false
        }
    }

I 倘若当前 p 的 runnext 非空，直接获取即可：

    if next != 0 && _p_.runnext.cas(next, 0) {
        return next.ptr(), true
    }

II 加锁从 p 的本地队列中获取 g.

需要注意，虽然本地队列是属于 p 独有的，但是由于 work-stealing 机制的存在，其他 p 可能会前来执行窃取动作，因此操作仍需加锁.

但是，由于窃取动作发生的频率不会太高，因此当前 p 取得锁的成功率是很高的，因此可以说p 的本地队列是接近于无锁化，但没有达到真正意义的无锁.

    for {
        h := atomic.LoadAcq(&_p_.runqhead) // load-acquire, synchronize with other consumers
       // ...
   }

III 倘若本地队列为空，直接终止并返回；

        h := atomic.LoadAcq(&_p_.runqhead) // load-acquire, synchronize with other consumers
        t := _p_.runqtail
        if t == h {
            return nil, false
       }

IV 倘若本地队列存在 g，则取得队首的 g，解锁并返回.

        gp := _p_.runq[h%uint32(len(_p_.runq))].ptr()
        if atomic.CasRel(&_p_.runqhead, h, h+1) { // cas-release, commits consume
            return gp, false
       }

（3）倘若本地队列没有可执行的 g，会从全局队列中获取：

   if sched.runqsize != 0 {
        lock(&sched.lock)
        gp := globrunqget(_p_, 0)
        unlock(&sched.lock)
        if gp != nil {
            return gp, false, false
        }
    }

加锁，尝试并从全局队列中取队首的元素.

（4）倘若本地队列和全局队列都没有 g，则会获取准备就绪的网络协程：

    if netpollinited() && atomic.Load(&netpollWaiters) > 0 && atomic.Load64(&sched.lastpoll) != 0 {
        if list := netpoll(0); !list.empty() { // non-blocking
            gp := list.pop()
            injectglist(&list)
            casgstatus(gp, _Gwaiting, _Grunnable)
            return gp, false, false
        }
  }

需要注意的是，刚获取网络协程时，g 的状态是处于 waiting 的，因此需要先更新为 runnable 状态.

（5）work-stealing: 从其他 p 中偷取 g.

func stealWork(now int64) (gp *g, inheritTime bool, rnow, pollUntil int64, newWork bool) {
    pp := getg().m.p.ptr()


    ranTimer := false


    const stealTries = 4
    for i := 0; i < stealTries; i++ {
        stealTimersOrRunNextG := i == stealTries-1


        for enum := stealOrder.start(fastrand()); !enum.done(); enum.next() {
            // ...
        }
    }


    return nil, false, now, pollUntil, ranTime

偷取操作至多会遍历全局的 p 队列 4 次，过程中只要找到可窃取的 p 则会立即返回.

为保证窃取行为的公平性，遍历的起点是随机的. 窃取动作的核心逻辑位于 runqgrab 方法当中：

func runqgrab(_p_ *p, batch *[256]guintptr, batchHead uint32, stealRunNextG bool) uint32 {
    for {
        h := atomic.LoadAcq(&_p_.runqhead) // load-acquire, synchronize with other consumers
        t := atomic.LoadAcq(&_p_.runqtail) // load-acquire, synchronize with the producer
        n := t - h
        n = n - n/2
        if n == 0 {
            if stealRunNextG {
                // Try to steal from _p_.runnext.
                if next := _p_.runnext; next != 0 {
                    if _p_.status == _Prunning {
                        
                        if GOOS != "windows" && GOOS != "openbsd" && GOOS != "netbsd" {
                            usleep(3)
                        } else {
                            osyield()
                        }
                    }
                    if !_p_.runnext.cas(next, 0) {
                        continue
                    }
                    batch[batchHead%uint32(len(batch))] = next
                    return 1
                }
            }
            return 0
        }
        if n > uint32(len(_p_.runq)/2) { // read inconsistent h and t
            continue
        }
        for i := uint32(0); i < n; i++ {
            g := _p_.runq[(h+i)%uint32(len(_p_.runq))]
            batch[(batchHead+i)%uint32(len(batch))] = g
        }
        if atomic.CasRel(&_p_.runqhead, h, h+n) { // cas-release, commits consume
            return n
        }
    }
}

I 每次对一个 p 尝试窃取前，会对其局部队列加锁；

        h := atomic.LoadAcq(&_p_.runqhead) // load-acquire, synchronize with other consumers
        t := atomic.LoadAcq(&_p_.runqtail) // load-acquire, synchronize with the producer

II 尝试偷取其现有的一半 g，并且返回实际偷取的数量.

        n := t - h
        n = n - n/2
        
        // ...
        
        for i := uint32(0); i < n; i++ {
            g := _p_.runq[(h+i)%uint32(len(_p_.runq))]
            batch[(batchHead+i)%uint32(len(batch))] = g
        }
        if atomic.CasRel(&_p_.runqhead, h, h+n) { // cas-release, commits consume
            return n
        }

4.6 execute

当 g0 为 m 寻找到可执行的 g 之后，接下来就开始执行 g. 这部分内容位于 runtime/proc.go 的 execute 方法中：

func execute(gp *g, inheritTime bool) {
    _g_ := getg()


    _g_.m.curg = gp
    gp.m = _g_.m
    casgstatus(gp, _Grunnable, _Grunning)
    gp.waitsince = 0
    gp.preempt = false
    gp.stackguard0 = gp.stack.lo + _StackGuard
    if !inheritTime {
        _g_.m.p.ptr().schedtick++
    }


    gogo(&gp.sched)

（1）更新 g 的状态信息，建立 g 与 m 之间的绑定关系；

（2）更新 p 的总调度次数；

（3）调用 gogo 方法，执行 goroutine 中的任务.

4.7 gosched_m

g 执行主动让渡时，会调用 mcall 方法将执行权归还给 g0，并由 g0 调用 gosched_m 方法，位于 runtime/proc.go 文件中：

func Gosched() {
    // ...
    mcall(gosched_m)
}

func gosched_m(gp *g) {
    goschedImpl(gp)
}


func goschedImpl(gp *g) {
    status := readgstatus(gp)
    if status&^_Gscan != _Grunning {
        dumpgstatus(gp)
        throw("bad g status")
    }
    casgstatus(gp, _Grunning, _Grunnable)
    dropg()
    lock(&sched.lock)
    globrunqput(gp)
    unlock(&sched.lock)


    schedule()

（1）将当前 g 的状态由执行中切换为待执行 _Grunnable：

casgstatus(gp, _Grunning, _Grunnable)

（2）调用 dropg() 方法，将当前的 m 和 g 解绑；

func dropg() {
    _g_ := getg()


    setMNoWB(&_g_.m.curg.m, nil)
    setGNoWB(&_g_.m.curg, nil)
}

（3）将 g 添加到全局队列当中：

    lock(&sched.lock)
    globrunqput(gp)
    unlock(&sched.lock

（4）开启新一轮的调度：

    schedule()

4.8 park_m 与 ready

g 需要被动调度时，会调用 mcall 方法切换至 g0，并调用 park_m 方法将 g 置为阻塞态，执行流程位于 runtime/proc.go 的 gopark 方法当中：

func gopark(unlockf func(*g, unsafe.Pointer) bool, lock unsafe.Pointer, reason waitReason, traceEv byte, traceskip int) {
    // ...
    mcall(park_m)
}

func park_m(gp *g) {
    _g_ := getg()


    casgstatus(gp, _Grunning, _Gwaiting)
    dropg()


    // ...
    schedule()

（1）将当前 g 的状态由 running 改为 waiting；

（2）将 g 与 m 解绑；

（3）执行新一轮的调度 schedule.

当因被动调度陷入阻塞态的 g 需要被唤醒时，会由其他协程执行 goready 方法将 g 重新置为可执行的状态，方法位于 runtime/proc.go .

被动调度如果需要唤醒，则会其他 g 负责将 g 的状态由 waiting 改为 runnable，然后会将其添加到唤醒者的 p 的本地队列中：

func goready(gp *g, traceskip int) {
    systemstack(func() {
        ready(gp, traceskip, true)
    })
}

func ready(gp *g, traceskip int, next bool) {
    // ...
    _g_ := getg()
    // ...
    casgstatus(gp, _Gwaiting, _Grunnable)
    runqput(_g_.m.p.ptr(), gp, next)
    // ...
}

（1）先将 g 的状态从阻塞态改为可执行的状态；

（2）调用 runqput 将当前 g 添加到唤醒者 p 的本地队列中，如果队列满了，会连带 g 一起将一半的元素转移到全局队列.

4.9 goexit0

当 g 执行完成时，会先执行 mcall 方法切换至 g0，然后调用 goexit0 方法，内容为 runtime/proc.go：

// Finishes execution of the current goroutine.
func goexit1() {
    // ...
    mcall(goexit0)
}

func goexit0(gp *g) {
    _g_ := getg()
    _p_ := _g_.m.p.ptr()


    casgstatus(gp, _Grunning, _Gdead)
    // ...
    gp.m = nil
    // ...


    dropg()


    // ...
    schedule()

（1）将 g 状态置为 dead；

（2）解绑 g 和 m；

（3）开启新一轮的调度.

4.10 retake

与 4.7-4.9 小节的区别在于，抢占调度的执行者不是 g0，而是一个全局的 monitor g，代码位于 runtime/proc.go 的 retake 方法中：

func retake(now int64) uint32 {
    n := 0
    
    lock(&allpLock)
    for i := 0; i < len(allp); i++ {
        _p_ := allp[i]
        if _p_ == nil {
            // This can happen if procresize has grown
            // allp but not yet created new Ps.
            continue
        }
        pd := &_p_.sysmontick
        // ...
        if s == _Psyscall {            
            // ...
            if runqempty(_p_) && atomic.Load(&sched.nmspinning)+atomic.Load(&sched.npidle) > 0 && pd.syscallwhen+10*1000*1000 > now {
                continue
            }
            unlock(&allpLock)
            if atomic.Cas(&_p_.status, s, _Pidle) {
                n++
                _p_.syscalltick++
                handoffp(_p_)
            }
            incidlelocked(1)
            lock(&allpLock)
        }
    }
    unlock(&allpLock)
    return uint32(n)
}

（1）加锁后，遍历全局的 p 队列，寻找需要被抢占的目标：

    lock(&allpLock)
    for i := 0; i < len(allp); i++ {
        _p_ := allp[i]
        // ...
    }
    unlock(&allpLock)

（2）倘若某个 p 同时满足下述条件，则会进行抢占调度：

I 执行系统调用超过 10 ms；

II p 本地队列有等待执行的 g；

III 或者当前没有空闲的 p 和 m.

        if s == _Psyscall {            
            // ...
            if runqempty(_p_) && atomic.Load(&sched.nmspinning)+atomic.Load(&sched.npidle) > 0 && pd.syscallwhen+10*1000*1000 > now {
                continue
            }
            // ... 抢占调度
            lock(&allpLock)
        }

（3）抢占调度的步骤是，先将当前 p 的状态更新为 idle，然后步入 handoffp 方法中，判断是否需要为 p 寻找接管的 m（因为其原本绑定的 m 正在执行系统调用）：

            if atomic.Cas(&_p_.status, s, _Pidle) {
                n++
                _p_.syscalltick++
                handoffp(_p_)
            }

（4）当以下四个条件满足其一时，则需要为 p 获取新的 m：

I 当前 p 本地队列还有待执行的 g；

II 全局繁忙（没有空闲的 p 和 m，全局 g 队列为空）

III 需要处理网络 socket 读写请求

func handoffp(_p_ *p) {
    if !runqempty(_p_) || sched.runqsize != 0 {
        startm(_p_, false)
        return
    }


    if atomic.Load(&sched.nmspinning)+atomic.Load(&sched.npidle) == 0 && atomic.Cas(&sched.nmspinning, 0, 1) {
        startm(_p_, true)
        return
    }
    
    lock(&sched.lock)
    // ...
    if sched.runqsize != 0 {
        unlock(&sched.lock)
        startm(_p_, false)
        return
    }
    // If this is the last running P and nobody is polling network,
    // need to wakeup another M to poll network.
    if sched.npidle == uint32(gomaxprocs-1) && atomic.Load64(&sched.lastpoll) != 0 {
        unlock(&sched.lock)
        startm(_p_, false)
        return
    }


    // ...

（5）获取 m 时，会先尝试获取已有的空闲的 m，若不存在，则会创建一个新的 m.

func startm(_p_ *p, spinning bool) {
    
    mp := acquirem()
    lock(&sched.lock)
    // ...
    
    nmp := mget()
    if nmp == nil {
        id := mReserveID()
        unlock(&sched.lock)


        var fn func()
        // ...
        newm(fn, _p_, id)
        // ...
        return
    }
    unlock(&sched.lock)
    // ...
}

4.11 reentersyscall 和 exitsyscall

本小节同样与 g 的系统调用有关，但是视角切换回发生系统调用前，与 g 绑定的原 m 当中.

在 m 需要执行系统调用前，会先执行位于 runtime/proc.go 的 reentersyscall 的方法：

func reentersyscall(pc, sp uintptr) {
    _g_ := getg()


    // ...
    save(pc, sp)
    _g_.syscallsp = sp
    _g_.syscallpc = pc
    casgstatus(_g_, _Grunning, _Gsyscall)
    // ...


    pp := _g_.m.p.ptr()
    pp.m = 0
    _g_.m.oldp.set(pp)
    _g_.m.p = 0
    atomic.Store(&pp.status, _Psyscall)
    // ...

（1）此时执行权同样位于 m 的 g0 手中；

（2）保存当前 g 的执行环境；

    save(pc, sp)
    _g_.syscallsp = sp
    _g_.syscallpc = p

（3）将 g 和 p 的状态更新为 syscall；

    casgstatus(_g_, _Grunning, _Gsyscall)
    atomic.Store(&pp.status, _Psyscall)

（4）解除 p 和当前 m 之间的绑定，因为 m 即将进入系统调用而导致短暂不可用；

    pp := _g_.m.p.ptr()
    pp.m = 0
    _g_.m.p = 0

（5）将 p 添加到当前 m 的 oldP 容器当中，后续 m 恢复后，会优先寻找旧的 p 重新建立绑定关系.

_g_.m.oldp.set(pp)

当 m 完成了内核态的系统调用之后，此时会步入位于 runtime/proc.go 的 exitsyscall 函数中，尝试寻找 p 重新开始运作：

func exitsyscall() {
    _g_ := getg()
    
    // ...
    if exitsyscallfast(oldp) {
        // ...
        casgstatus(_g_, _Gsyscall, _Grunning)
        // ...
        return
    }


    // ...
    mcall(exitsyscall0)
    // ...
}

（1）方法执行之初，此时的执行权是普通 g.倘若此前设置的 oldp 仍然可用，则重新和 oldP 绑定，将当前 g 重新置为 running 状态，然后开始执行后续的用户函数；

    _g_ := getg()
    
    // ...
    if exitsyscallfast(oldp) {
        // ...
        casgstatus(_g_, _Gsyscall, _Grunning)
        // ...
        return
    }

（2）old 绑定失败，则调用 mcall 方法切换到 m 的 g0，并执行 exitsyscall0 方法：

    mcall(exitsyscall0)

func exitsyscall0(gp *g) {
    casgstatus(gp, _Gsyscall, _Grunnable)
    dropg()
    lock(&sched.lock)
    var _p_ *p
    if schedEnabled(gp) {
        _p_, _ = pidleget(0)
    }
    
    var locked bool
    if _p_ == nil {
        globrunqput(gp)
    } 
    
    unlock(&sched.lock)
    if _p_ != nil {
        acquirep(_p_)
        execute(gp, false) // Never returns.
    }
    
    // ...
    
    stopm()
    schedule() // Never returns.
}

（3）将 g 由系统调用状态切换为可运行态，并解绑 g 和 m 的关系：

    casgstatus(gp, _Gsyscall, _Grunnable)
    dropg()

（4）从全局 p 队列获取可用的 p，如果获取到了，则执行 g：

    lock(&sched.lock)
    var _p_ *p
    if schedEnabled(gp) {
        _p_, _ = pidleget(0)
    }
    unlock(&sched.lock)
    if _p_ != nil {
        acquirep(_p_)
        execute(gp, false) // Never returns.
    }

（5）如若无 p 可用，则将 g 添加到全局队列，当前 m 陷入沉睡. 直到被唤醒后才会继续发起调度.

    if _p_ == nil {
        globrunqput(gp)
    } 
    stopm()
    schedule() // Never returns.

文章内容来自于跟敲学习视频教程 @小徐先生的编程世界

Last modification：December 2, 2024

如果觉得我的文章对你有用，请收藏本站

GMP模型

hideyoshi • 2023 年 11 月 06 日

<h1>1 概念梳理</h1><h2>1.1 线程</h2><p>通常语义中的线程，指的是内核级线程，核心点如下</p><ol><li>是操作系统最小调度单元</li><li>创建、销毁、调度交由内核完成，cpu需完成用户态与内核态间的切换</li><li>可充分利用多核，实现并行</li></ol><h2>1.2 协程</h2><p>协程，又成为用户级线程，核心点如下</p><ol><li>线程纯在映射关系，为M:1</li><li>创建、销毁、调度在用户太完成，对内核透明，所以更新</li><li>从属同一个线程，无法并行，一个线程阻塞会导致从属同一个线程的所有协程无法执行</li></ol><h2>1.3 Goroutine</h2><p>Goroutine，经Golang优化后的特殊协程，核心特点如下：</p><ol><li>与线程存在映射关系，为M:N</li><li>创建、销毁、调度在用户太完成，对内核透明，足够轻便</li><li>可利用多个线程，实现并行</li><li>通过调度器的斡旋、实现和线程间的动态绑定和灵活调度</li><li>栈空间大小可动态扩缩，因地制宜</li></ol><h1>2 gmp模型</h1><p>GMP = goroutine + machine + processor (+ 一套有机组合的机制)，下面先单独拆出每个来解释</p><h2>2.1 g</h2><ol><li>g 即 goroutine ，是golang 中对协程的抽象</li><li>g 有自己的运行栈、状态、以及执行的任务函数（用户通过go func 指定）</li><li>g 需要绑定到p才能执行，在g的视角中，p就是他的cpu</li></ol><h2>2.2 p</h2><ol><li>p即processor，是golang中的调度器</li><li>p是gmp的中枢，借由p承上启下，实现g和m之间的动态有机结合</li><li>对于g而已，p是其cpu，g只有被p调用，才得以执行</li><li>对m而言，p是执行代理，为其提供必要信息的同时（可执行的g、内存分配情况等），并隐藏了繁杂的调度细节</li><li>p的数量决定了g最大并行数量，可由用户通过GOMAXPROCS进行设定（超过cpu核数时无意义）</li></ol><h2>2.3 m</h2><ol><li>m即machine，是golang中对协程的抽象</li><li>m不直接执行g，而是先和p绑定，尤其实现代理</li><li>借由p的存在，m无需和g绑死，也无需记录g的状态信息，因此g在全生命周期中可以实现跨m执行</li></ol><h2>2.4 gmp</h2><p><img src="http://qiniu-oss.hideyoshi.top/blog/typecho/2023/11/2213745057.png?imageView2/0/w/400/h/300" alt="gmp" title="gmp" style=""></p><p>GMP宏观模型如上图所示，下面对其要点和细节进行逐一介绍</p><ol><li>M 是线程的抽象；g是goroutine；p是承下启下的调度器</li><li>M调度G前，需要和P绑定</li><li>全局有多个M和多个P，但同时并行的G的最大数量等于P的数量</li><li>G的存放队列有三类；P的本地队列；全局队列；和wait队列（图中未展示，为IO阻塞就绪态goroutine队列）</li><li>M调度G时，优先取本地队列，全局队列，最后取wait队列；这样的好处是：去本地队列时，可以接近无锁化，减少全局锁竞争</li><li>放置不同P的闲忙差异过大，设立work-stealing机制，本地队列为空的P可以尝试从其他P本地独立额偷取一般的G补充到自身队列</li></ol><h1>3 核心数据结构</h1><h2>3.1 g</h2><pre><code class="lang-go">type g struct{
    // ...
    m  *m
    sched gobuf
    // ...
}

type gobuf struct{
    sp unitptr
    pc unitptr
    ret unitptr 
    bp unitptr
}</code></pre><ol><li>m : 在p的代理，负责执行当前g的m</li><li>sched.sp:保存CPU的rep寄存器的值，指向函数调用栈栈顶</li><li>sched.pc:保存CPU的rpi寄存器的值，指向程序下一条执行指令的地址</li><li>sched.ret:保存系统调用的返回值</li><li>sched.bp:保存CPU的rbp寄存器的是，存储函数栈针的起始位置</li></ol><p>其中g的生命周期有以下集中状态组成：</p><p><img src="http://qiniu-oss.hideyoshi.top/blog/typecho/2023/11/3842684683.png?imageView2/0/w/400/h/300" alt="life" title="life" style=""></p><pre><code class="lang-go">const{
    _Gidle = itoa
    _Grunnable
    _Grunning
    _Gsyscall
    _Gwaiting
    _Gdead
    _Gcopystack
    _Gpreempted
}</code></pre><ol><li>_Gidle值为0，为协程开始创建的状态，此时尚未完成初始化</li><li>_Grunnable值为1，协程再待执行队列中，等待被执行</li><li>_Grunning值为2，协程正在执行，同一个时刻一个p中只有一个g处于此状态</li><li>_Gsyscall值为3，协程正在执行系统调用</li><li>_Gwaiting值为4，协程处于挂起状态，需要等待被唤醒 gc、channel 通信或者锁操作时经常会进入这种状态</li><li>_Gdead职位6，协程处于刚初始化完成或者已经被销毁，会处于这种状态</li><li>_Gcopaystack值为8，协程正处于扩容流程中</li><li>_Greempted值为9，协程被抢占后的状态</li></ol><h2>3.2 m</h2><pre><code class="lang-go">type m struct{
    g0 *g //goroutine with cheduling stack
    tls [tlsSlots]unitptr // thread-local storage
}</code></pre><ol><li>g0:一类特殊的调度协程，不用执行用户函数，负责执行g之间的切换调度，与m的关系为1:1</li><li>tls:hread-local storage，线程本地存储，存储内容支队当前线程可见，线程本地存储的是m.tls的地址，m.tls[0]存储的是当前运行的g，因此线程可以通过g找到当前m、p、g0等信息</li></ol><h2>3.3 p</h2><pre><code class="lang-go">type p struct{
    runqhead unit32
    runqtail unit32
    runq    [256]guintptr
    
    runnext guintptr
}</code></pre><ol><li>runq:本地goroutine队列，最大长度为256</li><li>runqhead：队列头部</li><li>runqtail：队列尾部</li><li>runnext：下一个可执行的goroutine</li></ol><h2>3.4 schedt</h2><pre><code class="lang-go">type schedt struct{
    //...
    lock mutex
    //...
    runq gQueue
    runqsize int32
    //...
}</code></pre><p>sched 是全局goroutine队列的封装</p><ol><li>lock； 一把操作全局队列时使用的锁</li><li>runq：全局goroutine队列</li><li>runqsize：全局goroutine队列的容量</li></ol><h1>4 调度流程</h1><h2>4.1两种g的转换</h2><p><img src="http://qiniu-oss.hideyoshi.top/blog/typecho/2023/11/82452180.png?imageView2/0/w/400/h/300" alt="g转换" title="g转换" style=""></p><p>如3.2小节中谈及的，goroutine的类型可以分为两类</p><ul><li>负责调度普通g的g0，执行固定的调度流程，与m的关系一对一</li><li>负责执行用户函数的普通g</li></ul><p>m通过p调度执行的goroutine永远在普通的g和g0之间切换，当g0找到可执行的g时，会调用gogo的方法，调度g执行用户定义的任务；当g需要主动让渡或者调度是，会触发mcall方法，将执行权重新交还个g0</p><p>gogo和mcall可以理解为对偶关心，其定义位于runtime/stubs.go文件中</p><pre><code class="lang-go">func gogo(buf *gobuf)
//...
func mall(fn func(*g))</code></pre><h2>4.2 调度类型</h2><p>通常，调度指的是由g0按照特定策略找到下一个可执行g的过程，而本小节谈及的调度类型是广义上的"调度"，指的是调度器p实现执行一个g切换到另一个g的过程</p><p>这种广义"调度"可分为几种类型</p><p>（1）主动调度</p><p>一种用户主动执行让渡的方式，主要方式是，用户在执行代码中调用了runtime.Gosched方法，此时当前g会当让出执行全，主动进行队列等待下次调度执行</p><p>代码位于 runtime/proc.go</p><pre><code class="lang-go">func Gosched(){
    checkTimeouts()
    mcall(gosched_m)
}</code></pre><p>（2）被动调度</p><p>因当前不满足某种执行条件，g可能会陷入阻塞态无法被调度，知道关注的条件达成后，g才从阻塞中被唤醒，重新进入可执行队列等待被调度</p><p>常见的被动调度触发方式因channel操作或互斥锁操作陷入阻塞等操作，底层会走进gopark方法</p><p>代码位于runtime/proc.go</p><pre><code class="lang-go">func gopark(unlockf func(*g, unsafe.Pointer) bool, lock unsafe.Pointer, reason waitReason, traceEv byte, traceskip int) {
    // ...
    mcall(park_m)
}</code></pre><p>goready方法通常与gopark方法成对出现，能够将g从阻塞态中恢复，重新进入等待执行的状态</p><p>代码位于runtime/proc.go</p><pre><code class="lang-go">func goready(gp *g, traceskip int) {
    systemstack(func() {
        ready(gp, traceskip, true)
    })
}</code></pre><p>（3）正常调度</p><p>g中的执行任务已完成，g0会将当前g置为死亡状态，发起新一轮调度</p><p>（4）抢占调度：</p><p>倘若g执行系统调用超过指定时长，且全局p资源比较紧缺，此时将p和g解绑，抢占出来用与其他g的调度。等g完成系统调用后，会重新进入可执行队列中等待被调度</p><p>值得一提的是，前3中调度方式都是由m下的g0完成，唯独抢占调度不同</p><p>因为发起系统调用是需要打破用户态的边界进入内核状态，此时m也会因系统调用陷入僵直，无法主动完成抢占调度行为</p><p>因此，在golang进程会有一个全局监控协程monitor g的存在，这个g会越过p直接与一个m进行绑定，不断轮询对所有p的执行状况进行监控，倘若发现满足抢占调度的条件，则会从第三方的角度出手干预，主动发起该动作</p><h2>4.3宏观调度流程</h2><p>集齐各部分理论碎片之后，我们可以尝试对 gmp 的宏观调度流程进行整体串联：</p><ol><li>以g0-&gt;g-&gt;g0的一轮循环为例进行串联</li><li>g0执行schedule()函数，寻找用于执行的g</li><li>g0执行execute()方法，更新当前g、p的状态信息，并调用gogo()方法，将执行权交给g；</li><li>g因主动让渡( gosche_m() )、被动调度( park_m ) 、正常结束( goexit0() )等原因、调用m_call()函数，执行权重新回到g0手中</li><li>g0执行schedule()函数，开启新的一轮循环</li></ol><h2>4.4 schedule</h2><p>调度流程的主干方法位于 runtime/proc.go中的schedule函数，此时的执行权位于g0手中</p><pre><code class="lang-go">func schedule(){
    //...
    gp, inheritTime, tryWakeP := findRunnable() // blocks until work is available
    //...
    execute(gp,inheritTime)
}</code></pre><ol><li>寻找下一个执行的goroutine</li><li>执行改goroutine</li></ol><h2>4.5 findRunnable</h2><p>调度流程中，一个非常核心的步骤，就是为了m寻找到下一个执行的g，这部分内容位于runtime/proc.go的findRunnable方法中</p><pre><code class="lang-go">func findRunnable()(gp *g,inheritTIme,tryWakeP bool){
    _g_ := getg()
   
top:
    _p_ := _g_.m.p.ptr()
    // ...
    if _p_.schedtick%61 == 0 &amp;&amp; sched.runqsize &gt; 0 {
        lock(&amp;sched.lock)
        gp = globrunqget(_p_, 1)
        unlock(&amp;sched.lock)
        if gp != nil {
            return gp, false, false
        }
    }
    
    // ...
    if gp, inheritTime := runqget(_p_); gp != nil {
        return gp, inheritTime, false
    }
    
    // ...
    if sched.runqsize != 0 {
        lock(&amp;sched.lock)
        gp := globrunqget(_p_, 0)
        unlock(&amp;sched.lock)
        if gp != nil {
            return gp, false, false
        }
    }

if netpollinited() &amp;&amp; atomic.Load(&amp;netpollWaiters) &gt; 0 &amp;&amp; atomic.Load64(&amp;sched.lastpoll) != 0 {
        if list := netpoll(0); !list.empty() { // non-blocking
            gp := list.pop()
            injectglist(&amp;list)
            casgstatus(gp, _Gwaiting, _Grunnable)
            return gp, false, false
        }
    }

// ...
    procs := uint32(gomaxprocs)
    if _g_.m.spinning || 2*atomic.Load(&amp;sched.nmspinning) &lt; procs-atomic.Load(&amp;sched.npidle) {
        if !_g_.m.spinning {
            _g_.m.spinning = true
            atomic.Xadd(&amp;sched.nmspinning, 1)
        }

gp, inheritTime, tnow, w, newWork := stealWork(now)
        now = tnow
        if gp != nil {
            // Successfully stole.
            return gp, inheritTime, false
        }
        if newWork {
            // There may be new timer or GC work; restart to
            // discover.
            goto top
        }
        if w != 0 &amp;&amp; (pollUntil == 0 || w &lt; pollUntil) {
            // Earlier timer to wait for.
            pollUntil = w
        }
    }

// 
}
</code></pre><p>（1）p每执行61次调度，会从全局队列中获取一个goroutine进行执行，并将一个全局队列中的goroutine填充到当前p的本地队列中</p><pre><code class="lang-go"> if _p_.schedtick%61 == 0 &amp;&amp; sched.runqsize &gt; 0 {
        lock(&amp;sched.lock)
        gp = globrunqget(_p_, 1)
        unlock(&amp;sched.lock)
        if gp != nil {
            return gp, false, false
        }
 }</code></pre><p>除了获取一个g用于执行外，还会额外将一个g从全局队列转移到p的本地队列，让全局队列中的g也会得到充分执行的机会</p><pre><code class="lang-go">func globrunqget(_p_ *p, max int32) *g {
    if sched.runqsize == 0 {
        return nil
    }

n := sched.runqsize/gomaxprocs + 1
    if n &gt; sched.runqsize {
        n = sched.runqsize
    }
    if max &gt; 0 &amp;&amp; n &gt; max {
        n = max
    }
    if n &gt; int32(len(_p_.runq))/2 {
        n = int32(len(_p_.runq)) / 2
    }

sched.runqsize -= n

gp := sched.runq.pop()
    n--
    for ; n &gt; 0; n-- {
        gp1 := sched.runq.pop()
        runqput(_p_, gp1, false)
    }
    return gp
}</code></pre><p>将一个 g 由全局队列转移到 p 本地队列的执行逻辑位于 runqput 方法中：</p><pre><code class="lang-go">func runqput(_p_ *p, gp *g, next bool) {
    // ...

retry:
    h := atomic.LoadAcq(&amp;_p_.runqhead) // load-acquire, synchronize with consumers
    t := _p_.runqtail
    if t-h &lt; uint32(len(_p_.runq)) {
        _p_.runq[t%uint32(len(_p_.runq))].set(gp)
        atomic.StoreRel(&amp;_p_.runqtail, t+1) // store-release, makes the item available for consumption
        return
    }
    if runqputslow(_p_, gp, h, t) {
        return
    }
    // the queue is not full, now the put above must succeed
    goto retry</code></pre><p>I 取得 p 本地队列队首的索引，同时对本地队列加锁：</p><pre><code class="lang-go">h := atomic.LoadAcq(&amp;_p_.runqhead)</code></pre><p>II 倘若 p 的局部队列未满，则成功转移 g，将 p 的对尾索引 runqtail 值加 1 并解锁队列.</p><pre><code class="lang-go">  if t-h &lt; uint32(len(_p_.runq)) {
        _p_.runq[t%uint32(len(_p_.runq))].set(gp)
        atomic.StoreRel(&amp;_p_.runqtail, t+1) // store-release, makes the item available for consumption
        return
   }</code></pre><p>III 倘若发现本地队列 runq 已经满了，则会返回来将本地队列中一半的 g 放回全局队列中，帮助当前 p 缓解执行压力，这部分内容位于 runqputslow 方法中.</p><pre><code class="lang-go">func runqputslow(_p_ *p, gp *g, h, t uint32) bool {
    var batch [len(_p_.runq)/2 + 1]*g
    // First, grab a batch from local queue.
    n := t - h
    n = n / 2
    
    // ...
    for i := uint32(0); i &lt; n; i++ {
        batch[i] = _p_.runq[(h+i)%uint32(len(_p_.runq))].ptr()
    }
    if !atomic.CasRel(&amp;_p_.runqhead, h, h+n) { // cas-release, commits consume
        return false
    }
    
    batch[n] = gp

// Link the goroutines.
    for i := uint32(0); i &lt; n; i++ {
        batch[i].schedlink.set(batch[i+1])
    }
    var q gQueue
    q.head.set(batch[0])
    q.tail.set(batch[n])

// Now put the batch on global queue.
    lock(&amp;sched.lock)
    globrunqputbatch(&amp;q, int32(n+1))
    unlock(&amp;sched.lock)
    return true</code></pre><p>（2）尝试从 p 本地队列中获取一个可执行的 goroutine，核心逻辑位于 runqget 方法中：</p><pre><code class="lang-go">    if gp, inheritTime := runqget(_p_); gp != nil {
        return gp, inheritTime, false
    }</code></pre><pre><code class="lang-go">func runqget(_p_ *p) (gp *g, inheritTime bool) {
    if next != 0 &amp;&amp; _p_.runnext.cas(next, 0) {
        return next.ptr(), true
    }

for {
        h := atomic.LoadAcq(&amp;_p_.runqhead) // load-acquire, synchronize with other consumers
        t := _p_.runqtail
        if t == h {
            return nil, false
        }
        gp := _p_.runq[h%uint32(len(_p_.runq))].ptr()
        if atomic.CasRel(&amp;_p_.runqhead, h, h+1) { // cas-release, commits consume
            return gp, false
        }
    }</code></pre><p>I 倘若当前 p 的 runnext 非空，直接获取即可：</p><pre><code class="lang-go">    if next != 0 &amp;&amp; _p_.runnext.cas(next, 0) {
        return next.ptr(), true
    }</code></pre><p>II 加锁从 p 的本地队列中获取 g.</p><p>需要注意，虽然本地队列是属于 p 独有的，但是由于 work-stealing 机制的存在，其他 p 可能会前来执行窃取动作，因此操作仍需加锁.</p><p>但是，由于窃取动作发生的频率不会太高，因此当前 p 取得锁的成功率是很高的，因此可以说p 的本地队列是接近于无锁化，但没有达到真正意义的无锁.</p><pre><code class="lang-go">    for {
        h := atomic.LoadAcq(&amp;_p_.runqhead) // load-acquire, synchronize with other consumers
       // ...
   }</code></pre><p>III 倘若本地队列为空，直接终止并返回；</p><pre><code>        h := atomic.LoadAcq(&amp;_p_.runqhead) // load-acquire, synchronize with other consumers
        t := _p_.runqtail
        if t == h {
            return nil, false
       }</code></pre><p>IV 倘若本地队列存在 g，则取得队首的 g，解锁并返回.</p><pre><code class="lang-go">        gp := _p_.runq[h%uint32(len(_p_.runq))].ptr()
        if atomic.CasRel(&amp;_p_.runqhead, h, h+1) { // cas-release, commits consume
            return gp, false
       }</code></pre><p>（3）倘若本地队列没有可执行的 g，会从全局队列中获取：</p><pre><code>   if sched.runqsize != 0 {
        lock(&amp;sched.lock)
        gp := globrunqget(_p_, 0)
        unlock(&amp;sched.lock)
        if gp != nil {
            return gp, false, false
        }
    }</code></pre><p>加锁，尝试并从全局队列中取队首的元素.</p><p>（4）倘若本地队列和全局队列都没有 g，则会获取准备就绪的网络协程：</p><pre><code class="lang-go">    if netpollinited() &amp;&amp; atomic.Load(&amp;netpollWaiters) &gt; 0 &amp;&amp; atomic.Load64(&amp;sched.lastpoll) != 0 {
        if list := netpoll(0); !list.empty() { // non-blocking
            gp := list.pop()
            injectglist(&amp;list)
            casgstatus(gp, _Gwaiting, _Grunnable)
            return gp, false, false
        }
  }</code></pre><p>需要注意的是，刚获取网络协程时，g 的状态是处于 waiting 的，因此需要先更新为 runnable 状态.</p><p>（5）work-stealing: 从其他 p 中偷取 g.</p><pre><code class="lang-go">func stealWork(now int64) (gp *g, inheritTime bool, rnow, pollUntil int64, newWork bool) {
    pp := getg().m.p.ptr()

ranTimer := false

const stealTries = 4
    for i := 0; i &lt; stealTries; i++ {
        stealTimersOrRunNextG := i == stealTries-1

for enum := stealOrder.start(fastrand()); !enum.done(); enum.next() {
            // ...
        }
    }

return nil, false, now, pollUntil, ranTime</code></pre><p>偷取操作至多会遍历全局的 p 队列 4 次，过程中只要找到可窃取的 p 则会立即返回.</p><p>为保证窃取行为的公平性，遍历的起点是随机的. 窃取动作的核心逻辑位于 runqgrab 方法当中：</p><pre><code class="lang-go">func runqgrab(_p_ *p, batch *[256]guintptr, batchHead uint32, stealRunNextG bool) uint32 {
    for {
        h := atomic.LoadAcq(&amp;_p_.runqhead) // load-acquire, synchronize with other consumers
        t := atomic.LoadAcq(&amp;_p_.runqtail) // load-acquire, synchronize with the producer
        n := t - h
        n = n - n/2
        if n == 0 {
            if stealRunNextG {
                // Try to steal from _p_.runnext.
                if next := _p_.runnext; next != 0 {
                    if _p_.status == _Prunning {
                        
                        if GOOS != &quot;windows&quot; &amp;&amp; GOOS != &quot;openbsd&quot; &amp;&amp; GOOS != &quot;netbsd&quot; {
                            usleep(3)
                        } else {
                            osyield()
                        }
                    }
                    if !_p_.runnext.cas(next, 0) {
                        continue
                    }
                    batch[batchHead%uint32(len(batch))] = next
                    return 1
                }
            }
            return 0
        }
        if n &gt; uint32(len(_p_.runq)/2) { // read inconsistent h and t
            continue
        }
        for i := uint32(0); i &lt; n; i++ {
            g := _p_.runq[(h+i)%uint32(len(_p_.runq))]
            batch[(batchHead+i)%uint32(len(batch))] = g
        }
        if atomic.CasRel(&amp;_p_.runqhead, h, h+n) { // cas-release, commits consume
            return n
        }
    }
}</code></pre><p>I 每次对一个 p 尝试窃取前，会对其局部队列加锁；</p><pre><code class="lang-go">        h := atomic.LoadAcq(&amp;_p_.runqhead) // load-acquire, synchronize with other consumers
        t := atomic.LoadAcq(&amp;_p_.runqtail) // load-acquire, synchronize with the producer</code></pre><p>II 尝试偷取其现有的一半 g，并且返回实际偷取的数量.</p><pre><code class="lang-go">        n := t - h
        n = n - n/2
        
        // ...
        
        for i := uint32(0); i &lt; n; i++ {
            g := _p_.runq[(h+i)%uint32(len(_p_.runq))]
            batch[(batchHead+i)%uint32(len(batch))] = g
        }
        if atomic.CasRel(&amp;_p_.runqhead, h, h+n) { // cas-release, commits consume
            return n
        }
        </code></pre><h2>4.6 execute</h2><p>当 g0 为 m 寻找到可执行的 g 之后，接下来就开始执行 g. 这部分内容位于 runtime/proc.go 的 execute 方法中：</p><pre><code class="lang-go">func execute(gp *g, inheritTime bool) {
    _g_ := getg()

_g_.m.curg = gp
    gp.m = _g_.m
    casgstatus(gp, _Grunnable, _Grunning)
    gp.waitsince = 0
    gp.preempt = false
    gp.stackguard0 = gp.stack.lo + _StackGuard
    if !inheritTime {
        _g_.m.p.ptr().schedtick++
    }

gogo(&amp;gp.sched)</code></pre><p>（1）更新 g 的状态信息，建立 g 与 m 之间的绑定关系；</p><p>（2）更新 p 的总调度次数；</p><p>（3）调用 gogo 方法，执行 goroutine 中的任务.</p><h2>4.7 gosched_m</h2><p>g 执行主动让渡时，会调用 mcall 方法将执行权归还给 g0，并由 g0 调用 gosched_m 方法，位于 runtime/proc.go 文件中：</p><pre><code class="lang-go">func Gosched() {
    // ...
    mcall(gosched_m)
}</code></pre><pre><code class="lang-go">func gosched_m(gp *g) {
    goschedImpl(gp)
}

func goschedImpl(gp *g) {
    status := readgstatus(gp)
    if status&amp;^_Gscan != _Grunning {
        dumpgstatus(gp)
        throw(&quot;bad g status&quot;)
    }
    casgstatus(gp, _Grunning, _Grunnable)
    dropg()
    lock(&amp;sched.lock)
    globrunqput(gp)
    unlock(&amp;sched.lock)

schedule()</code></pre><p>（1）将当前 g 的状态由执行中切换为待执行 _Grunnable：</p><pre><code class="lang-go">casgstatus(gp, _Grunning, _Grunnable)</code></pre><p>（2）调用 dropg() 方法，将当前的 m 和 g 解绑；</p><pre><code class="lang-go">func dropg() {
    _g_ := getg()

setMNoWB(&amp;_g_.m.curg.m, nil)
    setGNoWB(&amp;_g_.m.curg, nil)
}</code></pre><p>（3）将 g 添加到全局队列当中：</p><pre><code class="lang-go">    lock(&amp;sched.lock)
    globrunqput(gp)
    unlock(&amp;sched.lock</code></pre><p>（4）开启新一轮的调度：</p><pre><code class="lang-go">    schedule()</code></pre><h2>4.8 park_m 与 ready</h2><p>g 需要被动调度时，会调用 mcall 方法切换至 g0，并调用 park_m 方法将 g 置为阻塞态，执行流程位于 runtime/proc.go 的 gopark 方法当中：</p><pre><code class="lang-go">func gopark(unlockf func(*g, unsafe.Pointer) bool, lock unsafe.Pointer, reason waitReason, traceEv byte, traceskip int) {
    // ...
    mcall(park_m)
}</code></pre><pre><code class="lang-go">func park_m(gp *g) {
    _g_ := getg()

casgstatus(gp, _Grunning, _Gwaiting)
    dropg()

// ...
    schedule()</code></pre><p>（1）将当前 g 的状态由 running 改为 waiting；</p><p>（2）将 g 与 m 解绑；</p><p>（3）执行新一轮的调度 schedule.</p><p>当因被动调度陷入阻塞态的 g 需要被唤醒时，会由其他协程执行 goready 方法将 g 重新置为可执行的状态，方法位于 runtime/proc.go .</p><p>被动调度如果需要唤醒，则会其他 g 负责将 g 的状态由 waiting 改为 runnable，然后会将其添加到唤醒者的 p 的本地队列中：</p><pre><code class="lang-go">func goready(gp *g, traceskip int) {
    systemstack(func() {
        ready(gp, traceskip, true)
    })
}</code></pre><pre><code class="lang-go">func ready(gp *g, traceskip int, next bool) {
    // ...
    _g_ := getg()
    // ...
    casgstatus(gp, _Gwaiting, _Grunnable)
    runqput(_g_.m.p.ptr(), gp, next)
    // ...
}</code></pre><p>（1）先将 g 的状态从阻塞态改为可执行的状态；</p><p>（2）调用 runqput 将当前 g 添加到唤醒者 p 的本地队列中，如果队列满了，会连带 g 一起将一半的元素转移到全局队列.</p><h2>4.9 goexit0</h2><p>当 g 执行完成时，会先执行 mcall 方法切换至 g0，然后调用 goexit0 方法，内容为 runtime/proc.go：</p><pre><code class="lang-go">// Finishes execution of the current goroutine.
func goexit1() {
    // ...
    mcall(goexit0)
}</code></pre><pre><code class="lang-go">func goexit0(gp *g) {
    _g_ := getg()
    _p_ := _g_.m.p.ptr()

casgstatus(gp, _Grunning, _Gdead)
    // ...
    gp.m = nil
    // ...

dropg()

// ...
    schedule()</code></pre><p>（1）将 g 状态置为 dead；</p><p>（2）解绑 g 和 m；</p><p>（3）开启新一轮的调度.</p><h2>4.10 retake</h2><p>与 4.7-4.9 小节的区别在于，抢占调度的执行者不是 g0，而是一个全局的 monitor g，代码位于 runtime/proc.go 的 retake 方法中：</p><pre><code class="lang-go">func retake(now int64) uint32 {
    n := 0
    
    lock(&amp;allpLock)
    for i := 0; i &lt; len(allp); i++ {
        _p_ := allp[i]
        if _p_ == nil {
            // This can happen if procresize has grown
            // allp but not yet created new Ps.
            continue
        }
        pd := &amp;_p_.sysmontick
        // ...
        if s == _Psyscall {            
            // ...
            if runqempty(_p_) &amp;&amp; atomic.Load(&amp;sched.nmspinning)+atomic.Load(&amp;sched.npidle) &gt; 0 &amp;&amp; pd.syscallwhen+10*1000*1000 &gt; now {
                continue
            }
            unlock(&amp;allpLock)
            if atomic.Cas(&amp;_p_.status, s, _Pidle) {
                n++
                _p_.syscalltick++
                handoffp(_p_)
            }
            incidlelocked(1)
            lock(&amp;allpLock)
        }
    }
    unlock(&amp;allpLock)
    return uint32(n)
}</code></pre><p>（1）加锁后，遍历全局的 p 队列，寻找需要被抢占的目标：</p><pre><code class="lang-go">    lock(&amp;allpLock)
    for i := 0; i &lt; len(allp); i++ {
        _p_ := allp[i]
        // ...
    }
    unlock(&amp;allpLock)</code></pre><p>（2）倘若某个 p 同时满足下述条件，则会进行抢占调度：</p><p>I 执行系统调用超过 10 ms；</p><p>II p 本地队列有等待执行的 g；</p><p>III 或者当前没有空闲的 p 和 m.</p><pre><code class="lang-go">        if s == _Psyscall {            
            // ...
            if runqempty(_p_) &amp;&amp; atomic.Load(&amp;sched.nmspinning)+atomic.Load(&amp;sched.npidle) &gt; 0 &amp;&amp; pd.syscallwhen+10*1000*1000 &gt; now {
                continue
            }
            // ... 抢占调度
            lock(&amp;allpLock)
        }</code></pre><p>（3）抢占调度的步骤是，先将当前 p 的状态更新为 idle，然后步入 handoffp 方法中，判断是否需要为 p 寻找接管的 m（因为其原本绑定的 m 正在执行系统调用）：</p><pre><code class="lang-go">            if atomic.Cas(&amp;_p_.status, s, _Pidle) {
                n++
                _p_.syscalltick++
                handoffp(_p_)
            }</code></pre><p>（4）当以下四个条件满足其一时，则需要为 p 获取新的 m：</p><p>I 当前 p 本地队列还有待执行的 g；</p><p>II 全局繁忙（没有空闲的 p 和 m，全局 g 队列为空）</p><p>III 需要处理网络 socket 读写请求</p><pre><code class="lang-go">func handoffp(_p_ *p) {
    if !runqempty(_p_) || sched.runqsize != 0 {
        startm(_p_, false)
        return
    }

if atomic.Load(&amp;sched.nmspinning)+atomic.Load(&amp;sched.npidle) == 0 &amp;&amp; atomic.Cas(&amp;sched.nmspinning, 0, 1) {
        startm(_p_, true)
        return
    }
    
    lock(&amp;sched.lock)
    // ...
    if sched.runqsize != 0 {
        unlock(&amp;sched.lock)
        startm(_p_, false)
        return
    }
    // If this is the last running P and nobody is polling network,
    // need to wakeup another M to poll network.
    if sched.npidle == uint32(gomaxprocs-1) &amp;&amp; atomic.Load64(&amp;sched.lastpoll) != 0 {
        unlock(&amp;sched.lock)
        startm(_p_, false)
        return
    }

// ...</code></pre><p>（5）获取 m 时，会先尝试获取已有的空闲的 m，若不存在，则会创建一个新的 m.</p><pre><code class="lang-go">func startm(_p_ *p, spinning bool) {
    
    mp := acquirem()
    lock(&amp;sched.lock)
    // ...
    
    nmp := mget()
    if nmp == nil {
        id := mReserveID()
        unlock(&amp;sched.lock)

var fn func()
        // ...
        newm(fn, _p_, id)
        // ...
        return
    }
    unlock(&amp;sched.lock)
    // ...
}</code></pre><h2>4.11 reentersyscall 和 exitsyscall</h2><p>本小节同样与 g 的系统调用有关，但是视角切换回发生系统调用前，与 g 绑定的原 m 当中.</p><p>在 m 需要执行系统调用前，会先执行位于 runtime/proc.go 的 reentersyscall 的方法：</p><pre><code class="lang-go">func reentersyscall(pc, sp uintptr) {
    _g_ := getg()

// ...
    save(pc, sp)
    _g_.syscallsp = sp
    _g_.syscallpc = pc
    casgstatus(_g_, _Grunning, _Gsyscall)
    // ...

pp := _g_.m.p.ptr()
    pp.m = 0
    _g_.m.oldp.set(pp)
    _g_.m.p = 0
    atomic.Store(&amp;pp.status, _Psyscall)
    // ...</code></pre><p>（1）此时执行权同样位于 m 的 g0 手中；</p><p>（2）保存当前 g 的执行环境；</p><pre><code class="lang-go">    save(pc, sp)
    _g_.syscallsp = sp
    _g_.syscallpc = p</code></pre><p>（3）将 g 和 p 的状态更新为 syscall；</p><pre><code class="lang-go">    casgstatus(_g_, _Grunning, _Gsyscall)
    atomic.Store(&amp;pp.status, _Psyscall)</code></pre><p>（4）解除 p 和 当前 m 之间的绑定，因为 m 即将进入系统调用而导致短暂不可用；</p><pre><code class="lang-go">    pp := _g_.m.p.ptr()
    pp.m = 0
    _g_.m.p = 0</code></pre><p>（5）将 p 添加到 当前 m 的 oldP 容器当中，后续 m 恢复后，会优先寻找旧的 p 重新建立绑定关系.</p><pre><code class="lang-go">_g_.m.oldp.set(pp)</code></pre><p>当 m 完成了内核态的系统调用之后，此时会步入位于 runtime/proc.go 的 exitsyscall 函数中，尝试寻找 p 重新开始运作：</p><pre><code class="lang-go">func exitsyscall() {
    _g_ := getg()
    
    // ...
    if exitsyscallfast(oldp) {
        // ...
        casgstatus(_g_, _Gsyscall, _Grunning)
        // ...
        return
    }

// ...
    mcall(exitsyscall0)
    // ...
}</code></pre><p>（1）方法执行之初，此时的执行权是普通 g.倘若此前设置的 oldp 仍然可用，则重新和 oldP 绑定，将当前 g 重新置为 running 状态，然后开始执行后续的用户函数；</p><pre><code class="lang-go">    _g_ := getg()
    
    // ...
    if exitsyscallfast(oldp) {
        // ...
        casgstatus(_g_, _Gsyscall, _Grunning)
        // ...
        return
    }</code></pre><p>（2）old 绑定失败，则调用 mcall 方法切换到 m 的 g0，并执行 exitsyscall0 方法：</p><pre><code class="lang-go">    mcall(exitsyscall0)</code></pre><pre><code class="lang-go">func exitsyscall0(gp *g) {
    casgstatus(gp, _Gsyscall, _Grunnable)
    dropg()
    lock(&amp;sched.lock)
    var _p_ *p
    if schedEnabled(gp) {
        _p_, _ = pidleget(0)
    }
    
    var locked bool
    if _p_ == nil {
        globrunqput(gp)
    } 
    
    unlock(&amp;sched.lock)
    if _p_ != nil {
        acquirep(_p_)
        execute(gp, false) // Never returns.
    }
    
    // ...
    
    stopm()
    schedule() // Never returns.
}</code></pre><p>（3）将 g 由系统调用状态切换为可运行态，并解绑 g 和 m 的关系：</p><pre><code class="lang-go">    casgstatus(gp, _Gsyscall, _Grunnable)
    dropg()</code></pre><p>（4）从全局 p 队列获取可用的 p，如果获取到了，则执行 g：</p><pre><code class="lang-go">    lock(&amp;sched.lock)
    var _p_ *p
    if schedEnabled(gp) {
        _p_, _ = pidleget(0)
    }
    unlock(&amp;sched.lock)
    if _p_ != nil {
        acquirep(_p_)
        execute(gp, false) // Never returns.
    }</code></pre><p>（5）如若无 p 可用，则将 g 添加到全局队列，当前 m 陷入沉睡. 直到被唤醒后才会继续发起调度.</p><pre><code class="lang-go">    if _p_ == nil {
        globrunqput(gp)
    } 
    stopm()
    schedule() // Never returns.</code></pre><blockquote>文章内容来自于跟敲学习视频教程  <span class="external-link"><a class="no-external-link" href="https://space.bilibili.com/317473362" target="_blank"><i data-feather="external-link"></i>@小徐先生的编程世界</a></span></blockquote>

GMP模型

1 概念梳理

1.1 线程

1.2 协程

1.3 Goroutine

2 gmp模型

2.1 g

2.2 p

2.3 m

2.4 gmp

3 核心数据结构

3.1 g

3.2 m

3.3 p

3.4 schedt

4 调度流程

4.1两种g的转换

4.2 调度类型

4.3宏观调度流程

4.4 schedule

4.5 findRunnable

4.6 execute

4.7 gosched_m

4.8 park_m 与 ready

4.9 goexit0

4.10 retake

4.11 reentersyscall 和 exitsyscall

Leave a Comment Cancel reply
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

GMP模型

windwos子系统ubuntu安装修改镜像及打开ssh链接

Redis面试题

docker Harbor 安装

jenkins 安装及部署

力扣#380. O(1) 时间插入、删除和获取随机元素

力扣#122.买卖股票的最佳时期

开了个小坑

力扣 #141 环形链表

力扣 #189 轮转数组

GMP模型

1 概念梳理

1.1 线程

1.2 协程

1.3 Goroutine

2 gmp模型

2.1 g

2.2 p

2.3 m

2.4 gmp

3 核心数据结构

3.1 g

3.2 m

3.3 p

3.4 schedt

4 调度流程

4.1两种g的转换

4.2 调度类型

4.3宏观调度流程

4.4 schedule

4.5 findRunnable

4.6 execute

4.7 gosched_m

4.8 park_m 与 ready

4.9 goexit0

4.10 retake

4.11 reentersyscall 和 exitsyscall

Leave a Comment Cancel reply 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

GMP模型

Leave a Comment Cancel reply
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款