进程与线程

# 进程与线程

# 进程的概念、组成、特征

# 进程的概念

程序：是静态的，就是个存放在磁盘里的可执行文件，如：QQ.exe。
进程：是动态的，是程序的一次执行过程，如：可同时启动多次 QQ 程序

同一个程序多次执行会对应多个进程

操作系统是这些进程的管理者，它要怎么区分各个进程？

# 进程的组成 ——PCB

当进程被创建时，操作系统会为该进程分配一个唯一的、不重复的 “身份证号”—— PID（Process ID，进程 ID）

操作系统要记录 PID、进程所属用户 ID（UID）；基本的进程描述信息，可以让操作系统区分各个进程

还要记录给进程分配了哪些资源（如：分配了多少内存、正在使用哪些 I/O 设备、正在使用哪些文件）；可用于实现操作系统对资源的管理

还要记录进程的运行情况（如：CPU 使用时间、磁盘使用情况、网络流量使用情况等）；可用于实现操作系统对进程的控制、调度

这些信息都被保存在一个数据结构 PCB （Process Control Block）中，即进程控制块操作系统需要对各个并发运行的进程进行管理，但凡管理时所需要的信息，都会被放在 PCB 中

# 进程的组成 —— 程序段、数据段

PCB 是给操作系统用的。
程序段、数据段是给进程自己用的。

# 程序是如何运行的？

一个进程实体（进程映像）由 PCB、程序段、数据段组成。
进程是动态的，进程实体（进程映像）是静态的。

进程实体反应了进程在某一时刻的状态（如：x++ 后，x=2）

# 进程的组成

引入进程实体的概念后，可把进程定义为：

进程是进程实体的运行过程，是系统进行资源分配和调度的一个独立单位。

# 进程的特征

程序是静态的，进程是动态的，相比于程序，进程拥有以下特征：

# 小结

# 进程的状态与转换

# 创建态、就绪态

进程正在被创建时，它的状态是 “创建态”，在这个阶段操作系统会为进程分配资源、初始化 PCB

当进程创建完成后，便进入 “就绪态”，处于就绪态的进程已经具备运行条件，但由于没有空闲 CPU，就暂时不能运行

# 运行态

如果一个进程此时在 CPU 上运行，那么这个进程处于 “运行态”

CPU 会执行该进程对应的程序（执行指令序列）

# 阻塞态

在进程运行的过程中，可能会请求等待某个事件的发生（如等待某种系统资源的分配，或者等待其他进程的响应）。

在这个事件发生之前，进程无法继续往下执行，此时操作系统会让这个进程下 CPU，并让它进入 “阻塞态”

当 CPU 空闲时，又会选择另一个 “就绪态” 进程上 CPU 运行

# 终止态

一个进程可以执行 exit 系统调用，请求操作系统终止该进程。此时该进程会进入 “终止态”，操作系统会让该进程下 CPU，并回收内存空间等资源，最后还要回收该进程的 PCB。

当终止进程的工作完成之后，这个进程就彻底消失了。

# 状态转换流程

运行态→阻塞态是一种进程自身做出的主动行为
阻塞态→就绪态是不是进程自身能控制的，是种被动行为。

注意：不能由阻塞态直接转换为运行态，也不能由就绪态直接转换为阻塞态，（因为进入阻塞态是进程主动请求的必然需要进程在运行时才能发出这种请求）

# 小结

进程 PCB 中，会有一个变量 state 来表示进程的当前状态。如：1 表示创建态、2 表示就绪态、3 表示运行态… 为了对同一个状态下的各个进程进行统一的管理，操作系统会将各个进程的 PCB 组织起来。

# 进程的组织方式

# 进程的组织 —— 链接方式

# 进程的组织 —— 索引方式

# 小结

# 进程控制

进程控制的主要功能是对系统中的所有进程实施有效的管理，它具有创建新进程、撤销已有进程、实现进程状态转换等功能。

简化理解：反正进程控制就是要实现进程状态转换

# 如何实现进程控制？

原语是一种特殊的程序，它的执行具有原子性。也就是说，这段程序的运行必须一气呵成，不可中断

Eg：假设 PCB 中的变量 state 表示进程当前所处状态，1 表示就绪态，2 表示阻塞态…

假设此时进程 2 等待的事件发生，则操作系统中，负责进程控制的内核程序至少需要做这样两件事：

将 PCB2 的 state 设为 1
将 PCB2 从阻塞队列放到就绪队列

如果在完成了第一步后收到中断信号，那么 PCB2 的 state=1，但是它却被放在阻塞队列里

如果不能 “一气呵成”，就有可能导致操作系统中的某些关键数据结构信息不统一的情况，这会影响操作系统进行别的管理工作

# 如何实现原语的 “原子性”？

原语的执行具有原子性，即执行过程只能一气呵成，期间不允许被中断。

可以用 “关中断指令” 和 “开中断指令” 这两个特权指令实现原子性

正常情况：CPU 每执行完一条指令都会例行检查是否有中断信号需要处理，如果有，则暂停运行当前这段程序，转而执行相应的中断处理程序。

CPU 执行了关中断指令之后，就不再例行检查中断信号，直到执行开中断指令之后才会恢复检查。

这样，关中断、开中断之间的这些指令序列就是不可被中断的，这就实现了 “原子性”

# 进程控制相关的原语

# 程序是如何运行的？

思考：执行完指令 3 后，另一个进程开始上 CPU 运行。

注意：另一个进程在运行过程中也会使用各个寄存器

之后还怎么切换回之前的进程？？

解决办法：在进程切换时先在 PCB 中保存这个进程的运行环境（保存一些必要的寄存器信息）

# 如何实现进程控制？

# 小结

无论哪个进程控制原语，要做的无非三类事情：

更新 PCB 中的信息
- 所有的进程控制原语一定都会修改进程状态标志
- 剥夺当前运行进程的 CPU 使用权必然需要保存其运行环境
- 某进程开始运行前必然要恢复期运行环境
将 PCB 插入合适的队列
分配 / 回收资源

# 进程通信

进程间通信（Inter-Process Communication， IPC）是指两个进程之间产生数据交互。

为什么进程通信需要操作系统支持？

进程是分配系统资源的单位（包括内存地址空间），因此各进程拥有的内存地址空间相互独立。

为了保证安全，一个进程不能直接访问另一个进程的地址空间。

# 共享存储

为避免出错，各个进程对共享空间的访问应该是互斥的。

各个进程可使用操作系统内核提供的同步互斥工具（如 P、V 操作）

Linux 中，如何实现共享内存：

int shm_open(……); // 通过 shm_open 系统调用，申请一片共享内存区
void * mmap (……); // 通过 mmap 系统调用，将共享内存区映射到进程自己的地址空间

1
2

注：通过 “增加页表项 / 段表项” 即可将同一片共享内存区映射到各个进程的地址空间中（第三章内容）

基于存储区的共享：操作系统在内存中划出一块共享存储区，数据的形式、存放位置都由通信进程控制，而不是操作系统。这种共享方式速度很快，是一种高级通信方式。
基于数据结构的共享：比如共享空间里只能放一个长度为 10 的数组。这种共享方式速度慢、限制多，是一种低级通信方式

# 消息传递

进程间的数据交换以格式化的消息（Message）为单位。进程通过操作系统提供的 “发送消息 / 接收消息” 两个原语进行数据交换。

# 直接通信方式

直接通信方式，点名道姓的消息传递。

# 间接通信方式

间接通信方式，以 “信箱” 作为中间实体进行消息传递

# 管道通信

管道只能采用半双工通信，某一时间段内只能实现单向的传输。如果要实现双向同时通信，则需要设置两个管道。
各进程要互斥地访问管道（由操作系统实现）
当管道写满时，写进程将阻塞，直到读进程将管道中的数据取走，即可唤醒写进程。
当管道读空时，读进程将阻塞，直到写进程往管道中写入数据，即可唤醒读进程。
管道中的数据一旦被读出，就彻底消失。因此，当多个进程读同一个管道时，可能会错乱。对此，通常有两种解决方案：
一个管道允许多个写进程，一个读进程（2014 年 408 真题高教社官方答案）；
允许有多个写进程，多个读进程，但系统会让各个读进程轮流从管道中读数据（Linux 的方案）。

# 小结

2024 版王道书修正：

写进程往管道写数据，即便管道没被写满，只要管道没空，读进程就可以从管道读数据
读进程从管道读数据，即便管道没被读空，只要管道没满，写进程就可以往管道写数据

# 线程概念多线程模型

还没引入进程之前，系统中各个程序只能串行执行。

进程是程序的一次执行。但这些功能显然不可能是由一个程序顺序处理就能实现的

有的进程可能需要 “同时” 做很多事，而传统的进程只能串行地执行一系列程序。为此，引入了 “线程”，来增加并发度。

可以把线程理解为 “轻量级进程”。

线程是一个基本的 CPU 执行单元，也是程序执行流的最小单位。

引入线程之后，不仅是进程之间可以并发，进程内的各线程之间也可以并发，从而进一步提升了系统的并发度，使得一个进程内也可以并发处理各种任务（如 QQ 视频、文字聊天、传文件）

引入线程后，进程只作为除 CPU 之外的系统资源的分配单元（如打印机、内存地址空间等都是分配给进程的）。

线程则作为处理机的分配单元。

类比：去图书馆看书。桌子 = 处理机，人 = 进程，看不同的书 = 线程切换进程运行环境：有一个不认识的人要用桌子，你需要你的书收走，他把自己的书放到桌上

同一进程内的线程切换 = 你的舍友要用这张书桌，可以不把桌子上的书收走

# 线程的属性

# 线程的实现方式

# 用户级线程

历史背景：早期的操作系统（如：早期 Unix）只支持进程，不支持线程。当时的 “线程” 是由线程库实现的

用户级线程（User-Level Thread, ULT）

用户级线程由应用程序通过线程库实现，所有的线程管理工作都由应用程序负责（包括线程切换）
用户级线程中，线程切换可以在用户态下即可完成，无需操作系统干预。
在用户看来，是有多个线程。但是在操作系统内核看来，并意识不到线程的存在。**“用户级线程”** 就是 “从用户视角看能看到的线程”

优缺点：

优点：用户级线程的切换在用户空间即可完成，不需要切换到核心态，线程管理的系统开销小，效率高
缺点：当一个用户级线程被阻塞后，整个进程都会被阻塞，并发度不高。多个线程不可在多核处理机上并行运行

# 内核级线程

内核级线程（Kernel-Level Thread, KLT, 又称 “内核支持的线程”）由操作系统支持的线程

内核级线程的管理工作由操作系统内核完成。
线程调度、切换等工作都由内核负责，因此内核级线程的切换必然需要在核心态下才能完成。
操作系统会为每个内核级线程建立相应的 TCB（Thread Control Block，线程控制块），通过 TCB 对线程进行管理。**“内核级线程”** 就是 “从操作系统内核视角看能看到的线程”

优缺点：

优点：当一个线程被阻塞后，别的线程还可以继续执行，并发能力强。多线程可在多核处理机上并行执行。
缺点：一个用户进程会占用多个内核级线程，线程切换由操作系统内核完成，需要切换到核心态，因此线程管理的成本高，开销大。

# 多线程模型

在支持内核级线程的系统中，根据用户级线程和内核级线程的映射关系，可以划分为几种多线程模型

# 一对一模型

一对一模型：一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。

优缺点：

优点：当一个线程被阻塞后，别的线程还可以继续执行，并发能力强。多线程可在多核处理机上并行执行。
缺点：一个用户进程会占用多个内核级线程，线程切换由操作系统内核完成，需要切换到核心态，因此线程管理的成本高，开销大。

# 多对一模型

多对一模型：多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。

操作系统只 “看得见” 内核级线程，因此只有内核级线程才是处理机分配的单位。

优缺点：

优点：用户级线程的切换在用户空间即可完成，不需要切换到核心态，线程管理的系统开销小，效率高
缺点：当一个用户级线程被阻塞后，整个进程都会被阻塞，并发度不高。多个线程不可在多核处理机上并行运行

# 多对多模型

多对多模型：n 用户及线程映射到 m 个内核级线程（n >= m）。每个用户进程对应 m 个内核级线程。克服了多对一模型并发度不高的缺点（一个阻塞全体阻塞），又克服了一对一模型中一个用户进程占用太多内核级线程，开销太大的缺点。

内核级线程才是处理机分配的单位。例如：多核 CPU 环境下，左边这个进程最多能被分配两个核。

内核级线程中可以运行任意一个有映射关系的用户级线程代码，只有两个内核级线程中正在运行的代码逻辑都阻塞时，这个进程才会阻塞

# 小结

# 线程的状态与转换

# 线程的组织与控制

# 调度的概念、层次

# 调度的基本概念

当有一堆任务要处理，但由于资源有限，这些事情没法同时处理。这就需要确定某种规则来决定处理这些任务的顺序，这就是 “调度” 研究的问题。

# 调度的三个层次

# 高级调度

高级调度（作业调度）。按一定的原则从外存的作业后备队列中挑选一个作业调入内存，并创建进程。每个作业只调入一次，调出一次。作业调入时会建立 PCB，调出时才撤销 PCB。

# 低级调度

低级调度（进程调度 / 处理机调度）—— 按照某种策略从就绪队列中选取一个进程，将处理机分配给它。

进程调度是操作系统中最基本的一种调度，在一般的操作系统中都必须配置进程调度。进程调度的频率很高，一般几十毫秒一次。

# 中级调度

内存不够时，可将某些进程的数据调出外存。等内存空闲或者进程需要运行时再重新调入内存。

暂时调到外存等待的进程状态为挂起状态。被挂起的进程 PCB 会被组织成挂起队列

中级调度（内存调度）—— 按照某种策略决定将哪个处于挂起状态的进程重新调入内存。

一个进程可能会被多次调出、调入内存，因此中级调度发生的频率要比高级调度更高。

# 三层调度的联系、对比

# 进程的挂起态与七状态模型

暂时调到外存等待的进程状态为挂起状态（挂起态，suspend）

挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态

五状态模型 → 七状态模型

注意 “挂起” 和 “阻塞” 的区别，两种状态都是暂时不能获得 CPU 的服务，但挂起态是将进程映像调到外存去了，而阻塞态下进程映像还在内存中。

有的操作系统会把就绪挂起、阻塞挂起分为两个挂起队列，甚至会根据阻塞原因不同再把阻塞挂起进程进一步细分为多个队列。

# 小结

# 调度的目标

# CPU 利用率

由于早期的 CPU 造价极其昂贵，因此人们会希望让 CPU 尽可能多地工作

CPU 利用率：指 CPU “忙碌” 的时间占总时间的比例。

$利用率 = \frac{忙碌的时间}{总时间}$

Eg：某计算机只支持单道程序，某个作业刚开始需要在 CPU 上运行 5 秒，再用打印机打印输出 5 秒，之后再执行 5 秒，才能结束。在此过程中，CPU 利用率、打印机利用率分别是多少？

$\begin{array}{l} CPU利用率 = \frac{5 + 5}{5 + 5 + 5} = 66.66 % \\ 打印机利用率 = \frac{5}{15} = 33.33 % \end{array}$

通常会考察多道程序并发执行的情况，可以用 “甘特图” 来辅助计算

# 系统吞吐量

对于计算机来说，希望能用尽可能少的时间处理完尽可能多的作业

系统吞吐量：单位时间内完成作业的数量

$系统吞吐量 = \frac{总共完成了多少道作业}{总共花了多少时间}$

Eg：某计算机系统处理完 10 道作业，共花费 100 秒，则系统吞吐量为？

$\frac{10}{100} = 0.1 道 / 秒$

# 周转时间

对于计算机的用户来说，他很关心自己的作业从提交到完成花了多少时间。

周转时间，是指从作业被提交给系统开始，到作业完成为止的这段时间间隔。

它包括四个部分：

作业在外存后备队列上等待作业调度（高级调度）的时间
进程在就绪队列上等待进程调度（低级调度）的时间
进程在 CPU 上执行的时间
进程等待 I/O 操作完成的时间

后三项在一个作业的整个处理过程中，可能发生多次。

周转时间 = 作业完成时间 – 作业提交时间，对于用户来说，更关心自己的单个作业的周转时间

$平均周转时间 = \frac{各作业周转时间之和}{作业数}$ ，对于操作系统来说，更关心系统的整体表现，因此更关心所有作业周转时间的平均值

思考：有的作业运行时间短，有的作业运行时间长，因此在周转时间相同的情况下，运行时间不同的作业，给用户的感觉肯定是不一样的

$带权周转时间 = \frac{作业周转时间}{作业实际运行的时间} = \frac{作业完成时间 - 作业提交时间}{作业实际运行的时间}$

$平均带权周转时间 = \frac{各作业带权周转时间之和}{作业数}$

带权周转时间必然 ≥ 1，带权周转时间与周转时间都是越小越好

对于周转时间相同的两个作业，实际运行时间长的作业在相同时间内被服务的时间更多，带权周转时间更小，用户满意度更高。

# 等待时间

计算机的用户希望自己的作业尽可能少的等待处理机

等待时间，指进程 / 作业处于等待处理机状态时间之和，等待时间越长，用户满意度越低。

对于进程来说，等待时间就是指进程建立后等待被服务的时间之和，在等待 I/O 完成的期间其实进程也是在被服务的，所以不计入等待时间。
对于作业来说，不仅要考虑建立进程后的等待时间，还要加上作业在外存后备队列中等待的时间。

一个作业总共需要被 CPU 服务多久，被 I/O 设备服务多久一般是确定不变的，因此调度算法其实只会影响作业 / 进程的等待时间。当然，与前面指标类似，也有 **“平均等待时间”** 来评价整体性能。

# 响应时间

对于计算机用户来说，会希望自己的提交的请求（比如通过键盘输入了一个调试命令）尽早地开始被系统服务、回应。响应时间，指从用户提交请求到首次产生响应所用的时间。

# 小结

# 进程调度的时机切换与过程调度方式

# 进程调度的时机

进程调度（低级调度），就是按照某种算法从就绪队列中选择一个进程为其分配处理机。

进程在操作系统内核程序临界区中不能进行调度与切换

临界资源：一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。
临界区：访问临界资源的那段代码。

内核程序临界区一般是用来访问某种内核数据结构的，比如进程的就绪队列（由各就绪进程的 PCB 组成）

# 进程调度的方式

非剥夺调度方式，又称非抢占方式。即，只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达，当前进程依然会继续使用处理机，直到该进程终止或主动要求进入阻塞态。
剥夺调度方式，又称抢占方式。当一个进程正在处理机上执行时，如果有一个更重要或更紧迫的进程需要使用处理机，则立即暂停正在执行的进程，将处理机分配给更重要紧迫的那个进程。

# 进程的切换与过程

“狭义的进程调度” 与 “进程切换” 的区别：

狭义的进程调度指的是从就绪队列中选中一个要运行的进程。（这个进程可以是刚刚被暂停执行的进程，也可能是另一个进程，后一种情况就需要进程切换）
进程切换是指一个进程让出处理机，由另一个进程占用处理机的过程。

广义的进程调度包含了选择一个进程和进程切换两个步骤。

进程切换的过程主要完成了：

对原来运行进程各种数据的保存
对新的进程各种数据的恢复（如：程序计数器、程序状态字、各种数据寄存器等处理机现场信息，这些信息一般保存在进程控制块）

注意：进程切换是有代价的，因此如果过于频繁的进行进程调度、切换，必然会使整个系统的效率降低，使系统大部分时间都花在了进程切换上，而真正用于执行进程的时间减少。

# 小结

# 调度器、闲逛进程

# 调度器 / 调度程序（scheduler）

②、③由调度程序引起，调度程序决定：让谁运行？—— 调度算法运行多长时间？—— 时间片大小

调度时机 —— 什么事件会触发 “调度程序” ？

创建新进程
进程退出
运行进程阻塞
I/O 中断发生（可能唤醒某些阻塞进程）

两种调度方式的区别

非抢占式调度策略，只有运行进程阻塞或退出才触发调度程序工作
抢占式调度策略，每个时钟中断或 k 个时钟中断会触发调度程序工作

不支持内核级线程的操作系统，调度程序的处理对象是进程

支持内核级线程的操作系统，调度程序的处理对象是内核线程

# 闲逛进程

调度程序永远的备胎，没有其他就绪进程时，运行闲逛进程（idle）

闲逛进程的特性：

优先级最低
可以是 0 地址指令，占一个完整的指令周期（指令周期末尾例行检查中断）
能耗低

# 调度算法

各种调度算法的学习思路

算法思想
算法规则
这种调度算法是用于作业调度还是进程调度？
抢占式？非抢占式？
优点和缺点
是否会导致饥饿（某进程 / 作业长期得不到服务）

# 先来先服务（ FCFS, FirstCome First Serve ）

算法思想：主要从 “公平” 的角度考虑（类似于我们生活中排队买东西的例子）
算法规则：按照作业 / 进程到达的先后顺序进行服务
作业调度 / 进程调度：用于作业调度时，考虑的是哪个作业先到达后备队列；用于进程调度时，考虑的是哪个进程先到达就绪队列
抢占式？：非抢占式的算法
优缺点：
- 优点：公平、算法实现简单
- 缺点：排在长作业（进程）后面的短作业需要等待很长时间，带权周转时间很大，对短作业来说用户体验不好。即，FCFS 算法对长作业有利，对短作业不利（Eg ：排队买奶茶…）
是否会导致饥饿：不会

例题：各进程到达就绪队列的时间、需要的运行时间如下表所示。使用先来先服务调度算法，计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。

# 短作业优先（ SJF, ShortestJob First ）

算法思想：追求最少的平均等待时间，最少的平均周转时间、最少的平均平均带权周转时间
算法规则：最短的作业 / 进程优先得到服务（所谓 “最短”，是指要求服务时间最短）
作业调度 / 进程调度：即可用于作业调度，也可用于进程调度。用于进程调度时称为 “短进程优先（SPF, Shortest Process First）算法”
抢占式？：SJF 和 SPF 是非抢占式的算法。但是也有抢占式的版本 —— 最短剩余时间优先算法（SRTN, Shortest Remaining Time Next）
优缺点：
- 优点：“最短的” 平均等待时间、平均周转时间
- 缺点：不公平。对短作业有利，对长作业不利。可能产生饥饿现象。另外，作业 / 进程的运行时间是由用户提供的，并不一定真实，不一定能做到真正的短作业优先
是否会导致饥饿：会。如果源源不断地有短作业 / 进程到来，可能使长作业 / 进程长时间得不到服务，产生 “饥饿” 现象。如果一直得不到服务，则称为 “饿死”

例题：各进程到达就绪队列的时间、需要的运行时间如下表所示。使用非抢占式的短作业优先调度算法，计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。

例题：各进程到达就绪队列的时间、需要的运行时间如下表所示。使用抢占式的短作业优先调度算法，计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。

注意几个小细节：

如果题目中未特别说明，所提到的 “短作业 / 进程优先算法” 默认是非抢占式的
很多书上都会说 “SJF 调度算法的平均等待时间、平均周转时间最少” 严格来说，这个表述是错误的，不严谨的。之前的例子表明，最短剩余时间优先算法得到的平均等待时间、平均周转时间还要更少应该加上一个条件 “在所有进程同时可运行时，采用 SJF 调度算法的平均等待时间、平均周转时间最少”；或者说 “在所有进程都几乎同时到达时，采用 SJF 调度算法的平均等待时间、平均周转时间最少”；如果不加上述前提条件，则应该说 “抢占式的短作业 / 进程优先调度算法（最短剩余时间优先，SRNT 算法）的平均等待时间、平均周转时间最少”
虽然严格来说，SJF 的平均等待时间、平均周转时间并不一定最少，但相比于其他算法（如 FCFS）， SJF 依然可以获得较少的平均等待时间、平均周转时间
如果选择题中遇到 “SJF 算法的平均等待时间、平均周转时间最少” 的选项，那最好判断其他选项是不是有很明显的错误，如果没有更合适的选项，那也应该选择该选项

# 高响应比优先（ HRRN,Highest Response Ratio Next ）

算法思想：要综合考虑作业 / 进程的等待时间和要求服务的时间
算法规则：在每次调度时先计算各个作业 / 进程的响应比，选择响应比最高的作业 / 进程为其服务 $响应比 = \frac{等待时间 + 要求服务时间}{要求服务时间}$
作业调度 / 进程调度：即可用于作业调度，也可用于进程调度
抢占式？：非抢占式的算法。因此只有当前运行的作业 / 进程主动放弃处理机时，才需要调度，才需要计算响应比
优缺点：综合考虑了等待时间和运行时间（要求服务时间）等待时间相同时，要求服务时间短的优先（SJF 的优点）要求服务时间相同时，等待时间长的优先（FCFS 的优点）对于长作业来说，随着等待时间越来越久，其响应比也会越来越大，从而避免了长作业饥饿的问题
是否会导致饥饿：不会

例题：各进程到达就绪队列的时间、需要的运行时间如下表所示。使用高响应比优先调度算法，计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。

# 时间片轮转（ RR, Round-Robin ）

算法思想：公平地、轮流地为各个进程服务，让每个进程在一定时间间隔内都可以得到响应
算法规则：按照各进程到达就绪队列的顺序，轮流让各个进程执行一个时间片（如 100ms）。若进程未在一个时间片内执行完，则剥夺处理机，将进程重新放到就绪队列队尾重新排队。
作业调度 / 进程调度：用于进程调度（只有作业放入内存建立了相应的进程后，才能被分配处理机时间片）
抢占式？：若进程未能在时间片内运行完，将被强行剥夺处理机使用权，因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知 CPU 时间片已到
优缺点：
- 优点：公平；响应快，适用于分时操作系统；
- 缺点：由于高频率的进程切换，因此有一定开销；不区分任务的紧急程度
是否会导致饥饿：不会
补充：时间片太大或太小分别有什么影响？

例题：各进程到达就绪队列的时间、需要的运行时间如下表所示。使用时间片轮转调度算法，分析时间片大小分别是 2、5 时的进程运行情况。

常用于分时操作系统，更注重 “响应时间”，因而此处不计算周转时间

如果时间片太大，使得每个进程都可以在一个时间片内就完成，则时间片轮转调度算法退化为先来先服务调度算法，并且会增大进程响应时间。因此时间片不能太大。

比如：系统中有 10 个进程在并发执行，如果时间片为 1 秒，则一个进程被响应可能需要等 9 秒… 也就是说，如果用户在自己进程的时间片外通过键盘发出调试命令，可能需要等待 9 秒才能被系统响应

另一方面，进程调度、切换是有时间代价的（保存、恢复运行环境），因此如果时间片太小，会导致进程切换过于频繁，系统会花大量的时间来处理进程切换，从而导致实际用于进程执行的时间比例减少。可见时间片叶不能太小。

# 优先级调度算法

算法思想：随着计算机的发展，特别是实时操作系统的出现，越来越多的应用场景需要根据任务的紧急程度来决定处理顺序
算法规则：每个作业 / 进程有各自的优先级，调度时选择优先级最高的作业 / 进程
作业调度 / 进程调度：既可用于作业调度，也可用于进程调度。甚至，还会用于在之后会学习的 I/O 调度中
抢占式？：抢占式、非抢占式都有。做题时的区别在于：非抢占式只需在进程主动放弃处理机时进行调度即可，而抢占式还需在就绪队列变化时，检查是否会发生抢占。
优缺点：
- 优点：用优先级区分紧急程度、重要程度，适用于实时操作系统。可灵活地调整对各种作业 / 进程的偏好程度。
- 缺点：若源源不断地有高优先级进程到来，则可能导致饥饿
是否会导致饥饿：会

例题：各进程到达就绪队列的时间、需要的运行时间、进程优先数如下表所示。使用非抢占式的优先级调度算法，分析进程运行情况。（注：优先数越大，优先级越高）

例题：各进程到达就绪队列的时间、需要的运行时间、进程优先数如下表所示。使用抢占式的优先级调度算法，分析进程运行情况。（注：优先数越大，优先级越高）

补充：就绪队列未必只有一个，可以按照不同优先级来组织。另外，也可以把优先级高的进程排在更靠近队头的位置

根据优先级是否可以动态改变，可将优先级分为静态优先级和动态优先级两种。

静态优先级：创建进程时确定，之后一直不变。
动态优先级：创建进程时有一个初始值，之后会根据情况动态地调整优先级。

如何合理地设置各类进程的优先级？

系统进程优先级高于用户进程
前台进程优先级高于后台进程
操作系统更偏好 I/O 型进程（或称 I/O 繁忙型进程）

注：与 I/O 型进程相对的是计算型进程（或称 CPU 繁忙型进程）

I/O 设备和 CPU 可以并行工作。如果优先让 I/O 繁忙型进程优先运行的话，则越有可能让 I/O 设备尽早地投入工作，则资源利用率、系统吞吐量都会得到提升

如果采用的是动态优先级，什么时候应该调整？

可以从追求公平、提升资源利用率等角度考虑

如果某进程在就绪队列中等待了很长时间，则可以适当提升其优先级
如果某进程占用处理机运行了很长时间，则可适当降低其优先级
如果发现一个进程频繁地进行 I/O 操作，则可适当提升其优先级

# 多级反馈队列调度算法

算法思想：对其他调度算法的折中权衡
算法规则：
- 设置多级就绪队列，各级队列优先级从高到低，时间片从小到大
- 新进程到达时先进入第 1 级队列，按 FCFS 原则排队等待被分配时间片，若用完时间片进程还未结束，则进程进入下一级队列队尾。如果此时已经是在最下级的队列，则重新放回该队列队尾
1. 只有第 k 级队列为空时，才会为 k+1 级队头的进程分配时间片
作业调度 / 进程调度：用于进程调度
抢占式？：抢占式的算法。在 k 级队列的进程运行过程中，若更上级的队列（1~k-1 级）中进入了一个新进程，则由于新进程处于优先级更高的队列中，因此新进程会抢占处理机，原来运行的进程放回 k 级队列队尾。
优缺点：
- 对各类型进程相对公平（FCFS 的优点）；
- 每个新到达的进程都可以很快就得到响应（RR 的优点）；
- 短进程只用较少的时间就可完成（SPF 的优点）；
- 不必实现估计进程的运行时间（避免用户作假）；
- 可灵活地调整对各类进程的偏好程度，比如 CPU 密集型进程、I/O 密集型进程（拓展：可以将因 I/O 而阻塞的进程重新放回原队列，这样 I/O 型进程就可以保持较高优先级）
是否会导致饥饿：会

例题：各进程到达就绪队列的时间、需要的运行时间如下表所示。使用多级反馈队列调度算法，分析进程运行的过程。

设置多级就绪队列，各级队列优先级从高到低，时间片从小到大

新进程到达时先进入第 1 级队列，按 FCFS 原则排队等待被分配时间片。若用完时间片进程还未结束，则进程进入下一级队列队尾。如果此时已经在最下级的队列，则重新放回最下级队列队尾

只有第 k 级队列为空时，才会为 k+1 级队头的进程分配时间片 被抢占处理机的进程重新放回原队列队尾巴

# 多级队列调度算法

队列之间可采取固定优先级，或时间片划分

固定优先级：高优先级空时低优先级进程才能被调度
时间片划分：如三个队列分配时间 50%、40%、10%

各队列可采用不同的调度策略，如：

系统进程队列采用优先级调度
交互式队列采用 RR
批处理队列采用 FCFS

# 小结

注：这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标，但是不关心 “响应时间”，也并不区分任务的紧急程度，因此对于用户来说，交互性很糟糕。因此这三种算法一般适合用于早期的批处理系统，当然，FCFS 算法也常结合其他的算法使用，在现在也扮演着很重要的角色。而适合用于交互式系统的调度算法将在下个小节介绍…

注：比起早期的批处理操作系统来说，由于计算机造价大幅降低，因此之后出现的交互式操作系统（包括分时操作系统、实时操作系统等）更注重系统的响应时间、公平性、平衡性等指标。而这几种算法恰好也能较好地满足交互式系统的需求。因此这三种算法适合用于交互式系统。（比如 UNIX 使用的就是多级反馈队列调度算法）

# 进程同步进程互斥

# 进程同步

进程具有异步性的特征。异步性是指，各并发执行的进程以各自独立的、不可预知的速度向前推进。

操作系统要提供 “进程同步机制” 来解决异步问题

读进程和写进程并发地运行，由于并发必然导致异步性，因此 “写数据” 和 “读数据” 两个操作执行的先后顺序是不确定的。而实际应用中，又必须按照 “写数据→读数据” 的顺序来执行的。

如何解决这种异步问题，就是 “进程同步” 所讨论的内容。

同步亦称直接制约关系，它是指为完成某种任务而建立的两个或多个进程，这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系。进程间的直接制约关系就是源于它们之间的相互合作。

# 进程互斥

进程的 “并发” 需要 “共享” 的支持。各个并发执行的进程不可避免的需要共享一些系统资源（比如内存，又比如打印机、摄像头这样的 I/O 设备）

我们把一个时间段内只允许一个进程使用的资源称为临界资源。许多物理设备（比如摄像头、打印机）都属于临界资源。此外还有许多变量、数据、内存缓冲区等都属于临界资源。

对临界资源的访问，必须互斥地进行。互斥，亦称间接制约关系。进程互斥指当一个进程访问某临界资源时，另一个想要访问该临界资源的进程必须等待。当前访问临界资源的进程访问结束，释放该资源之后，另一个进程才能去访问临界资源。

对临界资源的互斥访问，可以在逻辑上分为如下四个部分：

注意：

临界区是进程中访问临界资源的代码段。

进入区和退出区是负责实现互斥的代码段。

临界区也可称为 “临界段”。

为了实现对临界资源的互斥访问，同时保证系统整体性能，需要遵循以下原则：

空闲让进。临界区空闲时，可以允许一个请求进入临界区的进程立即进入临界区；
忙则等待。当已有进程进入临界区时，其他试图进入临界区的进程必须等待；
有限等待。对请求访问的进程，应保证能在有限时间内进入临界区（保证不会饥饿）；
让权等待。当进程不能进入临界区时，应立即释放处理机，防止进程忙等待。

# 进程互斥的软件实现方法

# 如果没有注意进程互斥

进程 A、进程 B 在系统中并发地运行

先调度 A 上处理机运行当 A 在使用打印机的过程中，分配给它的时间片用完了，接下来操作系统调度 B 让它上处理机运行进程 B 也在使用打印机

结局：A、B 的打印内容混在一起了

# 单标志法

算法思想：两个进程在 访问完临界区后 会把使用临界区的权限转交给另一个进程。也就是说每个进程进入临界区的权限只能被另一个进程赋予

turn 的初值为 0，即刚开始只允许 0 号进程进入临界区。若 P1 先上处理机运行，则会一直卡在 ⑤。直到 P1 的时间片用完，发生调度，切换 P0 上处理机运行。代码 ① 不会卡住 P0，P0 可以正常访问临界区，在 P0 访问临界区期间即时切换回 P1，P1 依然会卡在 ⑤。只有 P0 在退出区将 turn 改为 1 后，P1 才能进入临界区。

因此，该算法可以实现 “同一时刻最多只允许一个进程访问临界区”

只能按 P0 → P1 → P0 → P1 →…… 这样轮流访问。这种必须 “轮流访问” 带来的问题是，如果此时允许进入临界区的进程是 P0，而 P0 一直不访问临界区，那么虽然此时临界区空闲，但是并不允许 P1 访问。

因此，单标志法存在的主要问题是：违背 “空闲让进” 原则。

# 双标志先检查法

算法思想：设置一个布尔型数组 flag []，数组中各个元素用来标记各进程想进入临界区的意愿，比如 “flag [0] = ture” 意味着 0 号进程 P0 现在想要进入临界区。每个进程在进入临界区之前先检查当前有没有别的进程想进入临界区，如果没有，则把自身对应的标志 flag [i] 设为 true，之后开始访问临界区。

若按照 ①⑤②⑥③⑦…. 的顺序执行，P0 和 P1 将会同时访问临界区。因此，双标志先检查法的主要问题是：违反 “忙则等待” 原则。原因在于，进入区的 “检查” 和 “上锁” 两个处理不是一气呵成的。“检查” 后，“上锁” 前可能发生进程切换。

# 双标志后检查法

算法思想：双标志先检查法的改版。前一个算法的问题是先 “检查” 后 “上锁”，但是这两个操作又无法一气呵成，因此导致了两个进程同时进入临界区的问题。因此，人们又想到 ** 先 “上锁” 后 “检查”** 的方法，来避免上述问题。

若按照 ①⑤②⑥…. 的顺序执行，P0 和 P1 将都无法进入临界区因此，双标志后检查法 ** 虽然解决了 “忙则等待” 的问题，但是又违背了 “空闲让进” 和 “有限等待”** 原则，会因各进程都长期无法访问临界资源而产生 “饥饿” 现象。两个进程都争着想进入临界区，但是谁也不让谁，最后谁都无法进入临界区。

# Peterson 算法

算法思想：结合双标志法、单标志法的思想。如果双方都争着想进入临界区，那可以让进程尝试 “孔融让梨”（谦让）。做一个有礼貌的进程。

进入区:

主动争取；
主动谦让；
检查对方是否也想使用，且最后一次是不是自己说了 “客气话”

Peterson 算法用软件方法解决了进程互斥问题，遵循了空闲让进、忙则等待、有限等待三个原则，但是依然未遵循让权等待的原则。 Peterson 算法相较于之前三种软件解决方案来说，是最好的，但依然不够好。

# 小结

# 进程互斥的硬件实现方法

# 中断屏蔽方法

利用 “开 / 关中断指令” 实现（与原语的实现思想相同，即在某进程开始访问临界区到结束访问为止都不允许被中断，也就不能发生进程切换，因此也不可能发生两个同时访问临界区的情况）

优点：简单、高效缺点：不适用于多处理机；只适用于操作系统内核进程，不适用于用户进程（因为开 / 关中断指令只能运行在内核态，这组指令如果能让用户随意使用会很危险）

# TestAndSet 指令

简称 TS 指令，也有地方称为 TestAndSetLock 指令，或 TSL 指令 TSL 指令是用硬件实现的，执行的过程不允许被中断，只能一气呵成。以下是用 C 语言描述的逻辑

若刚开始 lock 是 false，则 TSL 返回的 old 值为 false，while 循环条件不满足，直接跳过循环，进入临界区。若刚开始 lock 是 true，则执行 TLS 后 old 返回的值为 true，while 循环条件满足，会一直循环，直到当前访问临界区的进程在退出区进行 “解锁”。

相比软件实现方法，TSL 指令把 “上锁” 和 “检查” 操作用硬件的方式变成了一气呵成的原子操作。

优点：实现简单，无需像软件实现方法那样严格检查是否会有逻辑漏洞；适用于多处理机环境
缺点：不满足 “让权等待” 原则，暂时无法进入临界区的进程会占用 CPU 并循环执行 TSL 指令，从而导致 “忙等”。

# Swap 指令

有的地方也叫 Exchange 指令，或简称 XCHG 指令。 Swap 指令是用硬件实现的，执行的过程不允许被中断，只能一气呵成。以下是用 C 语言描述的逻辑

逻辑上来看 Swap 和 TSL 并无太大区别，都是先记录下此时临界区是否已经被上锁（记录在 old 变量上），再将上锁标记 lock 设置为 true，最后检查 old，如果 old 为 false 则说明之前没有别的进程对临界区上锁，则可跳出循环，进入临界区。优点：实现简单，无需像软件实现方法那样严格检查是否会有逻辑漏洞；适用于多处理机环境缺点：不满足 “让权等待” 原则，暂时无法进入临界区的进程会占用 CPU 并循环执行 TSL 指令，从而导致 “忙等”。

# 小结

# 互斥锁

解决临界区最简单的工具就是互斥锁 (mutex lock)。一个进程在进入临界区时应获得锁；在退出临界区时释放锁。函数 acquire () 获得锁，而函数 release () 释放锁。每个互斥锁有一个布尔变量 available, 表示锁是否可用。如果锁是可用的，调用 acqiure () 会成功，且锁不再可用。当一个进程试图获取不可用的锁时，会被阻塞，直到锁被释放。

acquire () 或 release () 的执行必须是原子操作，因此互斥锁通常采用硬件机制来实现。互斥锁的主要缺点是忙等待，当有一个进程在临界区中，任何其他进程在进入临界区时必须连续循环调用 acquire ()。当多个进程共享同一 CPU 时，就浪费了 CPU 周期。因此，互斥锁通常用于多处理器系统，一个线程可以在一个处理器上等待，不影响其他线程的执行。

需要连续循环忙等的互斥锁，都可称为自旋锁（spin lock），如 TSL 指令、swap 指令、单标志法

特性：

需忙等，进程时间片用完才下处理机，违反 “让权等待”
优点：等待期间不用切换进程上下文，多处理器系统中，若上锁的时间短，则等待代价很低
常用于多处理器系统，一个核忙等，其他核照常工作，并快速释放临界区
不太适用于单处理机系统，忙等的过程中不可能解锁

# 信号量机制

1965 年，荷兰学者 Dijkstra 提出了一种卓有成效的实现进程互斥、同步的方法 —— 信号量机制

用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作，从而很方便的实现了进程互斥、进程同步。

信号量其实就是一个变量（可以是一个整数，也可以是更复杂的记录型变量），可以用一个信号量来表示系统中某种资源的数量，比如：系统中只有一台打印机，就可以设置一个初值为 1 的信号量。

原语是一种特殊的程序段，其执行只能一气呵成，不可被中断。原语是由关中断 / 开中断指令实现的。软件解决方案的主要问题是由 “进入区的各种操作无法一气呵成”，因此如果能把进入区、退出区的操作都用 “原语” 实现，使这些操作能 “一气呵成” 就能避免问题。

一对原语：wait (S) 原语和 signal (S) 原语，可以把原语理解为我们自己写的函数，函数名分别为 wait 和 signal，括号里的信号量 S 其实就是函数调用时传入的一个参数。

wait、signal 原语常简称为 P、V 操作（来自荷兰语 proberen 和 verhogen）。因此，做题的时候常把 wait (S)、signal (S) 两个操作分别写为 P(S)、V(S)

# 整型信号量

用一个整数型的变量作为信号量，用来表示系统中某种资源的数量。(与普通整数变量的区别：对信号量的操作只有三种，即初始化、P 操作、V 操作)

Eg ：某计算机系统中有一台打印机…

# 记录型信号量

整型信号量的缺陷是存在 “忙等” 问题，因此人们又提出了 “记录型信号量”，即用记录型数据结构表示的信号量。

在考研题目中 wait (S)、signal (S) 也可以记为 P (S)、V (S)，这对原语可用于实现系统资源的 “申请” 和 “释放”。

S.value 的初值表示系统中某种资源的数目

对信号量 S 的一次 P 操作意味着进程请求一个单位的该类资源，因此需要执行 S.value--，表示资源数减 1，当 S.value < 0 时表示该类资源已分配完毕，因此进程应调用 block 原语进行自我阻塞（当前运行的进程从运行态→阻塞态），主动放弃处理机，并插入该类资源的等待队列 S.L 中。可见，该机制遵循了 “让权等待” 原则，不会出现 “忙等” 现象

对信号量 S 的一次 V 操作意味着进程释放一个单位的该类资源，因此需要执行 S.value++，表示资源数加 1，若加 1 后仍是 S.value <= 0，表示依然有进程在等待该类资源，因此应调用 wakeup 原语唤醒等待队列中的第一个进程（被唤醒进程从阻塞态→就绪态）

# 小结

# 信号量机制实现进程互斥、同步、前驱关系

一个信号量对应一种资源

P (S) —— 申请一个资源 S，如果资源不够就阻塞等待
V (S) —— 释放一个资源 S，如果有进程在等待该资源，则唤醒一个进程

# 实现进程互斥

分析并发进程的关键活动，划定临界区（如：对临界资源打印机的访问就应放在临界区）
设置互斥信号量 mutex ，初值为 1
在进入区 P (mutex)—— 申请资源
在退出区 V (mutex)—— 释放资源

要会自己定义记录型信号量，但如果题目中没特别说明，可以把信号量的声明简写成这种形式（不用声明定义）

注意：对不同的临界资源需要设置不同的互斥信号量。

P、V 操作必须成对出现。

缺少 P (mutex) 就不能保证临界资源的互斥访问。
缺少 V (mutex) 会导致资源永不被释放，等待进程永不被唤醒。

# 实现进程同步

进程同步：要让各并发进程按要求有序地推进

比如，P1、P2 并发执行，由于存在异步性，因此二者交替推进的次序是不确定的。若 P2 的 “代码 4” 要基于 P1 的 “代码 1” 和 “代码 2” 的运行结果才能执行，那么我们就必须保证 “代码 4” 一定是在 “代码 2” 之后才会执行。这就是进程同步问题，让本来异步并发的进程互相配合，有序推进

用信号量实现进程同步：

分析什么地方需要实现 “同步关系”，即必须保证 “一前一后” 执行的两个操作（或两句代码）
设置同步信号量 S, 初始为 0
在 “前操作” 之后执行 V (S)
在 “后操作” 之前执行 P (S)

若先执行到 V (S) 操作，则 S++ 后 S=1。之后当执行到 P (S) 操作时，由于 S=1，表示有可用资源，会执行 S--，S 的值变回 0，P2 进程不会执行 block 原语，而是继续往下执行代码 4。

若先执行到 P (S) 操作，由于 S=0，S-- 后 S=-1，表示此时没有可用资源，因此 P 操作中会执行 block 原语，主动请求阻塞。之后当执行完代码 2，继而执行 V (S) 操作， S++，使 S 变回 0，由于此时有进程在该信号量对应的阻塞队列中，因此会在 V 操作中执行 wakeup 原语，唤醒 P2 进程。这样 P2 就可以继续执行代码 4 了

# 实现前驱关系

进程 P1 中有句代码 S1，P2 中有句代码 S2 ，P3 中有句代码 S3 …… P6 中有句代码 S6。这些代码要求按如下前驱图所示的顺序来执行：

其实每一对前驱关系都是一个进程同步问题（需要保证一前一后的操作）因此：

要为每一对前驱关系各设置一个同步信号量
在 “前操作” 之后对相应的同步信号量执行 V 操作
在 “后操作” 之前对相应的同步信号量执行 P 操作

# 小结

# 管程

# 为什么要引入管程

信号量机制存在的问题：编写程序困难、易出错，1973 年，Brinch Hansen 首次在程序设计语言 (Pascal) 中引入了 “管程” 成分 —— 一种高级同步机制

# 管程的定义和基本特征

管程是一种特殊的软件模块，有这些部分组成：

局部于管程的共享数据结构说明；
对该数据结构进行操作的一组过程；
对局部于管程的共享数据设置初始值的语句；
管程有一个名字。

管程的基本特征：

局部于管程的数据只能被局部于管程的过程所访问；
一个进程只有通过调用管程内的过程才能进入管程访问共享数据；
每次仅允许一个进程在管程内执行某个内部过程。

# 管程解决生产者消费者问题

每次仅允许一个进程在管程内执行某个内部过程

引入管程的目的无非就是要更方便地实现进程互斥和同步。

需要在管程中定义共享数据（如生产者消费者问题的缓冲区）
需要在管程中定义用于访问这些共享数据的 “入口”—— 其实就是一些函数（如生产者消费者问题中，可以定义一个函数用于将产品放入缓冲区，再定义一个函数用于从缓冲区取出产品）
只有通过这些特定的 “入口” 才能访问共享数据
管程中有很多 “入口”，但是每次只能开放其中一个 “入口”，并且只能让一个进程或线程进入（如生产者消费者问题中，各进程需要互斥地访问共享缓冲区。管程的这种特性即可保证一个时间段内最多只会有一个进程在访问缓冲区。注意：这种互斥特性是由编译器负责实现的，程序员不用关心）
可在管程中设置条件变量及等待 / 唤醒操作以解决同步问题。可以让一个进程或线程在条件变量上等待（此时，该进程应先释放管程的使用权，也就是让出 “入口”）；可以通过唤醒操作将等待在条件变量上的进程或线程唤醒。

程序员可以用某种特殊的语法定义一个管程（比如: monitor ProducerConsumer …… end monitor;），之后其他程序员就可以使用这个管程提供的特定 “入口” 很方便地使用实现进程同步 / 互斥了。

# Java 中类似于管程的机制

Java 中，如果用关键字 synchronized 来描述一个函数，那么这个函数同一时间段内只能被一个线程调用

# 小结

# 生产者消费者问题

系统中有一组生产者进程和一组消费者进程，生产者进程每次生产一个产品放入缓冲区，消费者进程每次从缓冲区中取出一个产品并使用。（注：这里的 “产品” 理解为某种数据）

生产者、消费者共享一个初始为空、大小为 n 的缓冲区。

只有缓冲区没满时，生产者才能把产品放入缓冲区，否则必须等待。
只有缓冲区不空时，消费者才能从中取出产品，否则必须等待。
缓冲区是临界资源，各进程必须互斥地访问。

PV 操作题目分析步骤：

关系分析。找出题目中描述的各个进程，分析它们之间的同步、互斥关系。
整理思路。根据各进程的操作流程确定 P、V 操作的大致顺序。
设置信号量。并根据题目条件确定信号量初值。（互斥信号量初值一般为 1，同步信号量的初始值要看对应资源的初始值是多少）

semaphore mutex = 1; //互斥信号量，实现对缓冲区的互斥访问
semaphore empty = n; //同步信号量，表示空闲缓冲区的数量
semaphore full = 0; //同步信号量，表示产品的数量，也即非空缓冲区的数量

1
2
3

# 能否改变相邻 P 、 V 操作的顺序？

若此时缓冲区内已经放满产品，则 empty=0，full=n。

则生产者进程执行① 使 mutex 变为 0，再执行②，由于已没有空闲缓冲区，因此生产者被阻塞。由于生产者阻塞，因此切换回消费者进程。消费者进程执行③，由于 mutex 为 0，即生产者还没释放对临界资源的 “锁”，因此消费者也被阻塞。

这就造成了生产者等待消费者释放空闲缓冲区，而消费者又等待生产者释放临界区的情况，生产者和消费者循环等待被对方唤醒，出现 “死锁”。

同样的，若缓冲区中没有产品，即 full=0，empty=n。按③④① 的顺序执行就会发生死锁。因此，实现互斥的 P 操作一定要在实现同步的 P 操作之后。

V 操作不会导致进程阻塞，因此两个 V 操作顺序可以交换。

PV 操作题目的解题思路：

关系分析。找出题目中描述的各个进程，分析它们之间的同步、互斥关系。
整理思路。根据各进程的操作流程确定 P、V 操作的大致顺序。
设置信号量。设置需要的信号量，并根据题目条件确定信号量初值。（互斥信号量初值一般为 1，同步信号量的初始值要看对应资源的初始值是多少）

生产者消费者问题是一个互斥、同步的综合问题。对于初学者来说最难的是发现题目中隐含的两对同步关系。有时候是消费者需要等待生产者生产，有时候是生产者要等待消费者消费，这是两个不同的 “一前一后问题”，因此也需要设置两个同步信号量。

# 多生产者 - 多消费者

桌子上有一只盘子，每次只能向其中放入一个水果。爸爸专向盘子中放苹果，妈妈专向盘子中放橘子，儿子专等着吃盘子中的橘子，女儿专等着吃盘子中的苹果。只有盘子空时，爸爸或妈妈才可向盘子中放一个水果。仅当盘子中有自己需要的水果时，儿子或女儿可以从盘子中取出水果。用 PV 操作实现上述过程。

互斥关系：

对缓冲区（盘子）的访问要互斥地进行

同步关系（一前一后）：

父亲将苹果放入盘子后，女儿才能取苹果
母亲将橘子放入盘子后，儿子才能取橘子
只有盘子为空（这个事件可以由儿子或女儿触发，事件发生后才允许父亲或母亲放水果）时，父亲或母亲才能放入水果

semaphore mutex = 1; //实现互斥访问盘子（缓冲区）
semaphore apple = 0; //盘子中有几个苹果
semaphore orange = 0; //盘子中有几个橘子
semaphore plate = 1; //盘子中还可以放多少个水果

1
2
3
4

问题：可不可以不用互斥信号量？

即使不设置专门的互斥变量 mutex，也不会出现多个进程同时访问盘子的现象

// semaphore mutex = 1; //实现互斥访问盘子（缓冲区）
semaphore apple = 0; //盘子中有几个苹果
semaphore orange = 0; //盘子中有几个橘子
semaphore plate = 1; //盘子中还可以放多少个水果

1
2
3
4

刚开始，儿子、女儿进程即使上处理机运行也会被阻塞。如果刚开始是父亲进程先上处理机运行，则：父亲 P (plate)，可以访问盘子→母亲 P (plate)，阻塞等待盘子→父亲放入苹果 V (apple)，女儿进程被唤醒，其他进程即使运行也都会阻塞，暂时不可能访问临界资源（盘子）→女儿 P (apple)，访问盘子，V (plate)，等待盘子的母亲进程被唤醒→母亲进程访问盘子（其他进程暂时都无法进入临界区）→ ....

原因在于：本题中的缓冲区大小为 1，在任何时刻，apple、orange、plate 三个同步信号量中最多只有一个是 1。因此在任何时刻，最多只有一个进程的 P 操作不会被阻塞，并顺利地进入临界区…

如果盘子（缓冲区）容量为 2

// semaphore mutex = 1; //实现互斥访问盘子（缓冲区）
semaphore apple = 0; //盘子中有几个苹果
semaphore orange = 0; //盘子中有几个橘子
semaphore plate = 2; //盘子中还可以放多少个水果

1
2
3
4

父亲 P (plate)，可以访问盘子→母亲 P (plate)，可以访问盘子→父亲在往盘子里放苹果，同时母亲也可以往盘子里放橘子。于是就出现了两个进程同时访问缓冲区的情况，有可能导致两个进程写入缓冲区的数据相互覆盖的情况。因此，如果缓冲区大小大于 1，就必须专门设置一个互斥信号量 mutex 来保证互斥访问缓冲区。

总结：在生产者 - 消费者问题中，如果缓冲区大小为 1，那么有可能不需要设置互斥信号量就可以实现互斥访问缓冲区的功能。当然，这不是绝对的，要具体问题具体分析。

建议：在考试中如果来不及仔细分析，可以加上互斥信号量，保证各进程一定会互斥地访问缓冲区。但需要注意的是，实现互斥的 P 操作一定要在实现同步的 P 操作之后，否则可能引起 “死锁”。

解决 “多生产者 - 多消费者问题” 的关键在于理清复杂的同步关系。

在分析同步问题（一前一后问题）的时候不能从单个进程行为的角度来分析，要把 “一前一后” 发生的事看做是两种 “事件” 的前后关系。

比如，如果从单个进程行为的角度来考虑的话，我们会有以下结论：如果盘子里装有苹果，那么一定要女儿取走苹果后父亲或母亲才能再放入水果如果盘子里装有橘子，那么一定要儿子取走橘子后父亲或母亲才能再放入水果

这么看是否就意味着要设置四个同步信号量分别实现这四个 “一前一后” 的关系了？

正确的分析方法应该从 “事件” 的角度来考虑，我们可以把上述四对 “进程行为的前后关系” 抽象为一对 “事件的前后关系”

盘子变空事件→放入水果事件。“盘子变空事件” 既可由儿子引发，也可由女儿引发；“放水果事件” 既可能是父亲执行，也可能是母亲执行。这样的话，就可以用一个同步信号量解决问题了

# 吸烟者问题

假设一个系统有三个抽烟者进程和一个供应者进程。每个抽烟者不停地卷烟并抽掉它，但是要卷起并抽掉一支烟，抽烟者需要有三种材料：烟草、纸和胶水。

三个抽烟者中，第一个拥有烟草、第二个拥有纸、第三个拥有胶水。供应者进程无限地提供三种材料，供应者每次将两种材料放桌子上，拥有剩下那种材料的抽烟者卷一根烟并抽掉它，并给供应者进程一个信号告诉完成了，供应者就会放另外两种材料再桌上，这个过程一直重复（让三个抽烟者轮流地抽烟）

本质上这题也属于 “生产者 - 消费者” 问题，更详细的说应该是 “可生产多种产品的单生产者 - 多消费者”。

桌上有组合一 → 第一个抽烟者取走东西
桌上有组合二 → 第二个抽烟者取走东西
桌上有组合三 → 第三个抽烟者取走东西
发出完成信号 → 供应者将下一个组合放到桌上

semaphore offer1 = 0; //桌上组合一的数量
semaphore offer2 = 0; //桌上组合二的数量
semaphore offer3 = 0; //桌上组合三的数量
semaphore finish = 0; //抽烟是否完成
int i = 0; //用于实现“三个抽烟者轮流抽烟”

1
2
3
4
5

provider () {
  while (1) {
    if (i == 0) {
      将组合一放桌上;
      V(offer1);
    } else if (i == 1) {
      将组合二放桌上;
      V(offer2);
    } else if (i == 2) {
      将组合三放桌上;
      V(offer3);
    }
    i = (i + 1) % 3;
    P(finish);
  }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

吸烟者问题可以为我们解决 “可以生产多个产品的单生产者” 问题提供一个思路。值得吸取的精华是：“轮流让各个吸烟者吸烟” 必然需要 “轮流的在桌上放上组合一、二、三”，注意体会我们是如何用一个整型变量 i 实现这个 “轮流” 过程的。

如果题目改为 “每次随机地让一个吸烟者吸烟”，我们有应该如何用代码写出这个逻辑呢？若一个生产者要生产多种产品（或者说会引发多种前驱事件），那么各个 V 操作应该放在各自对应的 “事件” 发生之后的位置。

# 读者 - 写者问题

有读者和写者两组并发进程，共享一个文件，当两个或两个以上的读进程同时访问共享数据时不会产生副作用，但若某个写进程和其他进程（读进程或写进程）同时访问共享数据时则可能导致数据不一致的错误。

因此要求：

允许多个读者可以同时对文件执行读操作；
只允许一个写者往文件中写信息；
任一写者在完成写操作之前不允许其他读者或写者工作；
写者执行写操作前，应让已有的读者和写者全部退出。

两类进程：写进程、读进程
互斥关系：写进程 — 写进程、写进程 — 读进程。读进程与读进程不存在互斥问题。

semaphore rw=1; //用于实现对共享文件的互斥访问
int count = 0; //记录当前有几个读进程在访问文件
semaphore mutex = 1;//用于保证对count变量的互斥访问

writer () {
  while (1) {
    P(rw); //写之前“加锁”
    写文件…
    V(rw); //写完了“解锁”
  }
}

reader () {
  while (1) {
    P(mutex); //各读进程互斥访问count
    if (count == 0) //由第一个读进程负责
      P(rw); //读之前“加锁”
    count++; //访问文件的读进程数+1
    V(mutex);
    读文件…
    P(mutex); //各读进程互斥访问count
    count--; //访问文件的读进程数-1
    if (count == 0) //由最后一个读进程负责
      V(rw); //读完了“解锁”
    V(mutex);
  }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

思考：若两个读进程并发执行，则 count=0 时两个进程也许都能满足 if 条件，都会执行 P (rw)，从而使第二个读进程阻塞的情况。如何解决：出现上述问题的原因在于对 count 变量的检查和赋值无法一气呵成，因此可以设置另一个互斥信号量来保证各读进程对 count 的访问是互斥的。

潜在的问题：只要有读进程还在读，写进程就要一直阻塞等待，可能 “饿死”。因此，这种算法中，读进程是优先的

我们再引入一个信号量 w

semaphore rw=1; //用于实现对共享文件的互斥访问
int count = 0; //记录当前有几个读进程在访问文件
semaphore mutex = 1; //用于保证对count变量的互斥访问
semaphore w = 1; //用于实现“写优先”

writer () {
  while (1) {
    P(w);
    P(rw);
    写文件…
    V(rw);
    V(w);
  }
}

reader () {
  while (1) {
    P(w);
    P(mutex);
    if (count == 0)
      P(rw);
    count++;
    V(mutex);
    V(w);
    读文件…
    P(mutex);
    count--;
    if (count == 0)
      V(rw);
    V(mutex);
  }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

结论：在这种算法中，连续进入的多个读者可以同时读文件；写者和其他进程不能同时访问文件；写者不会饥饿，但也并不是真正的 “写优先”，而是相对公平的先来先服务原则。有的书上把这种算法称为 “读写公平法”

读者 - 写者问题为我们解决复杂的互斥问题提供了一个参考思路。

其核心思想在于设置了一个计数器 count 用来记录当前正在访问共享文件的读进程数。我们可以用 count 的值来判断当前进入的进程是否是第一个 / 最后一个读进程，从而做出不同的处理。另外，对 count 变量的检查和赋值不能一气呵成导致了一些错误，如果需要实现 “一气呵成”，自然应该想到用互斥信号量。最后，还要认真体会我们是如何解决 “写进程饥饿” 问题的。

绝大多数的考研 PV 操作大题都可以用之前介绍的几种生产者 - 消费者问题的思想来解决，如果遇到更复杂的问题，可以想想能否用读者写者问题的这几个思想来解决。

# 哲学家进餐问题

一张圆桌上坐着 5 名哲学家，每两个哲学家之间的桌上摆一根筷子，桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐，哲学家在思考时，并不影响他人。只有当哲学家饥饿时，才试图拿起左、右两根筷子（一根一根地拿起）。如果筷子已在他人手上，则需等待。饥饿的哲学家只有同时拿起两根筷子才可以开始进餐，当进餐完毕后，放下筷子继续思考。

关系分析。系统中有 5 个哲学家进程，5 位哲学家与左右邻居对其中间筷子的访问是互斥关系。
整理思路。这个问题中只有互斥关系，但与之前遇到的问题不同的事，每个哲学家进程需要同时持有两个临界资源才能开始吃饭。如何避免临界资源分配不当造成的死锁现象，是哲学家问题的精髓。
信号量设置。定义互斥信号量数组 chopstick [5]={1,1,1,1,1} 用于实现对 5 个筷子的互斥访问。并对哲学家按 0~4 编号，哲学家 i 左边的筷子编号为 i，右边的筷子编号为 (i+1)%5。

如何防止死锁的发生呢？

可以对哲学家进程施加一些限制条件，比如最多允许四个哲学家同时进餐。这样可以保证至少有一个哲学家是可以拿到左右两只筷子的。
要求奇数号哲学家先拿左边的筷子，然后再拿右边的筷子，而偶数号哲学家刚好相反。用这种方法可以保证如果相邻的两个奇偶号哲学家都想吃饭，那么只会有其中一个可以拿起第一只筷子，另一个会直接阻塞。这就避免了占有一支后再等待另一只的情况。
仅当一个哲学家左右两支筷子都可用时才允许他抓起筷子。

以方案三为例子

semaphore chopstick[5] = {1, 1, 1, 1, 1};
semaphore mutex = 1; //互斥地取筷子
Pi () { //i号哲学家的进程
  while (1) {
    P(mutex);
    P(chopstick[i]); //拿左
    P(chopstick[(i + 1) % 5]); //拿右
    V(mutex);
    吃饭…
    V(chopstick[i]); //放左
    V(chopstick[(i + 1) % 5]); //放右
    思考…
  }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14

各哲学家拿筷子这件事必须互斥的执行。这就保证了即使一个哲学家在拿筷子拿到一半时被阻塞，也不会有别的哲学家会继续尝试拿筷子。这样的话，当前正在吃饭的哲学家放下筷子后，被阻塞的哲学家就可以获得等待的筷子了。

哲学家进餐问题的关键在于解决进程死锁。这些进程之间只存在互斥关系，但是与之前接触到的互斥关系不同的是，每个进程都需要同时持有两个临界资源，因此就有 “死锁” 问题的隐患。

如果在考试中遇到了一个进程需要同时持有多个临界资源的情况，应该参考哲学家问题的思想，分析题中给出的进程之间是否会发生循环等待，是否会发生死锁。可以参考哲学家就餐问题解决死锁的三种思路。

# 死锁

# 死锁的概念

# 什么是死锁

哲学家进餐问题中，如果 5 位哲学家进程并发执行，都拿起了左手边的筷子…

每位哲学家都在等待自己右边的人放下筷子，这些哲学家进程都因等待筷子资源而被阻塞。即发生 “死锁”

在并发环境下，各进程因竞争资源而造成的一种互相等待对方手里的资源，导致各进程都阻塞，都无法向前推进的现象，就是 “死锁”。发生死锁后若无外力干涉，这些进程都将无法向前推进。

# 死锁、饥饿、死循环的区别

死锁：各进程互相等待对方手里的资源，导致各进程都阻塞，无法向前推进的现象。
饥饿：由于长期得不到想要的资源，某进程无法向前推进的现象。比如：在短进程优先（SPF）算法中，若有源源不断的短进程到来，则长进程将一直得不到处理机，从而发生长进程 “饥饿”。
死循环：某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑 bug 导致的，有时是程序员故意设计的。

	共同点	区别
死锁	都是进程无法顺利向前推进的现象（故意设计的死循环除外）	死锁一定是 “循环等待对方手里的资源” 导致的，因此如果有死锁现象，那至少有两个或两个以上的进程同时发生死锁。另外，发生死锁的进程一定处于阻塞态。
饥饿	都是进程无法顺利向前推进的现象（故意设计的死循环除外）	可能只有一个进程发生饥饿。发生饥饿的进程既可能是阻塞态 (如长期得不到需要的 I/O 设备)，也可能是就绪态（长期得不到处理机）
死循环	都是进程无法顺利向前推进的现象（故意设计的死循环除外）	可能只有一个进程发生死循环。死循环的进程可以上处理机运行（可以是运行态），只不过无法像期待的那样顺利推进。死锁和饥饿问题是由于操作系统分配资源的策略不合理导致的，而死循环是由代码逻辑的错误导致的。死锁和饥饿是管理者（操作系统）的问题，死循环是被管理者的问题。

# 死锁产生的必要条件

产生死锁必须同时满足一下四个条件，只要其中任一条件不成立，死锁就不会发生。

互斥条件：只有对必须互斥使用的资源的争抢才会导致死锁（如哲学家的筷子、打印机设备）。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的（因为进程不用阻塞等待这种资源）。
不剥夺条件：进程所获得的资源在未使用完之前，不能由其他进程强行夺走，只能主动释放。
请求和保持条件：进程已经保持了至少一个资源，但又提出了新的资源请求，而该资源又被其他进程占有，此时请求进程被阻塞，但又对自己已有的资源保持不放。
循环等待条件：存在一种进程资源的循环等待链，链中的每一个进程已获得的资源同时被下一个进程所请求。

注意！发生死锁时一定有循环等待，但是发生循环等待时未必死锁（循环等待是死锁的必要不充分条件）

如果同类资源数大于 1，则即使有循环等待，也未必发生死锁。但如果系统中每类资源都只有一个，那循环等待就是死锁的充分必要条件了。

# 什么时候会发生死锁

对系统资源的竞争。各进程对不可剥夺的资源（如打印机）的竞争可能引起死锁，对可剥夺的资源（CPU）的竞争是不会引起死锁的。
进程推进顺序非法。请求和释放资源的顺序不当，也同样会导致死锁。例如，并发执行的进程 P1、P2 分别申请并占有了资源 R1、R2，之后进程 P1 又紧接着申请资源 R2，而进程 P2 又申请资源 R1，两者会因为申请的资源被对方占有而阻塞，从而发生死锁。
信号量的使用不当也会造成死锁。如生产者 - 消费者问题中，如果实现互斥的 P 操作在实现同步的 P 操作之前，就有可能导致死锁。（可以把互斥信号量、同步信号量也看做是一种抽象的系统资源）

总之，对不可剥夺资源的不合理分配，可能导致死锁。

# 死锁的处理策略

预防死锁。破坏死锁产生的四个必要条件中的一个或几个。
避免死锁。用某种方法防止系统进入不安全状态，从而避免死锁（银行家算法）
死锁的检测和解除。允许死锁的发生，不过操作系统会负责检测出死锁的发生，然后采取某种措施解除死锁。

# 小结

# 预防死锁

# 破坏互斥条件

互斥条件：只有对必须互斥使用的资源的争抢才会导致死锁。

如果把只能互斥使用的资源改造为允许共享使用，则系统不会进入死锁状态。比如: SPOOLing 技术。操作系统可以采用 SPOOLing 技术把独占设备在逻辑上改造成共享设备。比如，用 SPOOLing 技术将打印机改造为共享设备…

该策略的缺点：并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全，很多地方还必须保护这种互斥性。因此，很多时候都无法破坏互斥条件。

# 破坏不剥夺条件

不剥夺条件：进程所获得的资源在未使用完之前，不能由其他进程强行夺走，只能主动释放。

破坏不剥夺条件：

方案一：当某个进程请求新的资源得不到满足时，它必须立即释放保持的所有资源，待以后需要时再重新申请。也就是说，即使某些资源尚未使用完，也需要主动释放，从而破坏了不可剥夺条件。
方案二：当某个进程需要的资源被其他进程所占有的时候，可以由操作系统协助，将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级（比如：剥夺调度方式，就是将处理机资源强行剥夺给优先级更高的进程使用）

该策略的缺点：

实现起来比较复杂。
释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般只适用于易保存和恢复状态的资源，如 CPU。
反复地申请和释放资源会增加系统开销，降低系统吞吐量。
若采用方案一，意味着只要暂时得不到某个资源，之前获得的那些资源就都需要放弃，以后再重新申请。如果一直发生这样的情况，就会导致进程饥饿。

# 破坏请求和保持条件

请求和保持条件：进程已经保持了至少一个资源，但又提出了新的资源请求，而该资源又被其他进程占有，此时请求进程被阻塞，但又对自己已有的资源保持不放。

可以采用静态分配方法，即进程在运行前一次申请完它所需要的全部资源，在它的资源未满足前，不让它投入运行。一旦投入运行后，这些资源就一直归它所有，该进程就不会再请求别的任何资源了。

该策略实现起来简单，但也有明显的缺点：有些资源可能只需要用很短的时间，因此如果进程的整个运行期间都一直保持着所有资源，就会造成严重的资源浪费，资源利用率极低。另外，该策略也有可能导致某些进程饥饿。

A 类进程需要资源 1 才能运行，B 类进程需要资源 2 才能运行，而 C 类进程需要资源 1 和资源 2 才能运行。

# 破坏循环等待条件

循环等待条件：存在一种进程资源的循环等待链，链中的每一个进程已获得的资源同时被下一个进程所请求。

可采用顺序资源分配法。首先给系统中的资源编号，规定每个进程必须按编号递增的顺序请求资源，同类资源（即编号相同的资源）一次申请完。原理分析：一个进程只有已占有小编号的资源时，才有资格申请更大编号的资源。按此规则，已持有大编号资源的进程不可能逆向地回来申请小编号的资源，从而就不会产生循环等待的现象。

假设系统中共有 10 个资源，编号为 1, 2, …… 10

该策略的缺点：

不方便增加新的设备，因为可能需要重新分配所有的编号；
进程实际使用资源的顺序可能和编号递增顺序不一致，会导致资源浪费；
必须按规定次序申请资源，用户编程麻烦。

# 小结

# 避免死锁

# 什么是安全序列

你是一位成功的银行家，手里掌握着 100 个亿的资金… 有三个企业想找你贷款，分别是企业 B、企业 A、企业 T，为描述方便，简称 BAT。 B 表示：“大哥，我最多会跟你借 70 亿…” A 表示：“大哥，我最多会跟你借 40 亿…” T 表示：“大哥，我最多会跟你借 50 亿…”

然而 … 江湖中有个不成文的规矩：如果你借给企业的钱总数达不到企业提出的最大要求，那么不管你之前给企业借了多少钱，那些钱都拿不回来了 …

刚开始，BAT 三个企业分别从你这儿借了 20、10、30 亿 ...

手里还有：10 亿

只剩下 10 亿，如果 BAT 都提出再借 20 亿的请求，那么任何一个企业的需求都得不到满足

经过三百六十度无死角检查，给 B 借 30 亿是不安全的。

此时… A 还想借 20 亿，你敢借吗？假如答应了 A 的请求…… 之后按 T→B→A 的顺序借钱是 OK 的

手里还有：20 亿

可以先把 20 亿全部借给 T，等 T 把钱全部还回来了，手里就会有 20+30=50 亿，再把这些钱全借给 B，B 还钱后总共有 50+20=70 亿，最后再借给 A

可以先把 20 亿全部借给 T, 等 T 把钱全部还回来了，手里就会有 20+30=50 亿，再把这些钱全借给 B,B 还钱后总共有 50+20=70 亿，最后再借给 A

按 A→T→B 的顺序借钱也是 OK 的

或者，先借给 A10 亿，等 A 还钱了手里就有 20+30=50 亿，再给 T20 亿，等 T 还钱了就有 50+30=80 亿，最后再给 B 借

通过以上例子有请求是可以进行答应的，而有的请求是不能进行答应的

所谓安全序列，就是指如果系统按照这种序列分配资源，则每个进程都能顺利完成。只要能找出一个安全序列，系统就是安全状态。当然，安全序列可能有多个。

如果分配了资源之后，系统中找不出任何一个安全序列，系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去。当然，如果有进程提前归还了一些资源，那系统也有可能重新回到安全状态，不过我们在分配资源之前总是要考虑到最坏的情况。

比如 A 先归还了 10 亿，那么就有安全序列 T→B→A

如果系统处于安全状态，就一定不会发生死锁。如果系统进入不安全状态，就可能发生死锁（处于不安全状态未必就是发生了死锁，但发生死锁时一定是在不安全状态）

因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态，以此决定是否答应资源分配请求。这也是 **“银行家算法”** 的核心思想。

# 银行家算法

银行家算法是荷兰学者 Dijkstra 为银行系统设计的，以确保银行在发放现金贷款时，不会发生不能满足所有客户需要的情况。后来该算法被用在操作系统中，用于避免死锁。

核心思想：在进程提出资源申请时，先预判此次分配是否会导致系统进入不安全状态。如果会进入不安全状态，就暂时不答应这次请求，让该进程先阻塞等待。

BAT 的例子中，只有一种类型的资源 —— 钱，但是在计算机系统中会有多种多样的资源，应该怎么把算法拓展为多种资源的情况呢？

可以把单维的数字拓展为多维的向量。比如：系统中有 5 个进程 P0~P4，3 种资源 R0~R2，初始数量为 (10, 5, 7)，则某一时刻的情况可表示如下：

思路：尝试找出一个安全序列… {P1，P3，P0，P2，P4} 依次检查剩余可用资源 (3, 3, 2) 是否能满足各进程的需求可满足 P1 需求，将 P1 加入安全序列，并更新剩余可用资源值为 (5, 3, 2) 依次检查剩余可用资源 (5, 3, 2) 是否能满足剩余进程（不包括已加入安全序列的进程）的需求可满足 P3 需求，将 P3 加入安全序列，并更新剩余可用资源值为 (7, 4, 3) 依次检查剩余可用资源 (7, 4, 3) 是否能满足剩余进程（不包括已加入安全序列的进程) 的需求…… ……

以此类推，共五次循环检查即可将 5 个进程都加入安全序列中，最终可得一个安全序列。该算法称为安全性算法。可以很方便地用代码实现以上流程，每一轮检查都从编号较小的进程开始检查。实际做题时可以更快速的得到安全序列。

实际做题（手算）时可用更快速的方法找到一个安全序列：经对比发现，（3, 3, 2）可满足 P1、P3，说明无论如何，这两个进程的资源需求一定是可以依次被满足的，因此 P1、P3 一定可以顺利的执行完，并归还资源。可把 P1、P3 先加入安全序列。(2, 0, 0) + (2, 1, 1) + (3, 3, 2) = (7, 4, 3) 剩下的 P0、P2、P4 都可被满足。同理，这些进程都可以加入安全序列。

于是，5 个进程全部加入安全序列，说明此时系统处于安全状态，暂不可能发生死锁。

再看一个找不到安全序列的例子：经对比发现，（3, 3, 2）可满足 P1、P3，说明无论如何，这两个进程的资源需求一定是可以依次被满足的，因此 P1、P3 一定可以顺利的执行完，并归还资源。可把 P1、P3 先加入安全序列。 (2, 0, 0) + (2, 1, 1) + (3, 3, 2) = (7, 4, 3) 剩下的 P0 需要 (8, 4, 3)，P2 需要 (6, 5, 0)，P4 需要 (4, 3, 4) 任何一个进程都不能被完全满足于是，无法找到任何一个安全序列，说明此时系统处于不安全状态，有可能发生死锁。

# 代码实现

假设系统中有 n 个进程，m 种资源

每个进程在运行前先声明对各种资源的最大需求数，则可用一个 n*m 的矩阵（可用二维数组实现）表示所有进程对各种资源的最大需求数。不妨称为 最大需求矩阵 Max，Max [i, j]=K 表示进程 Pi 最多需要 K 个资源 Rj。同理，系统可以用一个 n*m 的 分配矩阵 Allocation 表示对所有进程的资源分配情况。Max – Allocation =Need 矩阵，表示各进程最多还需要多少各类资源。

另外，还要用一个 长度为 m 的一维数 Available 表示当前系统中还有多少可用资源。

某进程 Pi 向系统申请资源，可用一个长度为 m 的一维数组 ${Request}_{i}$ 表示本次申请的各种资源量。

编辑

上次更新: 2025/01/01, 10:09:39

← 计算机操作系统概述