计算机操作系统概述
# 计算机操作系统概述
# 操作系统的概念

操作系统(Operating System, OS)是指控制和管理整个计算机系统的硬件和软件资源,并合理地组织调 度计算机的工作和资源的分配;以提供给用户和其他软件方便的接口和环境;它是计算机系统中最基本 的系统软件。

补充知识:执行一个程序前需要将该程序放到内存中,才能被 CPU 处理。


封装思想:操作系统把一些丑陋的硬件功能封装成简单易用的服务,使用户能更方便地使用计算机,用户无需关心底层硬件的原理,只需要对操作系统发出命令即可

# gui
GUI:图形化用户接口(Graphical User Interface)用户可以使用形象的图形界面进行操作,而不再需要记忆复杂的命令、参数。
例子:在 Windows 操作系统中,删除一个文件只需要把文件 “拖拽” 到回收站即可。
# 联机命令接口
联机命令接口实例(Windows 系统)
联机命令接口 = 交互式命令接口

# 脱机命令接口
脱机命令接口实例(Windows 系统)
脱机命令接口 = 批处理命令接口 使用 windows 系统的搜索功能,搜索 C 盘中的 *.bat 文件,用记事本任意打开一个

# 向上层提供方便易用的服务
程序接口:可以在程序中进行系统调用来使用程序接口。普通用户不能直接使用程序接口,只能通过程序代码间接使用。


# 作为最接近硬件的层次
需要实现对硬件机器的拓展
没有任何软件支持的计算机成为裸机。在裸机上安装的操作系统,可以提供资源管理功能和方便用户的服务功能,将裸机改造成功能更强、使用更方便的机器
通常把覆盖了软件的机器成为扩充机器,又称之为虚拟机
# 小结

# 操作系统的四个特征

# 并发
并发:指两个或多个事件在同一时间间隔内发生。这些事件宏观上是同时发生的,但微观上是交替发生的。
常考易混概念 —— 并行:指两个或多个事件在同一时刻同时发生。

操作系统的并发性指计算机系统中 “同时” 运行着多个程序,这些程序宏观上看是同时运行着的,而微观上看是交替运行的。 操作系统就是伴随着 “多道程序技术” 而出现的。因此,操作系统和程序并发是一起诞生的。
注意(重要考点):
- 单核 CPU 同一时刻只能执行一个程序,各个程序只能并发地执行
- 多核 CPU 同一时刻可以同时执行多个程序,多个程序可以并行地执行
比如 Intel 的第八代 i3 处理器就是 4 核 CPU,意味着可以并行地执行 4 个程序
# 共享
共享即资源共享,是指系统中的资源可供内存中多个并发执行的进程共同使用。
两种资源共享方式:
- 互斥共享:系统中的某些资源,虽然可以提供给多个进程使用,但一个时间段内只允许一个进程访问该资源
- 同时共享:系统中的某些资源,允许一个时间段内由多个进程 “同时” 对它们进行访问
所谓的 “同时” 往往是宏观上的,而在微观上,这些进程可能是交替地对该资源进行访问的(即分时共享)
案例:
- 互斥共享方式:使用 QQ 和微信视频。同一时间段内摄像头只能分配给其中一个进程。
- 同时共享方式:使用 QQ 发送文件 A,同时使用微信发送文件 B。宏观上看,两边都在同时读取并发送文件,说明两个进程都在访问硬盘资源,从中读取数据。微观上看,两个进程是交替着访问硬盘的。
# 并发和共享的关系
使用 QQ 发送文件 A,同时使用微信发送文件 B,两个进程正在并发执行(并发性), 需要共享地访问硬盘资源(共享性)。
- 如果失去并发性,则系统中只有一个程序正在运行,则共享性失去存在的意义
- 如果失去共享性,则 QQ 和微信不能同时访问硬盘资源,就无法实现同时发送文件,也就无法并发
# 虚拟
虚拟是指把一个物理上的实体变为若干个逻辑上的对应物。物理实体(前者)是实际存在的,而逻辑上对应物(后者)是用户感受到的。
GTA5 需要 4GB 的运行内存,QQ 需要 256MB 的内存,迅雷需要 256MB 的内存,网易云音乐需要 256MB 的内存…… 我的电脑:4GB 内存 问题:这些程序同时运行需要的内存远大于 4GB,那么为什么它们还可以在我的电脑上同时运行呢? 答:这是虚拟存储器技术。实际只有 4GB 的内存,在用户看来似乎远远大于 4GB;虚拟技术中的 “空分复用技术”
一个程序需要被分配 CPU 才能正常执行,那么为什么单核 CPU 的电脑中能同时运行这么多个程序呢?
这是虚拟处理器技术。实际上只有一个单核 CPU,在用户看来似乎有 6 个 CPU 在同时为自己服务
虚拟技术中的 “时分复用技术”。微观上处理机在各个微小的时间段内交替着为各个进程服务
显然,如果失去了并发性,则一个时间段内系统中只需运行一道程序,那么就失去了实现虚拟性的意义了。因此,没有并发性,就谈不上虚拟性

# 异步
异步是指,在多道程序环境下,允许多个程序并发执行,但由于资源有限,进程的执行不是一贯到底的,而是走走停停,以不可预知的速度向前推进,这就是进程的异步性。
如果失去了并发性,即系统只能串行地运行各个程序,那么每个程序的执行会一贯到底。只有系统拥有并发性,才有可能导致异步性。
# 小结

# 操作系统的发展与分类

# 手工操作阶段
主要缺点:用户独占全机、人机速度矛盾导致资源利用率极低

# 单道批处理系统
引入脱机输入 / 输出技术(用外围机 + 磁带完成),并由监督程序负责控制作业的输入、输出

主要优点:缓解了一定程度的人机速度矛盾,资源利用率有所提升。
主要缺点:内存中仅能有一道程序运行,只有该程序运行结束之后才能调入下一道程序 **。CPU 有大量的时间是在空闲等待 I/O 完成 **。资源利用率依然很低。

# 多道批处理系统

主要优点:多道程序并发执行,共享计算机资源。资源利用率大幅提升,CPU 和其他资源更能保持 “忙碌” 状态,系统吞吐量增大。
主要缺点:用户响应时间长,没有人机交互功能(用户提交自己的作业之后就只能等待计算机处理完成,中间不能控制自己的作业执行。eg:无法调试程序 / 无法在程序运行过程中输入一些参数)

# 分时操作系统
分时操作系统:计算机以时间片为单位轮流为各个用户 / 作业服务,各个用户可通过终端与计算机进行交互。

主要优点:用户请求可以被即时响应,解决了人机交互问题。允许多个用户同时使用一台计算机,并且用户对计算机的操作相互独立,感受不到别人的存在。 主要缺点:不能优先处理一些紧急任务。操作系统对各个用户 / 作业都是完全公平的,循环地为每个用户 / 作业服务一个时间片,不区分任务的紧急性
# 实时操作系统
在实时操作系统的控制下,计算机系统接收到外部信号后及时进行处理,并且要在严格的时限内处理完事件。实时操作系统的主要特点是及时性和可靠性
主要优点:能够优先响应一些紧急任务,某些紧急任务不需时间片排队。

# 其他几种操作系统
- 网络操作系统:是伴随着计算机网络的发展而诞生的,能把网络中各个计算机有机地结合起来,实现数据传送等功能,实现网络中各种资源的共享(如文件共享)和各台计算机之间的通信。(如:Windows NT 就是一种典型的网络操作系统,网站服务器就可以使用)
- 分布式操作系统:主要特点是分布性和并行性。系统中的各台计算机地位相同,任何工作都可以分布在这些计算机上,由它们并行、协同完成这个任务。
- 个人计算机操作系统:如 Windows XP、MacOS,方便个人使用。
# 小结

# 操作系统的运行机制

# 程序是如何运行的?
“指令” 就是处理器(CPU)能识别、执行的最基本命令

很多人习惯把 Linux、Windows、MacOS 的 “小黑框” 中使用的命令也称为 “指令”,其实这是 “交互式命令接口”,注意与本节的 “指令” 区别开。本节中的 “指令” 指二进制机器指令
# 内核程序 v.s. 应用程序
我们普通程序员写的程序就是 “应用程序”
微软、苹果有一帮人负责实现操作系统,他们写的是 “内核程序” 由很多内核程序组成了 “操作系统内核”,或简称 “内核(Kernel)” 内核是操作系统最重要最核心的部分,也是最接近硬件的部分
甚至可以说,一个操作系统只要有内核就够了(eg:Docker—> 仅需 Linux 内核)操作系统的功能未必都在内核中,如图形化用户界面 GUI
- 应用程序只能使用 “非特权指令”,如:加法指令、减法指令等
- 操作系统内核作为 “管理者”,有时会让 CPU 执行一些 “特权指令”,如:内存清零指令。这些指令影响重大,只允许 “管理者”—— 即操作系统内核来使用
在 CPU 设计和生产的时候就划分了特权指令和非特权指令,因此 CPU 执行一条指令前就能判断出其类型
# 内核态 v.s. 用户态
CPU 有两种状态,“内核态” 和 “用户态”
- 处于内核态时,说明此时正在运行的是内核程序,此时可以执行特权指令
- 处于用户态时,说明此时正在运行的是应用程序,此时只能执行非特权指令
CPU 中有一个寄存器叫 程序状态字寄存器(PSW),其中有个二进制位,1 表示 “内核态”,0 表示 “用户态”
别名:内核态 = 核心态 = 管态;用户态 = 目态
# 内核态、用户态 的切换
- 刚开机时,CPU 为 “内核态”,操作系统内核程序先上 CPU 运行
- 开机完成后,用户可以启动某个应用程序
- 操作系统内核程序在合适的时候主动让出 CPU,让该应用程序上 CPU 运行
- 操作系统内核在让出 CPU 之前,会用一条特权指令把 PSW 的标志位设置为 “用户态”
- 应用程序运行在 “用户态”
- 此时,一位猥琐黑客在应用程序中植入了一条特权指令,企图破坏系统…
- CPU 发现接下来要执行的这条指令是特权指令,但是自己又处于 “用户态”
- 这个非法事件会引发一个中断信号
- CPU 检测到中断信号后,会立即变为 “核心态”,并停止运行当前的应用程序,转而运行处理中断信号的内核程序
- “中断” 使操作系统再次夺回 CPU 的控制权
- 操作系统会对引发中断的事件进行处理,处理完了再把 CPU 使用权交给别的应用程序
内核态→用户态:执行一条特权指令 —— 修改 PSW 的标志位为 “用户态”,这个动作意味着操作系统将主动让出 CPU 使用权
用户态→内核态:由 “中断” 引发,硬件自动完成变态过程,触发中断信号意味着操作系统将强行夺回 CPU 的使用权
除了非法使用特权指令之外,还有很多事件会触发中断信号。一个共性是,但凡需要操作系统介入的地方,都会触发中断信号
# 小结

# 中断和异常

# 中断的作用
“中断” 会使 CPU 由用户态变为内核态,使操作系统重新夺回对 CPU 的控制权
在合适的情况下,操作系统内核会把 CPU 的使用权主动让给应用程序(第二章进程管理相关内容)
“中断” 是让操作系统内核夺回 CPU 使用权的唯一途径
如果没有 “中断” 机制,那么一旦应用程序上 CPU 运行,CPU 就会一直运行这个应用程序,既如此,何来 “并发”!?
# 中断的类型
- 内中断:与当前执行的指令有关,中断信号来源于 CPU 内部
- 外中断:与当前执行的指令无关,中断信号来源于 CPU 外部
# 内中断
例子 1:试图在用户态下执行特权指令
例子 2:执行除法指令时发现除数为 0
例子 3:有时候应用程序想请求操作系统内核的服务,此时会执行一条特殊的指令 —— 陷入指令,该指令会引发一个内部中断信号
执行 “陷入指令”,意味着应用程序主动地将 CPU 控制权还给操作系统内核。“系统调用” 就是通过陷入指令完成的
若当前执行的指令是非法的,则会引发一个中断信号
# 外中断
例子 1:时钟中断 —— 由时钟部件发来的中断信号,时钟部件每隔一个时间片(如 50ms)会给 CPU 发送一个时钟中断信号
例子 2:I/O 中断 —— 由输入 / 输出设备发来的中断信号
# 小结

# 中断机制的基本原理
不同的中断信号,需要用不同的中断处理程序来处理。当 CPU 检测到中断信号后,会根据中断信号的类型去查询 “中断向量表”,以此来找到相应的中断处理程序在内存中的存放位置。

# 小结

# 系统调用

# 什么是系统调用,有何作用?
“系统调用” 是操作系统提供给应用程序(程序员 / 编程人员)使用的接口,可以理解为一种可供应用程序调用的特殊函数,应用程序可以通过系统调用来请求获得操作系统内核的服务
# 系统调用与库函数的区别

# 小例子:为什么系统调用是必须的?
生活场景:去学校打印店打印论文,你按下了 WPS 的 “打印” 选项,打印机开始工作。 你的论文打印到一半时,另一位同学按下了 Word 的 “打印” 按钮,开始打印他自己的论文。
思考:如果两个进程可以随意地、并发地共享打印机资源,会发生什么情况?
两个进程并发运行,打印机设备交替地收到 WPS 和 Word 两个进程发来的打印请求,结果两篇论文的内容混杂在一起了…
解决方法:由操作系统内核对共享资源进行统一的管理,并向上提供 “系统调用” ,用户进程想要使用打印机这种共享资源,只能通过系统调用向操作系统内核发出请求。内核会对各个请求进行协调处理
# 什么功能要用到系统调用?
应用程序通过系统调用请求操作系统的服务。而系统中的各种共享资源都由操作系统内核统一掌管,因此凡是与共享资源有关的操作(如存储分配、I/O 操作、文件管理等),都必须通过系统调用的方式向操作系统内核提出服务请求,由操作系统内核代为完成。这样可以保证系统的稳定性和安全性,防止用户进行非法操作。

# 系统调用的过程

传递系统调用参数 → 执行陷入指令(用户态) → 执行相应的内请求核程序处理系统调用(核心态) → 返回应用程序
注意:
陷入指令是在用户态执行的,执行陷入指令之后立即引发一个内中断,使 CPU 进入核心态
发出系统调用请求是在用户态,而对系统调用的相应处理在核心态下进行
# 小结

# 操作系统的体系结构

# 操作系统的内核

内核是操作系统最基本、最核心的部分。 实现操作系统内核功能的那些程序就是内核程序。


- 操作系统内核需要运行在内核态
- 操作系统的非内核功能运行在用户态
# 大内核 vs 微内核
现在,应用程序想要请求操作系统的服务,这个服务的处理同时涉及到进程管理、存储管理、设备管理

变态的过程是有成本的,要消耗不少时间,频繁地变态会降低系统性能
# 小结

典型的大内核 / 宏内核 / 单内核 操作系统: Linux、UNIX 典型的 微内核 操作系统: Windows NT
# 分层结构

优点:
便于调试和验证,自底向上逐层调试验证
易扩充和易维护,各层之间调用接口清晰固定
缺点:
仅可调用相邻低层,难以合理定义各层的边界
效率低,不可跨层调用,系统调用执行时间长
# 模块化

将内核划分为多个模块,各模块之间相互协作。 内核 = 主模块 + 可加载内核模块
- 主模块:只负责核心功能,如进程调度、内存管理
- 可加载内核模块:可以动态加载新模块到内核,而无需重新编译整个内核
优点:
- 模块间逻辑清晰易于维护,确定模块间接口后即可多模块同时开发
- 支持动态加载新的内核模块(如:安装设备驱动程序、安装新的文件系统模块到内核),增强 OS 适应性
- 任何模块都可以直接调用其他模块,无需采用消息传递进行通信,效率高
缺点:
模块间的接口定义未必合理、实用
模块间相互依赖,更难调试和验证
# 宏内核、微内核

# 宏内核(大内核)
所有的系统功能都放在内核里(大内核结构的 OS 通常也采用了 “模块化 " 的设计思想)
优点:
- 性能高,内核内部各种功能都可以直接相互调用
缺点:
- 内核庞大功能复杂,难以维护
- 大内核中某个功能模块出错,就可能导致整个系统崩渍
# 微内核
只把中断、原语、进程通信等最核心的功能放入内核。进程管理、文件管理、设备管理等功能以用户进程的形式运行在用户态
优点:
内核小功能少、易于维护,内核可靠性高
内核外的某个功能模块出错不会导致整个系统崩渍
缺点:
性能低,需要频繁的切换用户态 / 核心态。用户态下的各功能模块不可以直接相互调用,只能通过内核的 "消息传递" 来间接通信
用户态下的各功能模块不可以直接相互调用只能通过内核的 "消息传递" 来间接通信
# 外核(exokernel)

内核负责进程调度、进程通信等功能,外核负责为用户进程分配未经抽象的硬件资源,且由外核负责保证资源使用安全
优点:
外核可直接给用户进程分配 "不虚拟、不抽象" 的硬件资源,使用户进程可以更灵活的使用硬件资源
减少了虚拟硬件资源的 "映射层",提升效率
缺点:
降低了系统的一致性
使系统变得更复杂
# 小结

# 操作系统引导

# 安装操作系统后

# 开机过程

①CPU 从一个特定主存地址开始,取指令,执行 ROM 中的引导程序(先进行硬件自检,再开机) ②将磁盘的第一块 —— 主引导记录 读入内存,执行磁盘引导程序,扫描分区表 ③从活动分区(又称主分区,即安装了操作系统的分区)读入分区引导记录,执行其中的程序 ④从根目录下找到完整的操作系统初始化程序(即 启动管理器)并执行,完成 “开机” 的一系列动作

# 虚拟机
传统计算机

虚拟机
虚拟机:使用虚拟化技术,将一台物理机器虚拟化为多台虚拟机器(Virtual Machine, VM),每个虚拟机器都可以独立运行一个操作系统
同义术语:虚拟机管理程序 / 虚拟机监控程序 / Virtual Machine Monitor/Hypervisor


# 支持虚拟化的 CPU 通常分更多指令等级
