计算机操作系统概述

# 计算机操作系统概述

# 操作系统的概念

操作系统（Operating System， OS）是指控制和管理整个计算机系统的硬件和软件资源，并合理地组织调度计算机的工作和资源的分配；以提供给用户和其他软件方便的接口和环境；它是计算机系统中最基本的系统软件。

补充知识：执行一个程序前需要将该程序放到内存中，才能被 CPU 处理。

封装思想：操作系统把一些丑陋的硬件功能封装成简单易用的服务，使用户能更方便地使用计算机，用户无需关心底层硬件的原理，只需要对操作系统发出命令即可

# gui

GUI：图形化用户接口（Graphical User Interface）用户可以使用形象的图形界面进行操作，而不再需要记忆复杂的命令、参数。

例子：在 Windows 操作系统中，删除一个文件只需要把文件 “拖拽” 到回收站即可。

# 联机命令接口

联机命令接口实例（Windows 系统）

联机命令接口 = 交互式命令接口

# 脱机命令接口

脱机命令接口实例（Windows 系统）

脱机命令接口 = 批处理命令接口使用 windows 系统的搜索功能，搜索 C 盘中的 *.bat 文件，用记事本任意打开一个

# 向上层提供方便易用的服务

程序接口：可以在程序中进行系统调用来使用程序接口。普通用户不能直接使用程序接口，只能通过程序代码间接使用。

# 作为最接近硬件的层次

需要实现对硬件机器的拓展

没有任何软件支持的计算机成为裸机。在裸机上安装的操作系统，可以提供资源管理功能和方便用户的服务功能，将裸机改造成功能更强、使用更方便的机器

通常把覆盖了软件的机器成为扩充机器，又称之为虚拟机

# 小结

# 操作系统的四个特征

# 并发

并发：指两个或多个事件在同一时间间隔内发生。这些事件宏观上是同时发生的，但微观上是交替发生的。

常考易混概念 —— 并行：指两个或多个事件在同一时刻同时发生。

操作系统的并发性指计算机系统中 “同时” 运行着多个程序，这些程序宏观上看是同时运行着的，而微观上看是交替运行的。操作系统就是伴随着 “多道程序技术” 而出现的。因此，操作系统和程序并发是一起诞生的。

注意（重要考点）：

单核 CPU 同一时刻只能执行一个程序，各个程序只能并发地执行
多核 CPU 同一时刻可以同时执行多个程序，多个程序可以并行地执行

比如 Intel 的第八代 i3 处理器就是 4 核 CPU，意味着可以并行地执行 4 个程序

# 共享

共享即资源共享，是指系统中的资源可供内存中多个并发执行的进程共同使用。

两种资源共享方式：

互斥共享：系统中的某些资源，虽然可以提供给多个进程使用，但一个时间段内只允许一个进程访问该资源
同时共享：系统中的某些资源，允许一个时间段内由多个进程 “同时” 对它们进行访问

所谓的 “同时” 往往是宏观上的，而在微观上，这些进程可能是交替地对该资源进行访问的（即分时共享）

案例：

互斥共享方式：使用 QQ 和微信视频。同一时间段内摄像头只能分配给其中一个进程。
同时共享方式：使用 QQ 发送文件 A，同时使用微信发送文件 B。宏观上看，两边都在同时读取并发送文件，说明两个进程都在访问硬盘资源，从中读取数据。微观上看，两个进程是交替着访问硬盘的。

# 并发和共享的关系

使用 QQ 发送文件 A，同时使用微信发送文件 B，两个进程正在并发执行（并发性），需要共享地访问硬盘资源（共享性）。

如果失去并发性，则系统中只有一个程序正在运行，则共享性失去存在的意义
如果失去共享性，则 QQ 和微信不能同时访问硬盘资源，就无法实现同时发送文件，也就无法并发

# 虚拟

虚拟是指把一个物理上的实体变为若干个逻辑上的对应物。物理实体（前者）是实际存在的，而逻辑上对应物（后者）是用户感受到的。

GTA5 需要 4GB 的运行内存，QQ 需要 256MB 的内存，迅雷需要 256MB 的内存，网易云音乐需要 256MB 的内存…… 我的电脑：4GB 内存问题：这些程序同时运行需要的内存远大于 4GB，那么为什么它们还可以在我的电脑上同时运行呢？答：这是虚拟存储器技术。实际只有 4GB 的内存，在用户看来似乎远远大于 4GB；虚拟技术中的 “空分复用技术”

一个程序需要被分配 CPU 才能正常执行，那么为什么单核 CPU 的电脑中能同时运行这么多个程序呢？

这是虚拟处理器技术。实际上只有一个单核 CPU，在用户看来似乎有 6 个 CPU 在同时为自己服务

虚拟技术中的 “时分复用技术”。微观上处理机在各个微小的时间段内交替着为各个进程服务

显然，如果失去了并发性，则一个时间段内系统中只需运行一道程序，那么就失去了实现虚拟性的意义了。因此，没有并发性，就谈不上虚拟性

# 异步

异步是指，在多道程序环境下，允许多个程序并发执行，但由于资源有限，进程的执行不是一贯到底的，而是走走停停，以不可预知的速度向前推进，这就是进程的异步性。

如果失去了并发性，即系统只能串行地运行各个程序，那么每个程序的执行会一贯到底。只有系统拥有并发性，才有可能导致异步性。

# 小结

# 操作系统的发展与分类

# 手工操作阶段

主要缺点：用户独占全机、人机速度矛盾导致资源利用率极低

# 单道批处理系统

引入脱机输入 / 输出技术（用外围机 + 磁带完成），并由监督程序负责控制作业的输入、输出

主要优点：缓解了一定程度的人机速度矛盾，资源利用率有所提升。

主要缺点：内存中仅能有一道程序运行，只有该程序运行结束之后才能调入下一道程序 **。CPU 有大量的时间是在空闲等待 I/O 完成 **。资源利用率依然很低。

# 多道批处理系统

主要优点：多道程序并发执行，共享计算机资源。资源利用率大幅提升，CPU 和其他资源更能保持 “忙碌” 状态，系统吞吐量增大。

主要缺点：用户响应时间长，没有人机交互功能（用户提交自己的作业之后就只能等待计算机处理完成，中间不能控制自己的作业执行。eg：无法调试程序 / 无法在程序运行过程中输入一些参数）

# 分时操作系统

分时操作系统：计算机以时间片为单位轮流为各个用户 / 作业服务，各个用户可通过终端与计算机进行交互。

主要优点：用户请求可以被即时响应，解决了人机交互问题。允许多个用户同时使用一台计算机，并且用户对计算机的操作相互独立，感受不到别人的存在。主要缺点：不能优先处理一些紧急任务。操作系统对各个用户 / 作业都是完全公平的，循环地为每个用户 / 作业服务一个时间片，不区分任务的紧急性

# 实时操作系统

在实时操作系统的控制下，计算机系统接收到外部信号后及时进行处理，并且要在严格的时限内处理完事件。实时操作系统的主要特点是及时性和可靠性

主要优点：能够优先响应一些紧急任务，某些紧急任务不需时间片排队。

# 其他几种操作系统

网络操作系统：是伴随着计算机网络的发展而诞生的，能把网络中各个计算机有机地结合起来，实现数据传送等功能，实现网络中各种资源的共享（如文件共享）和各台计算机之间的通信。（如：Windows NT 就是一种典型的网络操作系统，网站服务器就可以使用）
分布式操作系统：主要特点是分布性和并行性。系统中的各台计算机地位相同，任何工作都可以分布在这些计算机上，由它们并行、协同完成这个任务。
个人计算机操作系统：如 Windows XP、MacOS，方便个人使用。

# 小结

# 操作系统的运行机制

# 程序是如何运行的？

“指令” 就是处理器（CPU）能识别、执行的最基本命令

很多人习惯把 Linux、Windows、MacOS 的 “小黑框” 中使用的命令也称为 “指令”，其实这是 “交互式命令接口”，注意与本节的 “指令” 区别开。本节中的 “指令” 指二进制机器指令

# 内核程序 v.s. 应用程序

我们普通程序员写的程序就是 “应用程序”

微软、苹果有一帮人负责实现操作系统，他们写的是 “内核程序” 由很多内核程序组成了 “操作系统内核”，或简称 “内核（Kernel）” 内核是操作系统最重要最核心的部分，也是最接近硬件的部分

甚至可以说，一个操作系统只要有内核就够了（eg：Docker—> 仅需 Linux 内核）操作系统的功能未必都在内核中，如图形化用户界面 GUI

应用程序只能使用 “非特权指令”，如：加法指令、减法指令等
操作系统内核作为 “管理者”，有时会让 CPU 执行一些 “特权指令”，如：内存清零指令。这些指令影响重大，只允许 “管理者”—— 即操作系统内核来使用

在 CPU 设计和生产的时候就划分了特权指令和非特权指令，因此 CPU 执行一条指令前就能判断出其类型

# 内核态 v.s. 用户态

CPU 有两种状态，“内核态” 和 “用户态”

处于内核态时，说明此时正在运行的是内核程序，此时可以执行特权指令
处于用户态时，说明此时正在运行的是应用程序，此时只能执行非特权指令

CPU 中有一个寄存器叫 程序状态字寄存器（PSW），其中有个二进制位，1 表示 “内核态”，0 表示 “用户态”

别名：内核态 = 核心态 = 管态；用户态 = 目态

# 内核态、用户态的切换

刚开机时，CPU 为 “内核态”，操作系统内核程序先上 CPU 运行
开机完成后，用户可以启动某个应用程序
操作系统内核程序在合适的时候主动让出 CPU，让该应用程序上 CPU 运行
- 操作系统内核在让出 CPU 之前，会用一条特权指令把 PSW 的标志位设置为 “用户态”
应用程序运行在 “用户态”
此时，一位猥琐黑客在应用程序中植入了一条特权指令，企图破坏系统…
CPU 发现接下来要执行的这条指令是特权指令，但是自己又处于 “用户态”
这个非法事件会引发一个中断信号
- CPU 检测到中断信号后，会立即变为 “核心态”，并停止运行当前的应用程序，转而运行处理中断信号的内核程序
“中断” 使操作系统再次夺回 CPU 的控制权
操作系统会对引发中断的事件进行处理，处理完了再把 CPU 使用权交给别的应用程序

内核态→用户态：执行一条特权指令 —— 修改 PSW 的标志位为 “用户态”，这个动作意味着操作系统将主动让出 CPU 使用权

用户态→内核态：由 “中断” 引发，硬件自动完成变态过程，触发中断信号意味着操作系统将强行夺回 CPU 的使用权

除了非法使用特权指令之外，还有很多事件会触发中断信号。一个共性是，但凡需要操作系统介入的地方，都会触发中断信号

# 小结

# 中断和异常

# 中断的作用

“中断” 会使 CPU 由用户态变为内核态，使操作系统重新夺回对 CPU 的控制权

在合适的情况下，操作系统内核会把 CPU 的使用权主动让给应用程序（第二章进程管理相关内容）

“中断” 是让操作系统内核夺回 CPU 使用权的唯一途径

如果没有 “中断” 机制，那么一旦应用程序上 CPU 运行，CPU 就会一直运行这个应用程序，既如此，何来 “并发”！？

# 中断的类型

内中断：与当前执行的指令有关，中断信号来源于 CPU 内部
外中断：与当前执行的指令无关，中断信号来源于 CPU 外部

# 内中断

例子 1：试图在用户态下执行特权指令

例子 2：执行除法指令时发现除数为 0

例子 3：有时候应用程序想请求操作系统内核的服务，此时会执行一条特殊的指令 —— 陷入指令，该指令会引发一个内部中断信号

执行 “陷入指令”，意味着应用程序主动地将 CPU 控制权还给操作系统内核。“系统调用” 就是通过陷入指令完成的

若当前执行的指令是非法的，则会引发一个中断信号

# 外中断

例子 1：时钟中断 —— 由时钟部件发来的中断信号，时钟部件每隔一个时间片（如 50ms）会给 CPU 发送一个时钟中断信号

例子 2：I/O 中断 —— 由输入 / 输出设备发来的中断信号

# 小结

# 中断机制的基本原理

不同的中断信号，需要用不同的中断处理程序来处理。当 CPU 检测到中断信号后，会根据中断信号的类型去查询 “中断向量表”，以此来找到相应的中断处理程序在内存中的存放位置。

# 小结

# 系统调用

# 什么是系统调用，有何作用？

“系统调用” 是操作系统提供给应用程序（程序员 / 编程人员）使用的接口，可以理解为一种可供应用程序调用的特殊函数，应用程序可以通过系统调用来请求获得操作系统内核的服务

# 系统调用与库函数的区别

# 小例子：为什么系统调用是必须的？

生活场景：去学校打印店打印论文，你按下了 WPS 的 “打印” 选项，打印机开始工作。你的论文打印到一半时，另一位同学按下了 Word 的 “打印” 按钮，开始打印他自己的论文。

思考：如果两个进程可以随意地、并发地共享打印机资源，会发生什么情况？

两个进程并发运行，打印机设备交替地收到 WPS 和 Word 两个进程发来的打印请求，结果两篇论文的内容混杂在一起了…

解决方法：由操作系统内核对共享资源进行统一的管理，并向上提供 “系统调用” ，用户进程想要使用打印机这种共享资源，只能通过系统调用向操作系统内核发出请求。内核会对各个请求进行协调处理

# 什么功能要用到系统调用？

应用程序通过系统调用请求操作系统的服务。而系统中的各种共享资源都由操作系统内核统一掌管，因此凡是与共享资源有关的操作（如存储分配、I/O 操作、文件管理等），都必须通过系统调用的方式向操作系统内核提出服务请求，由操作系统内核代为完成。这样可以保证系统的稳定性和安全性，防止用户进行非法操作。

# 系统调用的过程

传递系统调用参数 → 执行陷入指令（用户态） → 执行相应的内请求核程序处理系统调用（核心态） → 返回应用程序

注意：

陷入指令是在用户态执行的，执行陷入指令之后立即引发一个内中断，使 CPU 进入核心态
发出系统调用请求是在用户态，而对系统调用的相应处理在核心态下进行

# 小结

# 操作系统的体系结构

# 操作系统的内核

内核是操作系统最基本、最核心的部分。实现操作系统内核功能的那些程序就是内核程序。

操作系统内核需要运行在内核态
操作系统的非内核功能运行在用户态

# 大内核 vs 微内核

现在，应用程序想要请求操作系统的服务，这个服务的处理同时涉及到进程管理、存储管理、设备管理

变态的过程是有成本的，要消耗不少时间，频繁地变态会降低系统性能

# 小结

典型的大内核 / 宏内核 / 单内核操作系统： Linux、UNIX 典型的微内核操作系统： Windows NT

# 分层结构

优点：

便于调试和验证，自底向上逐层调试验证
易扩充和易维护，各层之间调用接口清晰固定

缺点：

仅可调用相邻低层，难以合理定义各层的边界
效率低，不可跨层调用，系统调用执行时间长

# 模块化

将内核划分为多个模块，各模块之间相互协作。内核 = 主模块 + 可加载内核模块

主模块：只负责核心功能，如进程调度、内存管理
可加载内核模块：可以动态加载新模块到内核，而无需重新编译整个内核

优点：

模块间逻辑清晰易于维护，确定模块间接口后即可多模块同时开发
支持动态加载新的内核模块（如：安装设备驱动程序、安装新的文件系统模块到内核)，增强 OS 适应性
任何模块都可以直接调用其他模块，无需采用消息传递进行通信，效率高

缺点：

模块间的接口定义未必合理、实用
模块间相互依赖，更难调试和验证

# 宏内核、微内核

# 宏内核（大内核）

所有的系统功能都放在内核里（大内核结构的 OS 通常也采用了 “模块化 " 的设计思想)

优点：

性能高，内核内部各种功能都可以直接相互调用

缺点：

内核庞大功能复杂，难以维护
大内核中某个功能模块出错，就可能导致整个系统崩渍

# 微内核

只把中断、原语、进程通信等最核心的功能放入内核。进程管理、文件管理、设备管理等功能以用户进程的形式运行在用户态

优点：

内核小功能少、易于维护，内核可靠性高
内核外的某个功能模块出错不会导致整个系统崩渍

缺点：

性能低，需要频繁的切换用户态 / 核心态。用户态下的各功能模块不可以直接相互调用，只能通过内核的 "消息传递" 来间接通信
用户态下的各功能模块不可以直接相互调用只能通过内核的 "消息传递" 来间接通信

# 外核（exokernel）

内核负责进程调度、进程通信等功能，外核负责为用户进程分配未经抽象的硬件资源，且由外核负责保证资源使用安全

优点：

外核可直接给用户进程分配 "不虚拟、不抽象" 的硬件资源，使用户进程可以更灵活的使用硬件资源
减少了虚拟硬件资源的 "映射层"，提升效率

缺点：

降低了系统的一致性
使系统变得更复杂

# 小结

# 操作系统引导

# 安装操作系统后

# 开机过程

①CPU 从一个特定主存地址开始，取指令，执行 ROM 中的引导程序（先进行硬件自检，再开机） ②将磁盘的第一块 —— 主引导记录读入内存，执行磁盘引导程序，扫描分区表 ③从活动分区（又称主分区，即安装了操作系统的分区）读入分区引导记录，执行其中的程序 ④从根目录下找到完整的操作系统初始化程序（即启动管理器）并执行，完成 “开机” 的一系列动作

# 虚拟机

传统计算机

虚拟机

虚拟机：使用虚拟化技术，将一台物理机器虚拟化为多台虚拟机器（Virtual Machine, VM），每个虚拟机器都可以独立运行一个操作系统

同义术语：虚拟机管理程序 / 虚拟机监控程序 / Virtual Machine Monitor/Hypervisor

# 支持虚拟化的 CPU 通常分更多指令等级

编辑

上次更新: 2025/01/01, 10:09:39

← 数据的表示和运算进程与线程→

计算机操作系统概述

# 计算机操作系统概述

# 操作系统的概念

# gui

# 联机命令接口

# 脱机命令接口

# 向上层提供方便易用的服务

# 作为最接近硬件的层次

# 小结

# 操作系统的四个特征

# 并发

# 共享

# 并发和共享的关系

# 虚拟

# 异步

# 小结

# 操作系统的发展与分类

# 手工操作阶段

# 单道批处理系统

# 多道批处理系统

# 分时操作系统

# 实时操作系统

# 其他几种操作系统

# 小结

# 操作系统的运行机制

# 程序是如何运行的？

# 内核程序 v.s. 应用程序

# 内核态 v.s. 用户态

# 内核态、用户态 的切换

# 小结

# 中断和异常

# 中断的作用

# 中断的类型

# 内中断

# 外中断

# 小结

# 中断机制的基本原理

# 小结

# 系统调用

# 什么是系统调用，有何作用？

# 系统调用与库函数的区别

# 小例子：为什么系统调用是必须的？

# 什么功能要用到系统调用？

# 系统调用的过程

# 小结

# 操作系统的体系结构

# 操作系统的内核

# 大内核 vs 微内核

# 小结

# 分层结构

# 模块化

# 宏内核、微内核

# 宏内核（大内核）

# 微内核

# 外核（exokernel）

# 小结

# 操作系统引导

# 安装操作系统后

# 开机过程

# 虚拟机

# 支持虚拟化的 CPU 通常分更多指令等级

# 内核态、用户态的切换