本文是《操作系统概念(第九版)》的第一章的读书笔记第二部分,主要介绍了操作系统的历史/分类。
This blog is the second part of reading notes of Operating System Concepts (Ninth Edition) chapter 1: Introduction, which tells the histroy/types of Operating System
Operating System Concepts-Chapter 1: Introduction-2 Histroy/Types of Operating System
操作系统概念第一部分是Overview,包括第一章和第二章。
本章主要介绍了操作系统中一些基本概念和操作系统的发展历史/操作系统的种类,以及操作系统的任务。本章的第二部分主要讲解了操作系统的发展历史/操作系统的分类。
注:本章部分内容参考《现代操作系统》(Modern Operating System)
1. 概览
操作系统不仅仅是作为学术界的研究内容,其更加是产业界的产品,和用户紧密贴合。因此操作系统是随着时代在发展的。
总的来说,操作系统的发展是和计算机硬件的发展分不开的,因此伴随着计算机硬件的发展,操作系统的发展经历了以下几个阶段:
- 1945-1955:第一代,真空管
- 1955-1965:第二代,晶体管
- 1965-1980:第三代,集成电路和多道程序设计
- 1980-现在:个人电脑
- 1990-现在:移动电脑(手机)
在这些阶段中,出现了下面几种类型的操作系统
- 批处理系统(Simple Batch processing system)
- 多道程序系统(Multiplied Batch processing system)
- 分时系统(Time-sharing system)
- 实时系统(Real time system)
- 网络操作系统(Network operating system)
- 平行系统(Parallel Systems)
- 分布式系统(Distributed system)
2. 操作系统的历史
下面我们将回顾计算机的发展历史,并且伴随着计算机的发展穿插讲解同一时代的操作系统,以期望能够给读者一个操作系统的宏观发展史。在后面的操作系统的种类不分,将会对出现在历史上的各类操作系统进行详细的讲解
A. 第一代(1945-1955):真空管和穿孔卡片
第二次世界大战推动了计算机的发展,正如我们所熟知的,计算机(ENIAC)最早是为了计算炮弹的下落轨迹的。军事的发展在早期极大的推动了计算机发展。和ENIAC同时代的,还有许多计算机。例如,1944年阿兰·图灵等人在英国的因格兰建造了Colossus计算机,并在这台计算机上进行编程;Howard Aiken在哈佛大学建造了Mark I计算机;宾夕法尼亚大学的William Mauchley和他的学生J. Presper Eckert建造了ENIAC……
在这个时候,计算机的作用仅仅是用来进行复杂的数学运算,人们所做的是按照预先的设计,把电线连好,然后启动计算机,祈祷机器在两个小时后真空电子管不会烧掉并且能够给出正确的答案。在这个时候根本没有编程语言的概念,操作系统就更加无从说起了。这个时候的计算机也非常原始,很多计算机都是无法编程的,或者干脆就是用0101的机器语言编写的,之所以用机器语言编写,是因为它符合电路的通断,因此很容易就能够把写好的”代码”转换为电路的通断。
一直直到1950年以后,这个情况才稍微边的好一点了,读卡机的出现使得操作者可以提前把代码写在卡片上,然后计算机从卡片中读取程序,然后进行计算
B. 第二代(1955-1965):晶体管和批处理系统
20世纪50年代,晶体管的发明极大地推动了计算机的发展,先前的计算机使用的真空管如果漏气就会被烧掉,因此稳定性不是很好,而晶体管的发明计算机已经边的非常有用,并且能够完成一些有用的任务。晶体管没有玻璃管壳,不需要真空,体积很小,生产成本很低,寿命比电子管长得多。因此,晶体管一问世,立即得到迅速发展且取代了电子管的位置。
这个时候的电脑现在被称为大型机(mainframe),通常被锁在有专用空调的大房间中,由专业人员进行操作。因此其售价非常高昂,通常达到几百万美元。只有企业、重要的政府部门以及大学才可能接受并购买。
这个时候已经出现了编程语言的概念,有Fortran或者汇编语言,但是依旧没有操作系统的概念。这个时候的程序被称为作业(job)。程序可以通过穿孔卡片(Punched card)写在纸上,然后被计算机读入。
穿孔卡片如何表示数据?
From Wikipedia
1928年,IBM发明的80列、矩形孔卡片,成为事实上的标准。其工作原理如下:编号为0至9,总计10行;以及一块区域,用于第11、第12行(注意,没有编号为第10的行)。
每列的穿孔组合用于表示单个字符:
- 数字通过在行0至行9直接打1个孔来表示。
- 空格符的表示,不需要打孔。
- 字母用2个孔表示:一个孔在第11、第12、第0行;另一个孔在第1至第9行。字母表被依次分为由9个字母组成的区(zones),每个区的字母依次在第1至第9行打孔。每个区分别在第11、第12、第0行打孔。第3区第1个字符保留未使用。
- 一些特殊字符使用了额外的单孔表示,或者双孔表示。
- 大多数特殊字符(如标点符号等)用3孔表示:第8行被穿孔;第0、第11、第12行有1个穿孔;第1到第7行有1个穿孔。第9行保留未使用。
用户提前编写好程序(以Fortran语言为例),然被送入计算机中,计算机中的Fortran编译器对读入的源程序进行编译编译,编译完成后得到编译好的程序。
接下来计算机载入编译后的程序,然后读取数据进行运算,得到结果。最后将结果再通过打印机打印到纸上。因此一个典型的作业的卡片组如下图。首先是JOB卡片,表明用户的扣款账号,最大的运行时间(分钟)以及程序员。接下来是Fortran卡片,通知计算机把Fortran编译器从系统磁带上载入,接下来对后面程序员提前写好的Fortran程序进行编译。编译结束之后Load卡片通知计算机丢弃掉先前载入的Fortran编译器,载入编译好的程序。接下来Run卡片让程序开始运行,并以后面卡片上的数据作为输入。
这个时候尽管有了程序的概念(虽然被称为工作),但是依然没有现在的操作系统的概念,程序的运行是直接把程序从卡片读入计算机内部,然后开始运行。因此,在同一个时间点内,计算机只能运行一个程序,并不会存在现代的调度、中断这些用来实现并行的概念。
此外,正式由于这个时候的计算机非常昂贵,因此人们就想办法尽量提高计算机的利用率,即减少计算机的机时浪费。为此就产生了批处理系统(Batch System)。批处理系统的核心思想就是首先用一台便宜的机器从穿孔卡片中读取程序,然后把程序写入到磁带上,接下来用昂贵的计算机来直接从磁带中读取程序,然后进行运算。例如用便宜的IBM 1401完成从卡片中读取、写入到磁带,计算发生在昂贵的IBM 7904上。
之所以还需要使用穿孔卡片的原因在于在那个时候还没有键盘、鼠标这类便捷的输入设备,唯一对人类友好的输入方式就是穿孔卡片。而让人类直接读写磁带显然不可能。
因此对于批处理系统,一个典型的工作流程就是IBM 1401首先读取穿孔卡片两个小时,并把两个小时内读取到的程序全部输出到磁带上。接下来,操作员把磁带送到IBM 7904上,IBM 7904会依次读取磁带中的程序,进行计算,最后把计算结果输出到一个磁带上去,最后再用一个IBM 1401负责读取磁带中的结果,并打印到纸上。
第二代的大型机主要用于科学与工程计算,例如解微分方程。
此外,由于第二代计算机并不存在现代意义上的操作系统,当时的操作系统仅仅是包含编译器在内的一套软件,在存储器(磁带)中,系统和用户程序是相邻的
C. 第三代(1965-1980):集成电路和多道程序设计
相比于第二代计算机,第三代计算机的一个进步就是在计算机中采用了(小规模的)集成电路(Integrated Circuit,IC)。因此计算机的性能得到了巨大的提升。此外,第三代计算机的主存储器采用半导体,因而现代计算机中的内存/主存在此时出现。
在第三代计算机发展的初期,即1965年左右,这个时候每个计算机厂商需要维护两条产品线,一条是面向科学计算的大型机(mainframe),另外一条是面向文字处理的商用计算机(银行业、保险业、金融业),例如IBM 1401。
而维护两条生产线的代价是高昂的,因为厂商需要针对两种不同的设备维护相同的软件,但是却有两套不同的底层。另外一个问题就是同一条产品线的不同代的产品之间都不互相兼容。因此为了解决这个问题,在1964年,IBM推出了OS/360系统希望来屏蔽这个问题。OS/360系统搭载在System/360系列计算机上,尽管每代计算机都会有新的指令退出,OS/360都始终保持着兼容。这就意味着针对不同的硬件,OS/360都会提供支持,并对诸如Fortran编译器、文字处理程序提供支持。因此,OS/360代表着操作系统雏形的诞生,即向下沟通硬件、屏蔽硬件之间的差异,向上为程序提供资源/服务。
虽然后来OS/360变的越来越庞大,包含了数千个程序员写的百万行汇编代码,以至于维护越来越苦难,最终被放弃,System/360可以作为人类工程史上一项里程碑式的大型复杂软件系统而被记录。
除了屏蔽指令集的不同以外,OS/360的另外一大贡献就是开创了多道程序设计(multiprogramming)。
在第二代计算机中,计算机在一段时间内被一个作业独占,此时任何其他人都无法使用计算机。因此一个显著地问题就是计算机从卡片/磁带上读取/输出的时候会消耗很多时间,而这个时间段内当前作业仍然在占用计算机,因此CPU就会空转以等待这些I/O操作。对于科学计算这类CPU密集型的程序,一个作业85%的时间CPU在进行计算,而对于字符处理这些作业来说,CPU只有大概10~15%的时间在进行运算,其余时间在进行数据读写。
因此为了提高CPU的利用率,多道程序设计的核心思想在于当一个程序在进行I/O时,让另外一个程序使用CPU进行计算。
为了实现这样的技术,需要做的事情如下:
首先需要把所有的程序都读入计算机中,即存储到内存中(System/360中可以存放15个作业)
其次需要对内存中的每个作业进行保护,避免某个作业被当前作业错误的改写。
System/360,包括现在的计算机的做法是使用了两个特殊的变量,第一个变量指明当前程序的下界,而第二个变量指明当前程序的范围,这两个变量作为程序的一部分,储存在CPU上的两个寄存器中,即为了实现对程序的保护,需要有特殊的硬件。
通过这样的设计,OS/360的CPU利用率接近100%。
在OS/360之后,就是分时系统(Time-sharing System)。OS/360实现的多道程序设计极大地提升了CPU的利用率,但是却缺乏和用户的交互,因为所有的程序都是用户事先指定的,在运行的过程中用户无法和系统进行交互。为了解决这个问题,就出现了分时系统。
分时系统的核心思想在于让机器以固定的时间间隔在多个程序之间轮转,而不需要等待直到程序进行I/O的时候再把CPU让出。从CPU的家督来说,分时系统其实是多道程序设计的一个变体。通过分时系统,就可以实现让五六个用户同时通过终端连接到计算机,并且运行自己的程序,而CPU则在每个程序之间轮流进行执行。由于轮转的速度非常快,一秒可以有几十次,因此在用户的角度来说仿佛没有发生过轮转。因此极大的提升了用户的体验。
进一步,出现了兼容分时系统(Compatible Time-Sharing System,CTSS)。兼容分时系统的意义在于当有用户运行他们的程序的时候,系统会运行用户的程序,而让用户没有运行程序的时候,系统就会运行在后台的大型程序(计算密集型程序,这个时候以及不太说作业了)。
从分时系统开始,逐渐出现了程序之间的调度,由此产生了操作系统的第一个任务:进程调度(进程可以理解为作业的现代术语)。此外,由于程序(进程)需要保存在内存里,因此就出现了操作系统的第二个任务:内存管理。
在CTSS系统成功之后,进一步,人们希望研发一个系统,可以支持上百个分时用户通过终端,因此通用电气(GE)公司和MIT、贝尔实验室联合在一起,开发一个名为Multics(Multiiplexed Information and Computing Service)系统。虽然同样,Multics失败了,但是其进一步推动了操作系统的发展,推出了诸多原创性的思想。
最后,虽然Multics失败了,但是其把火种传播下去了,曾今参与Multics计划的贝尔实验室中的计算机科学家Ken Thompson在贝尔实验室中找到了一台没有人使用的计算机。为了使用这台计算机,他自己动手写了一个Multics的简化版系统。他的系统期初只在贝尔实验室中使用,慢慢的人们觉得这个系统越来越好用,因此也提出了越来越多的建议。慢慢的,在众人的帮助下基于Ken Thompson工作的新的系统Unix诞生了。
在起初,Unix系统是每个人都可以下载的,而且由于Unix的简单性,很多人都可以对Unix系统的源代码进行修改。因此,出现了很多Unix系统的修改版本,从而极大地推动了操作系统的发展。这些由Unix系统修改来的版本,在一起构成了Unix家族
D. 第四代(1980-至今):个人计算机
随着大规模集成电路(Large Scale Integrated Circuit)的发展,每平方厘米的硅片芯片上能够集成的晶体管的数量越来越多,因此,计算机的体积越来越小,个人计算机的时代到来了。
从计算机的体系结构看来,个人计算机(早期称为微型计算机)的结构和大型机没有大的区别。只是操作系统不同
个人计算机的发展可以追溯到Intel推出第一代小型、通用的CPU。在Intel推出第一代通用八位CPU——Intel 8080时,此时市面上的操作系统都是为大型机编写的,因此尽管8080 CPU确实可用,但是却没有能够让用户使用这个CPU的操作系统。因此英特尔邀请了Gary Kildall为8080编写一套操作系统。为此,Gary Kildal编写了一套完全基于磁带的操作系统,称为CP/M(Control Program for Microcomputer)。
CP/M随着英特尔的8080而大获成功,甚至统治了个人计算机操作系统长达五年。
正式因为CP/M的巨大成功,IBM这个早期的专门做大型机的公司开始瞄准个人机市场后,咨询Kildal能否为IBM的个人机进行适配以支持IBM的个人电脑。Kildal拒绝了IBM。因此IBM别无办法,只能开发自己的操作系统。
当IBM正在寻找能够在IBM的PC上运行的操作系统的时候,Bill Gates出现了。Bill Gates了解到在西雅图有一家叫做Seattle Computer Products的公司制作出了一个DOS系统(Disk Operating System),于是出价75000美元买下了这个系统。在进行简单的修改之后,Gates把这个系统成套的卖给了IBM。随后在IBM的要求下,Gates对DOS进行了修改,修改版称为MS-DOS(MicroSoft Disk Operating System)。MS-DOS很快抢占了CP/M的市场,并且在个人电脑的操作系统中占据主导地位。
另外一段故事就是在1983年,Steve Jobs的Apple公司发布的具有GUI的Lisa计算机。其实在1960年代,斯坦福大学的Doug Engelbart加收就开发出了图形用户界面,包括窗口、图标、菜单以及鼠标。然而那个时候操作系统本身都还没有发展起来,因此这个超时代的创新并没有引起重视。后来图形用户界面的研究被Xerox PARC的研究员继续深入下去。Jobs在一次访问PARC的时候,看到了GUI的系统,意识到了GUI的巨大应用。于是在1983年的时候,Jobs的Apple公司发布了第一个带有GUI系统的计算机:Lisa。
不过由于过于昂贵,Lisa最终在商业上失败了,但是Lisa后来的改进版,Macintosh获得了巨大的成功。因为它使得社会大众可以不用专门的学习计算机技术而使用计算机。
随后,微软在看到Apple的Macintosh获得的巨大成功之后,开发了名为Windows的基于GUI的操作系统。在Windows的早期,Windows只是在MS-DOS的基础上多运行了一个GUI的环境。一直直到1995年,微软才制作了一个完全独立的Windows,MS-DOS虽然依旧在系统中,但是仅仅用于运行早期的MS-DOS系统上编写的程序。
E. 第五代(1990-至今):移动计算机
第一台手持电话出现在1970年左右,大概两公斤,即当时在港台影片上看到的大哥大
后来随着大规模集成电路的发展,人们逐渐开始把计算机和电话结合起来,最终在90年代完成了这一摄设想。诺基亚发布的N9000真正做到了手机和电脑合二为一。进一步1997年爱立信公司的GS88手机发布的时候创造出了“智能手机”(SmartPhone)这一术语。
随着智能手机逐渐普及,智能手机上的各种操作系统间的竞争边的非常激烈。在最初的十年内,大多数手机都运行这Symbian OS。包括三星、索尼、爱立信、摩托罗达等等厂商在内,他们的手机在出场的时候就搭载了Symbian OS。除此以外,还有RIM公司的Blackberry OS。
然而,触屏技术的发展,新的支持触屏的系统迅速获得了市场,例如搭载iOS的iPhone的发布和Google的Android系统,成为移动计算机的巨头,统治了手机操作系统,直到今天。
3. 操作系统的种类
在前面,我们回顾了计算机的发展历史,并且伴随着计算机的发展穿插了各种操作系统。下面的内容将完全注重于操作系统,讲解各种类型的操作系统。
在讲解下面的系统前,我们首先需要明白,现代的操作系统主要有下面四大任务(下一篇文章会详细讲解):
- 进程管理
- 内存管理
- 文件管理
- 设备管理
A. Simple Batch Processing System,单道批处理操作系统
单道批处理在同一时间只能够运行一个程序(作业),并且在一个程序(作业)开始后,直到作业结束,系统都不会运行新的作业。而在一个作业从开始到结束的这段时间内,包括了作业的指令的读取事件、数据的读取事件、CPU的运算时间以及将结果输出的时间。因此正如前面所说,单道批处理操作系统会浪费大量的CPU时间。
但是相比于单道批处理操作系统之前的、由人工完成的一次把一个job的穿孔卡片放入、连接好电路而言,依旧节省了不少时间。
单道批处理系统的特点如下:
- 减少相同任务的初始化时间
- 自动的Job队列——可以顺着队列依次执行Job
- 需要雇佣一个操作员(换卡片)
- 需要一个读卡器
单道批处理系统的内存结构也非常简单,除了系统就是用户的程序
一些单道批处理系统的例子如下:
- BM FMS(FORTRAN Monitor System),for IBM7094
- IBM IBSYS,for IBM7090 and 7094
- UM UMES,for IBM7094,1959
- IBM JCL-related (job control language) systems.
B. Multiplied Batch Processing System,多道批处理操作系统
多道批处理操作系统是对单道批处理操作系统的改进,主要目的是为了提高CPU的利用率。
多道批处理操作系统,重点在于多道(Multiprgramming),而多道意味着:
- 对于程序而言,CPU在各个程序之间轮转,执行指令;而对于CPU来说,程序以交错的的形式形成一条线被CPU依次执行
- 在程序进行I/O等操作(没有使用CPU)的时候,把CPU让给其他程序使用
为此,支持多道程序的系统需要的特点如下:
内存管理和保护,因为要把所有的程序首先读入然后储存,因此其内存存储结构如下:
CPU调度,还包含上下文切换(寄存器内的值的改变)
资源共享:独占资源和同步资源,例如一个文件只能一个程序进行修改
设备分配
知名的操作系统包括:IBM OS 360
C. Time-Sharing System,分时系统
分时系统是多道批处理系统的变体,因此在很多地方和多道批处理系统是类似的:
- CPU在程序间轮转
然而不同之处在于:
- 分时系统要求系统与用户之间是可以进行交互的,因此当用户发出指令执行程序之后,用户执行的程序不能在被执行前等待过长的时间。因此,分是系统要求系统对用户响应必须要小于1秒
此外,分时系统的一些特点如下:
- 每个终端用户在内存中至少有一个程序(进程)
- 若多个程序都已经准备好运行(所有需要的资源都已经获得),系统具有调度CPU,决定那个程序可以获得CPU运行。
- 若进程太大,超过剩余的内存空间的话,操作系统就会通过将进程移入移出内存来最终运行程序(虚拟内存)
典型的分时系统如下:
- 1961年MIT开发的CTSS,兼容分时系统
- 1964-1969年由MIT 、Bell Lab of AT&T、DEC机构以PL/1语言开发的MULTICS
- 1970年由Bell Lab of AT&T, PDP 7等开发的UNIX
D. *nix Operating Systems,*nix 系列操作系统
尽管nix系列操作系统是分时系统的一种,但是由于、\nix系列操作系统在操作系统历史上是不可逾越的,因此单独讲讲Unix系列操作系统。
Unix和Linux系列的操作系统是最具有影响力的操作系统,并且有除了Windows以外的最大的用户基数。由于源代码开源,因此有非常多的修改后的在发行版本,但是这些系统通常在后面会加上*nix表示是Unix/Linux的衍生版本,因此在一些语境下,说Unix/Linux系统的时候其实指代的是*nix系列系统。
起初,第一版可以使用的Unix是在贝尔实验室中开发的,开发语言包括C语言和汇编语言。C语言其实最初的目的是为了帮助Thompson开发Unix操作系统
而后,从Unix派生出来两大流派:
- 由UC Berkely开发的BSD Unix系统,主要是为了科研使用。为了避免Unix的专利,BSD自己实现了Unix中的所有功能,并且没有参考AT&T 的Unix的代码
- 进一步,从BSD又发展出了Solaris系统,Solaris系统是BSD流派中安装最多的系统
- 此外,还有一个发行版是FreeBSD系统,也是一个安装比较多的系统
- BSD系统对系统提出了一些标准,这些标准称为POSIX标准,而MacOS是从BSD系统中发展来的,因此也支持这套标准。
- 又AT&T开发的的System V(贝尔实验室后来被AT&T收购了)
E. Real-time System,实时操作系统
实时操作系统是一种特殊目的的操作系统,他属于分时操作系统,但是他强调任务的实时性,即程序需要及时的完成。
注意实时操作系统对时间的看重程度远超分时系统,因为他们通常用在金融记账、飞机控制、航天器控制中,因此1秒的差距都是不可忍受的。
为此实时操作系统为每个任务都设定了一个截止时间,任何任务(进程)都必须要在截止时间之前完成。其实严格的说,并不是所有实时操作系统都是这样的。
实时操作系统分为两类:
- 硬实时操作系统,即一点超时都不能有的操作系统,任何的超时都意味着当前任务失败,需要重新进行
- 软实时操作系统,即偶尔的超时还是可以忍受的,但是尽量不要超时
F. Network Operating System,网络操作系统
网络操作系统即指具备网络能力的操作系统,关于网络主要在计算机网络中有所讲解,这里不会深入。
具体的网络能力指:
- 网络通信
- 网络服务
由于Unix允许用户写的程序可以和另外一台操作系统上的某个程序进行通信,因此Unix系列的操作系统就是网络操作系统,Windows和MacOS也是类似的
G. Distributed Systems,分布式系统
分布式系统指操作系统是分布在网络中的计算机集群中。通过网络实现将多台物理上的计算机形成逻辑上的单台性能强大的计算机。
因此分布式系统内需要对共享的资源进行管理并且协调所有的组件(计算机)完成目标
知名的例子有:
- Client/server system
- internet computing system(云服务器)
分布式系统的优点如下:
- Resources sharing
- Computation speed up – load sharing
- Reliability
- Communications
H. Parallel Systems,平行系统
平行系统指具有多个CPU的操作系统,多个CPU之间是高度耦合的,他们会共享内存、时钟等等内容。
这类系统的好处如下:
- Increased throughput
- Economical
- Increased reliability
- Graceful degradation
- Fail-soft system
此外,根据每个CPU执行的任务是否相同,有对称平行系统和非对称平行系统之分
- Symmetric multiprocessing (SMP) 对称平行系统指CPU之间运行的程序都是一样的
- Asymmetric multiprocessing,非对称平行系统则指CPU之间不是一样的,有的CPU负责管理其他CPU,有的负责进行运算
I. Embedded Operating System,嵌入式系统
所谓嵌入式系统,是指一些特化的用于处理固定任务的、与硬件高度结合的操作系统。例如微波炉中的操作系统
这类操作系统通常用于对设备进行控制,他们的特点如下:
- Special purpose system
- Should be customized
- Size can be cut out
- Low energy consumption
- Real time