0.前言
我之前说过我正在开发自己的操作系统JackOS
,但是在开启页表之后就遇到了困难,所以为了后续能够更好的开发JackOS
,这段时间就去学习了一下XV6
操作系统。
毕竟实践出真知,因此后面的安排就是准备魔改一下xv6
系统,即在xv6
的代码的基础上魔改其功能,例如增加系统调用、修改Shell、修改Scheduler
等等。
因此,在开始这些项目之前,先写一篇文章来介绍XV6
系统
1. XV6介绍
A. Unix
UNIX
(非复用信息和计算机服务,英语:Uniplexed Information and Computing Service
,UnICS
),一种多用户、多进程的计算机操作系统,源自于从20世纪70年代开始在美国AT&T公司的贝尔实验室开发的AT&T Unix。Unix
是第一个广泛流行的操作系统(原先最早的操作系统,类似于Multics
这类的并没有广泛使用的操作系统我们就不说了)。
Unix
的前身为1964年开始的Multics
,1965年时,贝尔实验室加入一项由通用电气和麻省理工学院合作的计划;该计划要创建一套多用户、多任务、多层次(multi-user、multi-processor、multi-level)的MULTICS
操作系统。贝尔实验室参与了这个操作系统的研发,但因为开发速度太慢,1969年贝尔实验室决定退出这个计划。贝尔实验室的工程师,肯·汤普逊和丹尼斯·里奇,在此时自行开发了Unix
。
此后的10年,Unix
在学术机构和大型企业中得到了广泛的应用,当时的UNIX
拥有者AT&T
公司以低廉甚至免费的许可将Unix
源码授权给学术机构做研究或教学之用,许多机构在此源码基础上加以扩展和改进,形成了所谓的“Unix
变种”,这些变种反过来也促进了Unix
的发展,其中最著名的变种之一是由加州大学伯克利分校开发的伯克利软件套件(BSD
)产品。
后来AT&T
意识到了Unix
的商业价值,不再将Unix
源码授权给学术机构,并对之前的Unix
及其变种声明了著作权权利。BSD
在Unix
的历史发展中具有相当大的影响力,被很多商业厂家采用,成为很多商用Unix
的基础。其不断增大的影响力终于引起了AT&T
的关注,于是开始了一场持久的著作权官司,这场官司一直打到AT&T
将自己的Unix
系统实验室卖掉,新接手的Novell
采取了一种比较开明的做法,允许UC Berkeley分校自由发布自己的Unix
变种,但是前提是必须将来自于AT&T
的代码完全删除,于是诞生了4.4 BSD Lite
版,由于这个版本不存在法律问题,4.4 BSD Lite
成为了现代Berkeley软件包的基础版本。尽管后来,非商业版的Unix
系统又经过了很多演变,但其中有不少最终都是创建在BSD
版本上(Linux
、Minix
等系统除外)。所以从这个角度上,4.4 BSD
又是所有自由版本Unix
的基础,它们和System V
及Linux
等共同构成Unix操作系统。
B. Version 6 Unix (V6)
UNIX第六版
(英语:Version 6 Unix
,简称 V6
),由贝尔实验室于1975年5月释出的UNIX
操作系统,是第一个对外公开的UNIX
版本,主要运行在DEC PDP-11
系列的小型计算机(Minicomputer)家族。前身为Version 5 Unix
,后继版本为1978年至1979年发布的Version 7 Unix
,但是直到1985年为止,Version 6 Unix
仍然可以运行。
Version 5 Unix
这个版本,AT&T
公司只授权给学术机构使用。Version 6 Unix
以$200美元授权给学校等学术机构,而非学术机构也可以以美金$20,000的价格获得授权以进行商业使用。
C. XV6
XV6
是在ANSI C中针对多处理器x86系统的Unix第六版的现代重新实现。它在麻省理工学院的操作系统工程(6.828)课程中用于教学目的。
与Linux
或BSD
注重实用性不同,XV6
注重教学,因此其非常简单,足以在一个学期内讲完。尽管简单,但XV6
中仍然包含Unix
的重要概念和组织。由于V6
是基于PDP-11
硬件系统编写的,而由于PDP-11
机器没有被广泛使用,并且由于最初的操作系统是用过时的pre-ANSI C编写的,所以MIT 6.838
这门课程没有学习原始的V6
代码
这门课的教师基于原始的V6
的代码进行了改变,使得V6
能够在现代的计算机上运行,而最终形成的修改版操作系统称为XV6
2. XV6项目结构:理解Makefile
上面我们介绍了XV6
系统的历史,而XV6
系统是用Makefile
组织的,因此为了后续魔改XV6
系统,我们首先需要明白XV6
的组织结构。
XV6
的Makefile
内容如下
OBJS = \
bio.o\
console.o\
exec.o\
file.o\
fs.o\
ide.o\
ioapic.o\
kalloc.o\
kbd.o\
lapic.o\
log.o\
main.o\
mp.o\
picirq.o\
pipe.o\
proc.o\
sleeplock.o\
spinlock.o\
string.o\
swtch.o\
syscall.o\
sysfile.o\
sysproc.o\
trapasm.o\
trap.o\
uart.o\
vectors.o\
vm.o\
# Cross-compiling (e.g., on Mac OS X)
# TOOLPREFIX = i386-jos-elf
# Using native tools (e.g., on X86 Linux)
#TOOLPREFIX =
# Try to infer the correct TOOLPREFIX if not set
ifndef TOOLPREFIX
TOOLPREFIX := $(shell if i386-jos-elf-objdump -i 2>&1 | grep '^elf32-i386$$' >/dev/null 2>&1; \
then echo 'i386-jos-elf-'; \
elif objdump -i 2>&1 | grep 'elf32-i386' >/dev/null 2>&1; \
then echo ''; \
else echo "***" 1>&2; \
echo "*** Error: Couldn't find an i386-*-elf version of GCC/binutils." 1>&2; \
echo "*** Is the directory with i386-jos-elf-gcc in your PATH?" 1>&2; \
echo "*** If your i386-*-elf toolchain is installed with a command" 1>&2; \
echo "*** prefix other than 'i386-jos-elf-', set your TOOLPREFIX" 1>&2; \
echo "*** environment variable to that prefix and run 'make' again." 1>&2; \
echo "*** To turn off this error, run 'gmake TOOLPREFIX= ...'." 1>&2; \
echo "***" 1>&2; exit 1; fi)
endif
# If the makefile can't find QEMU, specify its path here
# QEMU = qemu-system-i386
# Try to infer the correct QEMU
ifndef QEMU
QEMU = $(shell if which qemu > /dev/null; \
then echo qemu; exit; \
elif which qemu-system-i386 > /dev/null; \
then echo qemu-system-i386; exit; \
elif which qemu-system-x86_64 > /dev/null; \
then echo qemu-system-x86_64; exit; \
else \
qemu=/Applications/Q.app/Contents/MacOS/i386-softmmu.app/Contents/MacOS/i386-softmmu; \
if test -x $$qemu; then echo $$qemu; exit; fi; fi; \
echo "***" 1>&2; \
echo "*** Error: Couldn't find a working QEMU executable." 1>&2; \
echo "*** Is the directory containing the qemu binary in your PATH" 1>&2; \
echo "*** or have you tried setting the QEMU variable in Makefile?" 1>&2; \
echo "***" 1>&2; exit 1)
endif
CC = $(TOOLPREFIX)gcc
AS = $(TOOLPREFIX)gas
LD = $(TOOLPREFIX)ld
OBJCOPY = $(TOOLPREFIX)objcopy
OBJDUMP = $(TOOLPREFIX)objdump
CFLAGS = -fno-pic -static -fno-builtin -fno-strict-aliasing -O2 -Wall -MD -ggdb -m32 -Werror -fno-omit-frame-pointer
CFLAGS += $(shell $(CC) -fno-stack-protector -E -x c /dev/null >/dev/null 2>&1 && echo -fno-stack-protector)
ASFLAGS = -m32 -gdwarf-2 -Wa,-divide
# FreeBSD ld wants ``elf_i386_fbsd''
LDFLAGS += -m $(shell $(LD) -V | grep elf_i386 2>/dev/null | head -n 1)
# Disable PIE when possible (for Ubuntu 16.10 toolchain)
ifneq ($(shell $(CC) -dumpspecs 2>/dev/null | grep -e '[^f]no-pie'),)
CFLAGS += -fno-pie -no-pie
endif
ifneq ($(shell $(CC) -dumpspecs 2>/dev/null | grep -e '[^f]nopie'),)
CFLAGS += -fno-pie -nopie
endif
xv6.img: bootblock kernel
dd if=/dev/zero of=xv6.img count=10000
dd if=bootblock of=xv6.img conv=notrunc
dd if=kernel of=xv6.img seek=1 conv=notrunc
xv6memfs.img: bootblock kernelmemfs
dd if=/dev/zero of=xv6memfs.img count=10000
dd if=bootblock of=xv6memfs.img conv=notrunc
dd if=kernelmemfs of=xv6memfs.img seek=1 conv=notrunc
bootblock: bootasm.S bootmain.c
$(CC) $(CFLAGS) -fno-pic -O -nostdinc -I. -c bootmain.c
$(CC) $(CFLAGS) -fno-pic -nostdinc -I. -c bootasm.S
$(LD) $(LDFLAGS) -N -e start -Ttext 0x7C00 -o bootblock.o bootasm.o bootmain.o
$(OBJDUMP) -S bootblock.o > bootblock.asm
$(OBJCOPY) -S -O binary -j .text bootblock.o bootblock
./sign.pl bootblock
entryother: entryother.S
$(CC) $(CFLAGS) -fno-pic -nostdinc -I. -c entryother.S
$(LD) $(LDFLAGS) -N -e start -Ttext 0x7000 -o bootblockother.o entryother.o
$(OBJCOPY) -S -O binary -j .text bootblockother.o entryother
$(OBJDUMP) -S bootblockother.o > entryother.asm
initcode: initcode.S
$(CC) $(CFLAGS) -nostdinc -I. -c initcode.S
$(LD) $(LDFLAGS) -N -e start -Ttext 0 -o initcode.out initcode.o
$(OBJCOPY) -S -O binary initcode.out initcode
$(OBJDUMP) -S initcode.o > initcode.asm
kernel: $(OBJS) entry.o entryother initcode kernel.ld
$(LD) $(LDFLAGS) -T kernel.ld -o kernel entry.o $(OBJS) -b binary initcode entryother
$(OBJDUMP) -S kernel > kernel.asm
$(OBJDUMP) -t kernel | sed '1,/SYMBOL TABLE/d; s/ .* / /; /^$$/d' > kernel.sym
# kernelmemfs is a copy of kernel that maintains the
# disk image in memory instead of writing to a disk.
# This is not so useful for testing persistent storage or
# exploring disk buffering implementations, but it is
# great for testing the kernel on real hardware without
# needing a scratch disk.
MEMFSOBJS = $(filter-out ide.o,$(OBJS)) memide.o
kernelmemfs: $(MEMFSOBJS) entry.o entryother initcode kernel.ld fs.img
$(LD) $(LDFLAGS) -T kernel.ld -o kernelmemfs entry.o $(MEMFSOBJS) -b binary initcode entryother fs.img
$(OBJDUMP) -S kernelmemfs > kernelmemfs.asm
$(OBJDUMP) -t kernelmemfs | sed '1,/SYMBOL TABLE/d; s/ .* / /; /^$$/d' > kernelmemfs.sym
tags: $(OBJS) entryother.S _init
etags *.S *.c
vectors.S: vectors.pl
./vectors.pl > vectors.S
ULIB = ulib.o usys.o printf.o umalloc.o
_%: %.o $(ULIB)
$(LD) $(LDFLAGS) -N -e main -Ttext 0 -o $@ $^
$(OBJDUMP) -S $@ > $*.asm
$(OBJDUMP) -t $@ | sed '1,/SYMBOL TABLE/d; s/ .* / /; /^$$/d' > $*.sym
_forktest: forktest.o $(ULIB)
# forktest has less library code linked in - needs to be small
# in order to be able to max out the proc table.
$(LD) $(LDFLAGS) -N -e main -Ttext 0 -o _forktest forktest.o ulib.o usys.o
$(OBJDUMP) -S _forktest > forktest.asm
mkfs: mkfs.c fs.h
gcc -Werror -Wall -o mkfs mkfs.c
# Prevent deletion of intermediate files, e.g. cat.o, after first build, so
# that disk image changes after first build are persistent until clean. More
# details:
# http://www.gnu.org/software/make/manual/html_node/Chained-Rules.html
.PRECIOUS: %.o
UPROGS=\
_cat\
_echo\
_forktest\
_grep\
_init\
_kill\
_ln\
_ls\
_mkdir\
_rm\
_sh\
_stressfs\
_usertests\
_wc\
_zombie\
fs.img: mkfs README $(UPROGS)
./mkfs fs.img README $(UPROGS)
-include *.d
clean:
rm -f *.tex *.dvi *.idx *.aux *.log *.ind *.ilg \
*.o *.d *.asm *.sym vectors.S bootblock entryother \
initcode initcode.out kernel xv6.img fs.img kernelmemfs \
xv6memfs.img mkfs .gdbinit \
$(UPROGS)
# make a printout
FILES = $(shell grep -v '^\#' runoff.list)
PRINT = runoff.list runoff.spec README toc.hdr toc.ftr $(FILES)
xv6.pdf: $(PRINT)
./runoff
ls -l xv6.pdf
print: xv6.pdf
# run in emulators
bochs : fs.img xv6.img
if [ ! -e .bochsrc ]; then ln -s dot-bochsrc .bochsrc; fi
bochs -q
# try to generate a unique GDB port
GDBPORT = $(shell expr `id -u` % 5000 + 25000)
# QEMU's gdb stub command line changed in 0.11
QEMUGDB = $(shell if $(QEMU) -help | grep -q '^-gdb'; \
then echo "-gdb tcp::$(GDBPORT)"; \
else echo "-s -p $(GDBPORT)"; fi)
ifndef CPUS
CPUS := 2
endif
QEMUOPTS = -drive file=fs.img,index=1,media=disk,format=raw -drive file=xv6.img,index=0,media=disk,format=raw -smp $(CPUS) -m 512 $(QEMUEXTRA)
qemu: fs.img xv6.img
$(QEMU) -serial mon:stdio $(QEMUOPTS)
qemu-memfs: xv6memfs.img
$(QEMU) -drive file=xv6memfs.img,index=0,media=disk,format=raw -smp $(CPUS) -m 256
qemu-nox: fs.img xv6.img
$(QEMU) -nographic $(QEMUOPTS)
.gdbinit: .gdbinit.tmpl
sed "s/localhost:1234/localhost:$(GDBPORT)/" < $^ > $@
qemu-gdb: fs.img xv6.img .gdbinit
@echo "*** Now run 'gdb'." 1>&2
$(QEMU) -serial mon:stdio $(QEMUOPTS) -S $(QEMUGDB)
qemu-nox-gdb: fs.img xv6.img .gdbinit
@echo "*** Now run 'gdb'." 1>&2
$(QEMU) -nographic $(QEMUOPTS) -S $(QEMUGDB)
# CUT HERE
# prepare dist for students
# after running make dist, probably want to
# rename it to rev0 or rev1 or so on and then
# check in that version.
EXTRA=\
mkfs.c ulib.c user.h cat.c echo.c forktest.c grep.c kill.c\
ln.c ls.c mkdir.c rm.c stressfs.c usertests.c wc.c zombie.c\
printf.c umalloc.c\
README dot-bochsrc *.pl toc.* runoff runoff1 runoff.list\
.gdbinit.tmpl gdbutil\
dist:
rm -rf dist
mkdir dist
for i in $(FILES); \
do \
grep -v PAGEBREAK $$i >dist/$$i; \
done
sed '/CUT HERE/,$$d' Makefile >dist/Makefile
echo >dist/runoff.spec
cp $(EXTRA) dist
dist-test:
rm -rf dist
make dist
rm -rf dist-test
mkdir dist-test
cp dist/* dist-test
cd dist-test; $(MAKE) print
cd dist-test; $(MAKE) bochs || true
cd dist-test; $(MAKE) qemu
# update this rule (change rev#) when it is time to
# make a new revision.
tar:
rm -rf /tmp/xv6
mkdir -p /tmp/xv6
cp dist/* dist/.gdbinit.tmpl /tmp/xv6
(cd /tmp; tar cf - xv6) | gzip >xv6-rev10.tar.gz # the next one will be 10 (9/17)
.PHONY: dist-test dist
A. 调试XV6: make qemu-nox-gdb
为了调试XV6
,我们在命令行中使用的命令是
make qemu-nox-gdb
而这个命令表示我们运行Makefile
中的 qemu-nox-gdb
目标。
Makefile
中的 qemu-nox-gdb
目标如下:
qemu-nox-gdb: fs.img xv6.img .gdbinit
@echo "*** Now run 'gdb'." 1>&2
$(QEMU) -nographic $(QEMUOPTS) -S $(QEMUGDB)
其中:
@echo
是输出命令QEMU
、QEMUOPTS
和QEMUGDB
三个都是宏qemu-nox-gdb: fs.img xv6.img .gdbinit
表示目标qemu-nox-gdb
依赖目标fs.img
,xv6.img
和.gdbinit
,即在build目标qemu-nox-gdb
之前,要先build后面三个目标
宏 QEMU
, QEMUOPTS
和 QEMUGDB
的定义为
QEMU = $(shell if which qemu > /dev/null; \
then echo qemu; exit; \
elif which qemu-system-i386 > /dev/null; \
then echo qemu-system-i386; exit; \
elif which qemu-system-x86_64 > /dev/null; \
then echo qemu-system-x86_64; exit; \
else \
qemu=/Applications/Q.app/Contents/MacOS/i386-softmmu.app/Contents/MacOS/i386-softmmu; \
if test -x $$qemu; then echo $$qemu; exit; fi; fi; \
echo "***" 1>&2; \
echo "*** Error: Couldn't find a working QEMU executable." 1>&2; \
echo "*** Is the directory containing the qemu binary in your PATH" 1>&2; \
echo "*** or have you tried setting the QEMU variable in Makefile?" 1>&2; \
echo "***" 1>&2; exit 1)
QEMUOPTS = -drive file=fs.img,index=1,media=disk,format=raw -drive file=xv6.img,index=0,media=disk,format=raw -smp $(CPUS) -m 512 $(QEMUEXTRA)
QEMUGDB = $(shell if $(QEMU) -help | grep -q '^-gdb'; \
then echo "-gdb tcp::$(GDBPORT)"; \
else echo "-s -p $(GDBPORT)"; fi)
所以QEMU
这个宏就是就是循找系统上当前可用的qemu
版本,而QEMUOPTS
定义了一系列运行qemu
时候的命令行参数,而QEMUGDB
宏就是指定用gdb
进行调试,同时指定gdbserver
的端口
此外,需要注意的是,在宏QEMUOPTS
中,-drive
选项后面定义了运行虚拟机时候使用了两个硬盘镜像:fs.img
和xv6.img
。换而言之,-drive
选项说了我们的系统是安装在fs.img
和xv6.img
这两个硬盘镜像上的。
B. xv6.img
接下来向上追溯,看看xv6.img
这个target:
xv6.img: bootblock kernel
dd if=/dev/zero of=xv6.img count=10000
dd if=bootblock of=xv6.img conv=notrunc
dd if=kernel of=xv6.img seek=1 conv=notrunc
xv6.img
这个目标首先创建了一个空的磁盘映像xv6.img
,然后把bootblock
写入到了磁盘的第零个块,而后把kernel
写入到第一个块。
此外,xv6.img
目标依赖于bootblock
和kernel
这两个目标。
C. kernel
xv6.img
目标依赖了bootblock
和kernel
这两个目标,所以我们接下来先看看kernel
这个目标
kernel: $(OBJS) entry.o entryother initcode kernel.ld
$(LD) $(LDFLAGS) -T kernel.ld -o kernel entry.o $(OBJS) -b binary initcode entryother
$(OBJDUMP) -S kernel > kernel.asm
$(OBJDUMP) -t kernel | sed '1,/SYMBOL TABLE/d; s/ .* / /; /^$$/d' > kernel.sym
看这个样子,kernel
这个目标干的事情就是把目标entry.o
、entryother
等等编译出来的目标文件(.o
)连接在一起,最终输出kernel
这个可执行文件。
而后通过objdump
这个命令(在宏OBJDUMP
中定义)把kernel
反汇编出来,并且把其中的的符号全部列出来。
D. bootblock
接下来看看bootblock
这个目标,bootblock
这个目标内容如下
bootblock: bootasm.S bootmain.c
$(CC) $(CFLAGS) -fno-pic -O -nostdinc -I. -c bootmain.c
$(CC) $(CFLAGS) -fno-pic -nostdinc -I. -c bootasm.S
$(LD) $(LDFLAGS) -N -e start -Ttext 0x7C00 -o bootblock.o bootasm.o bootmain.o
$(OBJDUMP) -S bootblock.o > bootblock.asm
$(OBJCOPY) -S -O binary -j .text bootblock.o bootblock
./sign.pl bootblock
具体来说,bootblock
目标干的事情就是编译了bootmain.c
和bootasm.S
这两个程序,然后把它们连接在一起之后生成bootblock.o
接下来通过objdump
和objcopy
来分别进行反汇编和代码段拷贝。
最后运行sign.pl
脚本来进行处理。
E. fs.img
介绍完了xv6.img
接下来我们介绍fs.img
UPROGS=\
_cat\
_echo\
_forktest\
_grep\
_init\
_kill\
_ln\
_ls\
_mkdir\
_rm\
_sh\
_stressfs\
_usertests\
_wc\
_zombie\
fs.img: mkfs README $(UPROGS)
./mkfs fs.img README $(UPROGS)
fs.img
这个目标主要就是通过mkfs
这个程序来向fs.img
中写入宏UPROGS
中指明的程序。
F. 总结
总结一下,当我们在命令行中运行make qemu-nox-gdb
命令的时候,make
在背后默默为我们做了下面这些事:
- 编译内核,并将得到的
kernel
程序写入到xv6.img
这个磁盘映像文件中。 - 编译用户程序,而后将所有的用户程序写入到
fs.img
中 - 将
xv6.img
和fs.img
作为虚拟机的磁盘,通过qemu
启动虚拟机 - 使用
qemu
的时候启动gdb server
以支持远程调试
到现在为止,我们已经介绍了XV6
项目的历史渊源,并且介绍了XV6
的项目结构