操作系统实验 0

Image of the author

CrazySpottedDove github

使用 Docker 容器

实验提供了 Makefile 封装相关 Docker 命令。

CONTAINER_NAME := zju-os-code                  # 定义 Docker 容器名称
MAKEFLAGS := \                                # 定义 make 命令的参数
    ARCH=riscv \                              # 指定目标架构为 riscv
    CROSS_COMPILE=riscv64-linux-gnu-          # 指定交叉编译前缀

# File Locations
ROOTFS_PATH := ../rootfs.ext2                  # 根文件系统镜像路径
INITRD_PATH := ../initrd.gz                    # initrd 镜像路径
FAT32_PATH := ../fat32.img                     # FAT32 文件系统镜像路径
KERNEL_PATH := $(wildcard ../linux-*)          # 查找上级目录下以 linux- 开头的目录作为内核源码路径
#KERNEL_PATH := kernel                         # (注释掉)可手动指定内核源码路径为 kernel
IMAGE_PATH := $(KERNEL_PATH)/arch/riscv/boot/Image   # 内核镜像文件路径
VMLINUX_PATH := $(KERNEL_PATH)/vmlinux         # vmlinux 文件路径(未压缩内核)
OPENSBI_FW_JUMP_PATH := /usr/lib/riscv64-linux-gnu/opensbi/generic/fw_jump.elf      # OpenSBI 固件路径(fw_jump)
OPENSBI_FW_DYNAMIC_PATH := /usr/lib/riscv64-linux-gnu/opensbi/generic/fw_dynamic.elf # OpenSBI 固件路径(fw_dynamic)

# Alternative Targets
GDB_INIT_SCRIPT := gdbinit                     # GDB 初始化脚本
#GDB_INIT_SCRIPT := gdbinit.py                 # (注释掉)可选的 GDB 初始化脚本
GDB_TARGET := $(VMLINUX_PATH)                  # GDB 调试目标文件
#GDB_TARGET := $(FW_DYNAMIC_PATH)              # (注释掉)可选的 GDB 调试目标

SIMULATOR := qemu-system-riscv64               # 指定模拟器为 qemu-system-riscv64
ifeq ($(SIMULATOR),qemu-system-riscv64)        # 如果模拟器为 qemu-system-riscv64
    SIMULATOR_OPTS := \                        # QEMU 启动参数
        -nographic \                          # 不使用图形界面,全部输出到终端
        -machine virt \                       # 使用 virt 机器类型
        -kernel $(IMAGE_PATH) \               # 指定内核镜像
        -drive file=$(ROOTFS_PATH),format=raw,id=hd0,if=none \ # 挂载根文件系统
        -device virtio-blk-device,drive=hd0 \ # 使用 virtio 块设备
        -netdev user,id=net0 \                # 用户网络模式
        -device virtio-net-device,netdev=net0 \ # 使用 virtio 网络设备
        -append "root=/dev/vda ro console=ttyS0" # 内核启动参数,指定根设备和控制台
    SIMULATOR_DEBUG_OPTS := -s -S              # QEMU 调试参数,-s 开启 gdbserver,-S 启动后暂停
else ifeq ($(SIMULATOR),spike)                 # 如果模拟器为 spike
    SIMULATOR_OPTS := \                        # spike 启动参数
        --kernel=$(IMAGE_PATH) \               # 指定内核镜像
        --initrd=$(INITRD_PATH) \              # 指定 initrd 镜像
        --real-time-clint \                    # 启用实时 CLINT
        $(OPENSBI_FW_JUMP_PATH)                # 指定 OpenSBI 固件
    SIMULATOR_DEBUG_OPTS := --halted --rbb-port=9824 # spike 调试参数
else
    $(error Unsupported simulator: $(SIMULATOR)) # 不支持的模拟器报错
endif

.PHONY: build all clean qemu qemu-debug gdb    # 声明伪目标

ifeq ($(shell which docker),)                  # 如果 docker 不存在(即在容器内)
# inside docker
all:                                          # all 目标:编译内核
    make $(MAKEFLAGS) -C $(KERNEL_PATH) defconfig # 生成默认配置
    bear -- make $(MAKEFLAGS) -C $(KERNEL_PATH) -j$(shell nproc) # 用 bear 生成编译数据库并并行编译
clean:                                        # clean 目标:清理内核编译产物
    make -C $(KERNEL_PATH) clean
%:                                            # 通配符目标,转发所有命令到内核源码目录
    make $(MAKEFLAGS) -C $(KERNEL_PATH) $@
else                                          # 如果 docker 存在(即在宿主机)
# outside docker
all:                                          # all 目标:启动并进入 docker 容器
    docker compose create --no-recreate
    docker compose start
    docker compose exec -it $(CONTAINER_NAME) /usr/bin/fish
    docker compose stop
clean:                                        # clean 目标:销毁 docker 容器和卷
    docker compose down -v --remove-orphans
update: clean                                 # update 目标:先 clean 再拉取镜像
    docker compose pull
endif

run:                                          # run 目标:启动模拟器运行内核
    $(SIMULATOR) $(SIMULATOR_OPTS)

debug:                                        # debug 目标:启动模拟器并开启调试端口
    $(SIMULATOR) $(SIMULATOR_DEBUG_OPTS) $(SIMULATOR_OPTS)

gdb:                                          # gdb 目标:用 gdb-multiarch 连接调试
    gdb-multiarch -x $(GDB_INIT_SCRIPT) $(VMLINUX_PATH)

ocd:                                          # ocd 目标:启动 openocd 进行硬件调试
    openocd -f openocd.cfg

可以看到,Makefile 通过定义不同的目标,支持了如下的命令调用方式:

  • make
    • 在容器内,编译内核
    • 在宿主机,自动进入 docker 容器 shell
  • make clean
    • 在容器内:清理内核编译产物
    • 在宿主机:销毁 docker 容器和卷
  • make update
    • 在宿主机:拉取最新 docker 镜像
  • make run 启动 QEMU 或 spike,运行内核和 rootfs
  • make debug 启动 gdb-multiarch,加载 vmlinux 和 gdbinit 脚本,连接到调试端口
  • make ocd 启动 openocd,进行硬件调试
  • make <kernel_target> 例如 make menuconfig、make bzImage 等,转发到内核源码目录

compose.yml 则定义了 docker 的行为:

# https://docs.docker.com/reference/compose-file/
services:
  zju-os-code:
    image: git.zju.edu.cn:5050/os/tool:latest # 拉取的镜像
    container_name: zju-os-code # 容器名称
    hostname: zju-os-code #容器内主机名称
    volumes:
      - ./:/zju-os/code # 当前目录挂载到容器的 /zju-os/code
      # SSH and Git Configuration pass-through
      - ~/.gitconfig:/root/.gitconfig:ro # 挂载 .gitconfig
      - ~/.ssh:/mnt/host_ssh:ro # 挂载 .ssh
    post_start:
      - command: ["cp", "-r", "/mnt/host_ssh/.", "/root/.ssh/"]
    working_dir: /zju-os/code
    init: true
    entrypoint: ["sleep", "infinity"]

使用交叉编译工具链

riscv64-linux-gnu-gcc hello.c -o hello # 编译生成 riscv64 架构下的可执行文件
riscv64-linux-gnu-gcc -S hello.c -o hello.s # 编译生成汇编代码
riscv64-linux-gnu-objdump -d hello > hello.disasm # 反汇编

编译内核

make defconfig # 用当前架构自带的默认配置文件,生成 .config 配置文件
make -j$(nproc) # -j 参数表明并行,$(nproc) 是 shell 命令,返回当前机器的 CPU 核心数。这么做会让 make 使用所有 CPU 并行编译。如果想要显示详细的编译命令,可以追加参数 V=1
make distclean # 清除所有编译生成的文件、配置文件、符号链接等

Image 和 vmlinux 的区别

  • Image Image 是经过压缩或处理后的内核镜像文件,通常用于实际启动(boot)系统。它包含了内核的机器码,格式适合被引导加载程序(如 U-Boot、QEMU 等)直接加载到内存中运行。对于不同架构和平台,Image 可能有不同的封装格式(如 zImage、bzImage、uImage 等)。

  • vmlinux vmlinux 是未压缩的、带有符号信息的内核可执行文件,通常是 ELF 格式。它包含了完整的调试信息,主要用于内核开发和调试(如 gdb 调试内核时加载 vmlinux)。vmlinux 不能直接被引导程序加载启动。

异同点总结:

  • 相同点:都包含了 Linux 内核的机器码。
  • 不同点:
    • Image 适合实际启动系统,通常体积更小,不带调试信息。
    • vmlinux 适合调试和分析,体积较大,包含符号和调试信息,不能直接启动。

交叉编译 RISC-V 架构内核

变量 ARCHCROSS_COMPILE 被用来指定目标架构。默认的变量值在顶层的 Makefile 中被定义。而在命令行中,我们可以覆写它们。

  • ARCH 指定了我们需要的目标架构,如 x86,i386
  • CROSS_COMPILE 指定了我们的工具链前缀。如,想使用 x86_64-pc-linux-gnu-gcc 的话,就要设置 CROSS_COMPILEx86_64-pc-linux-gnu-

直接在命令行中追加就可以覆写这些变量:

# for example
make ARCH=arm CROSS_COMPILE=arm-unknown-linux-gnu-

这里我们使用

make defconfig ARCH=riscv CROSS_COMPILE=riscv64-linux-gnu-

使用 QEMU 运行 RISC-V 内核

什么是 QEMU

QEMU(Quick Emulator)是一个开源的通用虚拟化和模拟器工具。它可以模拟多种不同的硬件平台和处理器架构(如 x86、ARM、RISC-V 等),允许用户在一台物理主机上运行不同架构的操作系统和程序。QEMU 常用于操作系统开发、内核调试、嵌入式开发等场景。

主要特点:

  • 支持多种 CPU 架构的全系统模拟和用户态仿真
  • 可以与 KVM(Linux 内核虚拟机)配合,实现高性能虚拟化
  • 常用于虚拟机、操作系统实验、交叉架构开发和测试

在本实验中,QEMU 用于模拟 RISC-V 平台,运行和调试编译好的 Linux 内核和文件系统镜像。

QEMU 操作

  • 查看寄存器 info registers
  • 查看内存树 info mtree
  • 查看内存映射 info mem
  • 查看 TLB info tlb
  • 查看设备树 info fdt
  • 查看物理内存中的值 xp /xw 0x80200000,其中 xp 表示查看物理内存,/xw 表示 16 进制显示 word。

比如说,打印位于 0x80200000 的指令,可以用 xp /i 0x80200000/i 表示以指令格式反汇编显示。

RISC-V 执行环境

RISC-V 程序的行为依赖于其运行的执行环境(Execution Environment, EE)。RISC-V 执行环境接口(EEI)定义了程序启动时的初始状态、环境中硬件线程(hart)的数量和类型(包括支持的特权级)、内存和 I/O 区域的可访问性及属性、每个 hart 上所有合法指令的行为(即指令集架构 ISA 只是 EEI 的一部分),以及在执行过程中产生的中断或异常(包括环境调用)的处理方式。

常见的 EEI 示例有:

  • Linux 应用二进制接口(ABI)
  • RISC-V 管理员二进制接口(SBI)

RISC-V 执行环境的实现可以是纯硬件、纯软件,或软硬件结合。例如,某些功能可以通过硬件直接实现,也可以通过指令陷阱和软件模拟来实现。

执行环境的实现示例包括:

  • “裸机”硬件平台:hart 由物理处理器线程直接实现,指令可访问全部物理地址空间,平台定义了从上电复位开始的执行环境。
  • RISC-V 操作系统:通过虚拟内存控制内存访问,将多个用户级 hart 映射到物理处理器线程上,为用户程序提供隔离的执行环境。
  • RISC-V 虚拟机管理器(hypervisor):为多个客户操作系统提供 supervisor 级的执行环境。
  • RISC-V 模拟器(如 Spike、QEMU、rv8):在 x86 等平台上模拟 RISC-V hart,可提供用户级或 supervisor 级的执行环境。

简而言之,EEI 决定了 RISC-V 程序启动和运行时能“看到”的世界,包括硬件资源、特权级、内存布局、异常处理等。不同的 EEI 和实现方式会影响同一 RISC-V 程序的实际行为。

SBI 和 ABI 是什么?实现什么功能?

  • SBI(Supervisor Binary Interface) SBI 是 RISC-V 架构下 supervisor(操作系统内核)与底层固件(如 OpenSBI)之间的标准接口。它为操作系统内核提供了一组调用机制,用于访问硬件相关的功能,比如启动/关闭 hart(CPU 核心)、中断管理、定时器、I/O 等。SBI 的作用是屏蔽底层硬件差异,让操作系统内核可以在不同硬件平台上运行而无需关心具体实现细节。

  • ABI(Application Binary Interface) ABI 是应用程序与操作系统之间的接口标准,定义了应用程序如何调用操作系统提供的服务(如系统调用)、二进制文件格式、函数调用约定、数据类型大小和对齐方式等。Linux ABI 就是 Linux 用户程序与内核之间的接口规范。ABI 的作用是保证同一平台下编译的程序可以在不同的操作系统实现上正确运行。

总结:

  • SBI 连接“操作系统内核”与“底层固件/硬件”,为内核屏蔽硬件细节。
  • ABI 连接“用户程序”与“操作系统内核”,为应用屏蔽内核实现细节。

在 QEMU 启动过程中,QEMU 作为模拟器,实现了 RISC-V 指令集架构(ISA),在主机上虚拟出 RISC-V 的 hart(硬件线程),为上层软件提供了一个“硬件”运行环境。

OpenSBI 作为固件,实现了 RISC-V 的 SBI(Supervisor Binary Interface),为操作系统内核(如 Linux)提供 SEE(Supervisor Execution Environment,管理者执行环境)。它负责在硬件和操作系统之间进行抽象和管理,比如处理中断、启动 hart、提供系统调用等。

Linux 作为操作系统,实现了 Linux ABI(Application Binary Interface),为用户程序提供 AEE(Application Execution Environment,应用执行环境)。它负责管理进程、内存、文件系统等资源,并为用户程序提供标准的接口和服务。