英语

RISC-V 内核启动要求和约束

作者:

Alexandre Ghiti <alexghiti@rivosinc.com>

日期:

2023 年 5 月 23 日

本文档描述了 RISC-V 内核对引导加载程序和固件的期望,以及开发人员在接触早期启动过程时必须牢记的约束。对于本文档而言,早期 启动 过程 指的是在最终虚拟映射设置之前运行的任何代码。

内核前要求和约束

RISC-V 内核对引导加载程序和平台固件有以下期望

寄存器状态

RISC-V 内核期望

  • $a0 包含当前核心的 hartid。

  • $a1 包含内存中设备树的地址。

CSR 状态

RISC-V 内核期望

  • $satp = 0:如果存在 MMU,则必须禁用它。

为常驻固件预留的内存

RISC-V 内核不得在直接映射中映射任何常驻内存或受 PMP 保护的内存,因此固件必须按照设备树规范和/或 UEFI 规范正确标记这些区域。

内核位置

RISC-V 内核期望被放置在 PMD 边界上(对于 rv64 为 2MB 对齐,对于 rv32 为 4MB 对齐)。请注意,如果不是这种情况,EFI 桩将物理地重新定位内核。

硬件描述

固件可以将设备树或 ACPI 表传递给 RISC-V 内核。

设备树可以直接使用 $a1 寄存器从上一阶段传递给内核,或者在使用 UEFI 引导时,可以使用 EFI 配置表传递。

ACPI 表使用 EFI 配置表传递给内核。在这种情况下,EFI 桩仍然会创建一个小的设备树。有关此设备树的详细信息,请参阅下面的“EFI 桩和设备树”部分。

内核入口

在 SMP 系统上,有两种进入内核的方法

  • RISCV_BOOT_SPINWAIT:固件在内核中释放所有 hart,一个 hart 赢得抽奖并执行早期启动代码,而其他 hart 则被停放等待初始化完成。此方法主要用于支持没有 SBI HSM 扩展和 M 模式 RISC-V 内核的旧固件。

  • 有序 引导:固件仅释放一个 hart,该 hart 将执行初始化阶段,然后使用 SBI HSM 扩展启动所有其他 hart。有序引导方法是引导 RISC-V 内核的首选引导方法,因为它支持 CPU 热插拔和 kexec。

UEFI

UEFI 内存映射

使用 UEFI 引导时,RISC-V 内核将仅使用 EFI 内存映射来填充系统内存。

UEFI 固件必须解析 /reserved-memory 设备树节点的子节点,并遵守设备树规范,以将其子节点的属性(no-mapreusable)转换为其正确的 EFI 等效项(请参阅设备树规范 v0.4-rc1 的“3.5.4 /reserved-memory 和 UEFI”部分)。

RISCV_EFI_BOOT_PROTOCOL

使用 UEFI 引导时,EFI 桩需要启动 hartid,以便将其在 $a1 中传递给 RISC-V 内核。EFI 桩使用以下方法之一检索启动 hartid

  • RISCV_EFI_BOOT_PROTOCOL首选)。

  • boot-hartid 设备树子节点(已弃用)。

任何新的固件都必须实现 RISCV_EFI_BOOT_PROTOCOL,因为基于设备树的方法现在已弃用。

早期启动要求和约束

RISC-V 内核的早期启动过程在以下约束下运行

EFI 桩和设备树

使用 UEFI 引导时,设备树由 EFI 桩补充(或创建),其参数与 arm64 相同,这在 统一可扩展固件接口 (UEFI) 中的“ARM 上的 UEFI 内核支持”段落中描述。

虚拟映射安装

虚拟映射的安装在 RISC-V 内核中分 2 个步骤完成

  1. setup_vm()early_pg_dir 中安装临时内核映射,这允许发现系统内存。此时仅映射内核文本/数据。建立此映射时,不能进行分配(因为系统内存尚不可知),因此 early_pg_dir 页表是静态分配的(每级仅使用一个表)。

  2. setup_vm_final()swapper_pg_dir 中创建最终内核映射,并利用发现的系统内存来创建线性映射。建立此映射时,内核可以分配内存,但不能直接访问它(因为直接映射尚未出现),因此它使用 fixmap 区域中的临时映射来能够访问新分配的页表级别。

为了使 virt_to_phys()phys_to_virt() 能够正确地将直接映射地址转换为物理地址,它们需要知道 DRAM 的起始位置。这发生在步骤 1 之后,就在步骤 2 安装直接映射之前(请参阅 arch/riscv/mm/init.c 中的 setup_bootmem() 函数)。在安装最终虚拟映射之前使用这些宏的任何用法都必须仔细检查。

通过 fixmap 进行设备树映射

由于 reserved_mem 数组使用 setup_vm() 建立的虚拟地址进行初始化,并与 setup_vm_final() 建立的映射一起使用,因此 RISC-V 内核使用 fixmap 区域来映射设备树。这确保了设备树在两个虚拟映射中都可访问。

预 MMU 执行

在建立第一个虚拟映射之前,需要运行一些代码。这些代码是安装第一个虚拟映射本身、修补早期备选项以及早期解析内核命令行。必须非常小心地编译该代码,因为

  • -fno-pie:这对于使用 -fPIE 的可重定位内核是必需的,因为否则,对全局符号的任何访问都将通过仅在虚拟重定位的 GOT。

  • -mcmodel=medany:对全局符号的任何访问都必须是 PC 相关的,以避免在设置 MMU 之前发生任何重定位。

  • 所有检测也必须禁用(包括 KASAN、ftrace 等)。

由于使用来自不同编译单元的符号需要使用这些标志编译该单元,我们建议尽可能不使用外部符号。