深入UEFI内核
前面通过《UEFI原理与编程》一书介绍了如何使用UEFI编写应用程序和驱动,编程一书是从上层应用和驱动开发者的角度认识UEFI的,UEFI就像一个黑盒子,书中详细介绍了这个黑盒子的表面(即UEFI提供给上层开发者的接口和服务)。接口通过Protocol呈现给开发者。主要的Protocol包括控制台输入输出Protocol;文件及硬盘Protocol;操作外部设备的Protocol(PciIo等);驱动框架Protocol;人机交互接口Protocol;网络Protocol。服务通过启动服务和运行时服务提供,主要包括Protocol服务,内存管理服务,事件管理服务等。UEFI虽然庞大,但它通过模块化被很清晰的组织在一起,当逐步掌握了这些主要的Protocol和服务之后,UEFI也就变得简单起来,那么是时候深入到这个盒子内部,了解UEFI内核的运行机制了。
下面将以系统启动过程为主线介绍UEFI内核。
第一条指令(ResetVector)
先说结论:X86
CPU启动后,将从地址0xFFFFFFF0处开始执行(此地址并非内存地址。此时,内存还远远没有初始化。)。这一章来看X86系统是如何实现这一点的。
加电或者RESET针脚被激发(Assert)后[ref intel] CPU会经历如下几个过程:
- CPU首先会进行硬件初始化(hardware reset)。
- 然后是可选的自检过程(BIST built-in self-test)。
- CPU开始执行第一条指令。从此开始CPU进入软件初始化过程。
初始化概述
1.CPU硬件初始化
CPU硬件初始化完成后,CPU被设置为实地址模式,地址无分页。所有寄存器被初始化为特定的值, Cache、TLB(Translation Lookup Table)、BLB(Branch Target Buffer)这三个部件的内容被清空(Invalidate)。2.自检
CPU硬件初始化过程中,硬件可能请求执行自检。如果执行自检,自检完成后,EAX的值为自检错误码,0表示没有任何错误;3.第一条指令
现在,完事俱备,CPU已经准备好,迫不及待地要执行第一条指令了。且慢,这是一个重要的时刻,此刻决定了CPU能否正常指令,让我们详细了解一下CPU目前的状态。
表1-1 CPU初始化后的寄存器(部分)
Register | Pentium 4 and Intel Xeon Processor | P6 Family Processor Including DisplayFamily = 06H) | Pentium Processor |
---|---|---|---|
EFLAGS1 | 00000002H | 00000002H | 00000002H |
EIP | 0000FFF0H | 0000FFF0H | 0000FFF0H |
CR0 | 60000010H | 60000010H | 60000010H |
CR2, CR3, CR4 | 00000000H | 00000000H | 00000000H |
CS | Selector = F000H Base = FFFF0000H Limit = FFFFH AR = Present, R/W, Accessed |
Selector = F000H Base = FFF0000H Limit = FFFFH AR = Present, R/W, Accessed |
Selector = F000H Base = FFFF0000H Limit = FFFFH AR = Present, R/W, Accessed |
SS, DS, ES, FS, GS | Selector = 0000H Base = 00000000H Limit = FFFFH AR = Present, R/W, Accessed |
Selector = 0000H Base = 00000000H Limit = FFFFH AR = Present, R/W, Accessed |
Selector = 0000H Base = 00000000H Limit = FFFFH AR = Present, R/W, Accessed |
EDX | 00000FxxH | 000n06xxH | 000005xxH |
EAX | 0 | 0 | 0 |
EBX, ECX, ESI, EDI, EBP,ESP | 00000000H | 00000000H | 00000000H |
此处我们最关心的是指令执行相关的两个寄存器EIP(Instruction Pointer)、CS(Code
Segment)。
在实地址模式下(寄存器字长为16位),指令的物理地址是CS << 4 +
EIP。段寄存器CS左移四位作为基址,再加上作为偏移的EIP,最终形成指令的物理地址。现代CPU中为了加速指令地址的计算,为每个段寄存器增加了两个寄存器:Base和Limit。Base存放基址,Limit存放最大偏移值。Base和Limit寄存器不能通过指令直接读写,他们的值是在写段寄存器时由CPU自动设置的。通常Base等于段寄存器左移四位,如果CS的值为0xF000,CS的Base寄存器则为0xF0000,但CPU初始化时例外。从表1-1可以看出CS的值为0xF000,
但其Base为0xFFFF0000,EIP为0xFFF0,此时对应的指令地址为0xFFFF0000+0xFFF0 =
0xFFFFFFF0。0xFFFFFFF0就是CPU将要执行的第一条指令。这造成这样一个有趣的事实,16位程序眼中的指令地址空间0x0000~0xFFFF(大小为64K)被CPU翻译到物理地址空间(0xFFFF0000~0xFFFFFFFF)。也就是说,从CPU初始化,到段寄存器被重写(通过跨段跳转指令)前,指令空间0x0000~0xFFFF通过段寄存器被映射到物理地址空间0xFFFF0000~0xFFFFFFFF。
前面讲到第一条指令地址为0xFFFFFFF0,X86系统初始化时会将ROM中的固件映射的(0xFFFFFFFF-固件大小)~0xFFFFFFFF的地址空间。故而0xFFFFFFF0对应ROM中的某条指令,无论ROM中存放的是传统的BIOS固件,还是存放的UEFI固件,这个规则都是一样的。下面将从这天指令开始继续CPU初始化之旅。
.fdf文件
开始讲0xFFFFFFF0对应的指令之前,还要熟悉UEFI ROM的的结构。
ROM固件(Flash Device binary image)由一个或多个Firmware
volume(FV)构成,每个FV里存放了FFS Image(EFI Firmware File system),FFS
Image则由多个EFI Section构成,EFI Section包含了PE32/PE32+/Coff Image文件。
欲熟悉UEFI ROM的结构,先来看.fdf文件的格式。.fdf(Flash Description
File)用于生成固件镜像,它由[Defines]、[FD]、[FV]等几个部分组成。
[Defines]
在[Defines]部分可以通过DEFINE定义本文件将要用到的宏,通过SET定义PCD的值。例如OvmfPkg的OvmfPkgX64.fdf文件的[Defines]为
1 |
[Defines] |
!ifdef, !ifndef, !if, !elseif, !else and !endif
用于编写条件语句。$(TARGET)是EDK预定义的宏,其值为build命令-b选项的值。可以看出,编译Release版本时,通过DEFINE定义了FD_SIZE_1MB宏。
然后通过!include包含了OvmfPkg.fdf.inc文件,OvmfPkg.fdf.inc内容如下
1 |
DEFINE BLOCK_SIZE = 0x1000 |
通过OvmfPkg.fdf.inc可以看出,编译RELEASE版本的OVMF时, FW_BASE_ADDRESS(固件基址)被定义为0xFFF00000, FW_SIZE被定义为0x00100000(1 M)。
[FD]
每个[FD]定义一个flash device image。flash device
image可以是一个移动介质的可启动Image,或者系统ROM
Image,也可以是用于更新系统ROM的Update(“Capsule”) Image。
每个.inf文件可以有多个[FD],每个[FD]生成一个.fd镜像文件。例如OvmfPkgX64.fdf文件定义了[FD.OVMF]、[FD.OVMF_VARS]、[FD.OVMF_CODE]、[FD.MEMFD],编译后会生成OVMF.FD、OVMF_VARS.FD、OVMF_CODE.FD、MEMFD.FD四个镜像文件。
TOKEN
[FD]块以TOKEN语句开始,用于定义本FD的基本属性,每一行定义一个Token,基本语法如下:
1 |
Token = VALUE [| PcdName] |
有效的Token包括以下5个
Token | 用途 |
---|---|
BaseAddress | FLASH Device的基址 |
Size | FLASH Device的大小 |
ErasePolarity | |
BlockSize | |
NumBlocks | 默认值为1 |
BlockSize可以出现多次,$\sum_{i=0}^{n} BlockSize_i *
NumBlocks_i$必须等于Size。
例如Nt32PKG.fdf文件中
1 |
[FD.Nt32] |
NT32PKG生成的NT32.fd基址为0,在程序中可以通过PCD的gEfiNt32PkgTokenSpaceGuid.PcdWinNtFdBaseAddress访问这个值。大小为0x002a0000
= 0x10000 0x2a。
再如下例,Size(0x102000) = 0x10000 16 + 0x1000 * 2
1 |
[FD.FdMain] |
接着Token的是可选的DEFINE和SET定义,用于定义本[FD]块内有效的宏和PCD。
然后是Region列表,每个Region定义了位置、大小及其中的内容,格式为
1 |
Offset|Size |
第一行定义了本Region的偏移位置和大小。
第二行和第三行为可选项。
第二行定义对应的PCD值,相当于
SET TokenSpaceGuidCName.PcdOffsetCName = Offset
SET TokenSpaceGuidCName.PcdSizeCName = Size
第三行定义本Region包含的内容。内容可以为数据(Data),也可以是FV(Firmware Volume)。
所有的Region必须按偏移地址升序排列,Region之间不得重叠。
例如OvmfPkg.fdf.inc文件的[FD.OVMF]块:
1 |
[FD.OVMF] |
通过!include
VarStore.fdf.inc引入了数据Region,数据Reigon后是两个Fv。编译Release版本OVMF时,这两个Region为
1 |
0x20000|0x000CC000 |
1M的ovmf.fd内容组织如下:
地址区间 | 内容 |
---|---|
0x00000 ~ 0x01FFFF | Data |
0x20000 ~ 0x0EBFFF | FVMAIN_COMPACT |
0xEC000 ~ 0x100000 | SECFV |
再来看OVMF.FD的数据区,定义在文件VarStore.fdf.inc中,详细大家已经掌握了其格式。
1 |
0x00000000|0x0000e000 |
[FV]
下面来看在FD中作为Region的FV(Firmare
Volume)。一个FV定义了一个固件卷,其内容包含一些列二进制Image,这些Image按[FV]中排列的顺序排列在最终生成固件中。
[FV.UiFvName]中UiFvName用于标示这个FV,通过 FV =
UiFvName可以在其他FV和FD中引用UiFvName。
先睹为快,下面是[FV.SECFV]
1 |
[FV.SECFV] |
[FV]首先是Token,定义了本FV的基本属性,例如BlockSize等。
然后可以通过DEFINE 定义宏,通过SET定义PCD。
在然后就是内容列表了。内容可以通过INF、FILE定义,也可以通过SECTION、APRIORI包含一系列内容。
INF
通过INF包含一个模块,其语法如下
1 |
INF [Options] PathAndInfFileName |
例如【FV.SECFV]中,通过INF 定义了SecMain.inf、ResetVector.inf,这两个模块将会按顺序存放在这个FV中。编译ResetVector.inf模块时将会按RESET_VECTOR指定的规则生成.efi文件。
FILE
通过FILE包含文件的语法有两种,一种是包含单个文件,一种表示包含多个文件
1 |
FILE Type $(NAMED_GUID) [Options] FileName |
例如[FV.DXEFV]有如下内容。
1 |
#Type为FREEFORM,表示二进制内容。 |
可用的Type包括:
TYPE | |
---|---|
RAW | |
FREEFORM | |
SEC | |
PEI_CORE | |
DXE_CORE | |
PEIM | |
DRIVER | |
COMBO_PEIM_DRIVER | |
SMM_CORE | |
DXE_SMM_DRIVER | |
APPLICATION | |
FV_IMAGE | |
DISPOSABLE | |
0x00~0xFF |
OVMF.FD
通过分析[FD.OVMF]及[FV.SECFV]可以知道,在生成的OVMF.FD文件中位于文件最后的是ResetVector.inf模块。OVMF.FD可以烧到系统ROM中作为系统固件。前面已经讲过开机时ROM将被映射到0xFFFFFFFF最靠后的内存中。那么第一条指令对应地址0xFFFFFFF0将位于ResetVector.inf模块。
ResetVector.inf内容如下:
1 |
[Defines] |
ResetVector.inf包含了源文件ResetVector.nasmb,内容如下:
1 |
%ifndef ARCH_IA32 |
位于最后的是ResetVectorVtf0.asm,其内容如下:
1 |
BITS 16 |
位于0xFFFFFFF0(fourGigabytes-16)处的是指标resetVector:,从此处开始的第一条有效指令是
jmp EarlyBspInitReal16。
可以通过反汇编OVMF.fd验证,
OVMF.FD最后16字节为
1 |
0x000FFFF0 90 90 E9 AB FF 90 90 90 90 90 90 90 90 90 90 90 |
指令码90对应的指令正是nop,E9 AB FF对应的指令是 jmp FFAB, 跳转到EIP+(FFAB)处执行, E9
AB FF对应的EIP为0x000FFFF2,那么下一条指令的EIP为0x000FFFF5, FFAB是-0x55,
0x000FFFF5 - 0x55 = 0xFFFA0.
0xFFFA0正是EarlyBspInitReal16。编译后的汇编码位于OvmfX64\RELEASE_VS2010x86\X64\OvmfPkg\ResetVector\ResetVector\OUTPUT\ResetVector.lst文件中。
1 |
<1> EarlyBspInitReal16: |
OVMF.FD中偏移0xFFFA0处的地址码为:
1 |
0x00FFFA0 BF 42 50 EB 0B BF 41 50 EB 06 66 89 C4 E9 03 00 |
BF 42 50正是mov di, ‘BP’对应的指令码。
再往后就是CPU软件初始化的过程了。