一文了解Linux系統(tǒng)啟動(dòng)過程中的幾個(gè)神秘地址
0xFFFF:0x0000
0xF000:0xE05B
0x0000:0x7C00
在第一篇文章中,我們就提到,現(xiàn)代操作系統(tǒng)是從最古老的 8086 系統(tǒng)一步一步發(fā)展而來的。
處理器廠商為了向后兼容,很多底層相關(guān)的原理都是一樣的(如果不兼容,就會(huì)丟棄市場(chǎng)份額)。
特別是從系統(tǒng)上電之后,一直到操作系統(tǒng)中第一個(gè)進(jìn)程(Linux 下就是 init 進(jìn)程)運(yùn)行起來,這其中經(jīng)歷了 BIOS、引導(dǎo)程序、操作系統(tǒng)這三元大將的接力跑。
今天,我們從幾個(gè)特殊的地址的角度,來從宏觀節(jié)點(diǎn)上看一下系統(tǒng)的啟動(dòng)過程。
0xFFFF:0x0000
這個(gè)地址,是處理器上電之后的第一個(gè)重要的物理地址。
從地址的書寫形式上,就可以看出這是 8086 系統(tǒng)中實(shí)模式下的段尋址方式:段地址 * 16 + 偏移量。
段地址:0xFFFF
偏移地址:0x0000
計(jì)算得到物理地址:0xFFFF0
當(dāng)處理器的 reset 引腳被觸發(fā)后,處理器首先進(jìn)行硬件初始化,也就是把處理器內(nèi)部的每個(gè)寄存器都設(shè)置為一個(gè)初始的默認(rèn)狀態(tài):
把段寄存器 cs 設(shè)置為 0xFFFF,指令寄存器 ip 設(shè)置為 0x0000;
把其它的所有寄存器設(shè)置為 0x0000;
當(dāng)所有的初始化完成之后,CPU 就開始執(zhí)行第一條指令。
之前說過,CPU 是很傻、很單純的,它只知道去 cs:ip 所指向的地址處,取出一條指令,執(zhí)行完之后,再取出下一條指令繼續(xù)執(zhí)行。。。
每一條指令的第一個(gè)字節(jié)都是操作碼,CPU 根據(jù)操作碼,能夠知道當(dāng)前指令的字節(jié)長(zhǎng)度,并把 ip 寄存器指向下一條指令。
既然硬件初始化時(shí),已經(jīng)把 cs 初始化為 0xFFFF,把 ip 初始化為 0x0000,經(jīng)過段尋址的公式計(jì)算之后,就得到了物理地址:0xFFFF0,也就是說,CPU 執(zhí)行的第一條指令位于物理地址 0xFFFF0 這個(gè)地方。
那么,這個(gè)物理地址中,存放著什么指令呢?
首先來復(fù)習(xí)一下地址范圍的相關(guān)知識(shí):
8086 處理器有 20 根地址線,尋址范圍是:0x00000 ~ 0xFFFFF,最大就是 1 MB。
但是 8086 的處理器是 16 位的,寄存器最大表示的范圍是 0xFFFF,也就是 64 KB。
采用【段基址:偏移量】來表示一個(gè)段時(shí),這個(gè)段的最大偏移范圍就是 64 KB。
我們?cè)倩氐较到y(tǒng)的啟動(dòng)流程。
在上電之后,硬件會(huì)把一個(gè) ROM 芯片,映射到內(nèi)存地址空間的最高地址空間,也即是 1 MB 的位置,如圖:
ROM 芯片中存放的就是 BIOS 代碼,稱作:基本輸入輸出系統(tǒng)(Basic Input/Output System)。
此時(shí),cs:ip 計(jì)算得到的物理地址為 0xFFFF0,正好落在映射到 ROM 的這塊內(nèi)存空間。
因此,從這個(gè)地址中獲取到指令,其實(shí)就是從 ROM 中讀取的。
所謂的映射:就是訪問某個(gè)地址空間中的內(nèi)容時(shí),就會(huì)自動(dòng)定位到被映射的目標(biāo)物理設(shè)備中進(jìn)行訪問,這是由硬件來保證的。
CPU 在執(zhí)行指令的時(shí)候,ip 寄存器是遞增的,也就是說會(huì)從低地址到高地址,依次執(zhí)行每一條指令。
但是此時(shí)第一條指令的地址就是 0xFFFF0,已經(jīng)快接近 1 MB 地址空間的頂端了,只有 16 個(gè)字節(jié)的地址空間。
如果執(zhí)行到頂端,溢出之后,就會(huì)回繞到最低地址 0x00000。
因此,在這個(gè)第一條指令的位置處,是一條跳轉(zhuǎn)指令:
跳轉(zhuǎn)目標(biāo)是 0xF000:0xE05B,計(jì)算得到物理地址 0xFE05B,可以看到同樣是落在映射到 ROM 的地址空間中(好像是廢話:此時(shí)只能執(zhí)行 BIOS 中的代碼)。
0xF000:0xE05B
這個(gè)地址處的代碼,才是 BIOS 真正開始執(zhí)行的地方。BIOS 所做的事情包括:
偵測(cè)硬件設(shè)備:系統(tǒng)中有哪些硬件設(shè)備,工作狀態(tài)是什么;
對(duì)硬件設(shè)備進(jìn)行初始化:比如最初始的中斷向量表;
偵測(cè)操作系統(tǒng)啟動(dòng)設(shè)備:選擇好一個(gè)系統(tǒng)盤之后,把系統(tǒng)盤中主引導(dǎo)扇區(qū)中的引導(dǎo)程序讀取到內(nèi)存中;
在 BIOS 的最后一個(gè)步驟中,它把引導(dǎo)程序讀取到內(nèi)存中 0x0000:0x7C00 地址處,計(jì)算得到物理地址就是:0x07C00。
這個(gè)地址的內(nèi)存空間,被硬件映射到 RAM 芯片中。
具體的說就是,硬件把內(nèi)存空間 0x00000 ~ 0x9FFFF 映射到隨機(jī)存儲(chǔ)器中,一共是 640 KB 的空間。
注意:雖然地址空間有 640 KB 這么大,但是實(shí)際的 RAM 大小可能只有可憐的 32 KB,因此實(shí)際可用的空間取決于物理芯片。
中間空著的那塊地址空間,映射到一些外設(shè)。
0x0000:0x7C00
這個(gè)地址,就是操作系統(tǒng)的引導(dǎo)代碼被讀取到內(nèi)存中的地方。
在內(nèi)存地址的剛開始位置(0x00000~0x003FF),存放著中斷向量表。
可以看到:操作系統(tǒng)引導(dǎo)代碼并沒有從中斷向量表之后的 0x00400 開始存放,而是被放在了 0x07C00 這個(gè)地方:
至于為什么要這么放置,有很多的說法,比較靠譜的解釋是這樣的:
假如實(shí)際的 RAM 芯片只有 32 KB(不要用現(xiàn)代的眼光來看,在 N久 之前,RAM 還是非常的珍貴),那么內(nèi)存布局就是這樣:
在此也鄙視一下現(xiàn)在很多的應(yīng)用軟件,動(dòng)不動(dòng)就占用那么多的內(nèi)存,都以為整個(gè)電腦只為它一家軟件服務(wù)的?!
可以看到,引導(dǎo)代碼幾乎位于 RAM 的頂端了,這樣的話,從中斷向量開始的 0x00400,一直到引導(dǎo)代碼的 0x07C00,這塊地址空間就是連續(xù)的一整塊,可以被操作系統(tǒng)更方便的操作。
另外,把引導(dǎo)代碼放在 RAM 的高地址處,還有一個(gè)好處:
當(dāng)引導(dǎo)代碼最終把接力棒交給操作系統(tǒng)之后,引導(dǎo)代碼就沒有任何用處了。
因此,操作系統(tǒng)就可以直接把引導(dǎo)代碼所在的地址空間中內(nèi)容,全部抹掉,為自己所用!

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?