字節序探析：大端與小端的比較

今天談談一個重要的計算機概念，大家可能都聽說過它，但是很少深究，那就是字節序（Endianness）。

一、概念

字節序指的是，多字節數據的內存排列順序。這樣說比較抽象，使用圖形解釋就很好懂。

內存好比一排房間，每個字節是一間房。每間房都有門牌號（內存地址），從0號開始，然後是1號、2號......

0號字節的地址小，稱為低位內存；3號字節的地址大，稱為高位內存。

現在有一個數值abcd要放進這些房間，每個房間放一個數字，那麼有兩種放法。

第一種放法是，第一位a放在低位地址（0號），最後一位d放在高位地址（3號）。

這種排列稱為"大端序"（big-endian，簡稱 BE），即大頭在前，因為a是abcd的大頭（最重要的數字）。

第二種放法是，第一位a放在高位地址（3號地址），最後一位d放在低位地址（0號地址）。

這種排列稱為"小端序"（little-endian，簡稱 LE），即小頭d在前。

大端序和小端序合稱字節序，這兩個名字來自18世紀的英國小說《格列佛遊記》。某國分成兩派，一派認為雞蛋應該從大頭吃起，稱為"大端派"；另一派認為，雞蛋應該從小頭吃起，稱為"小端派"。兩派相執不下，誰也無法說服誰，最後甚至為此交戰。

二、可讀性

對於人類來說，不同字節序的可讀性是不一樣的。大部分國家的閱讀習慣是從左到右閱讀。

大端序的最高位在左邊，最低位在右邊，符合閱讀習慣。所以，對於這些國家的人來說，從左到右的大端序的可讀性更好。

但是現實中，從右到左的小端序雖然可讀性差，但應用更廣泛，x86 和 ARM 這兩種 CPU 架構都採用小端序，這是為什麼？

或者換一種問法，兩種不同的字節序為什麼會並存，統一規定只使用一種，難道不是更方便嗎？

原因是它們有各自的適用場景，某些場景大端序有優勢，另一些場景小端序有優勢，下面就逐一分析。

三、檢查奇偶性

小端序優勢最明顯的，大概就是檢查奇偶性，即通過查看個位數，確定某個數字是奇數還是偶數。

以123456為例，大端序從左到右排列，計算機必須一直讀到最後一位的個位數6，才能確定這是偶數。

小端序是從右到左排列，個位數在第一位。所以，只要讀取第一位，就能確定它是偶數。

四、檢查正負號

一個類似的場景是檢查正負號，確定一個數是正數還是負數。

大端序的符號位在左邊第一位，小端序的符號位在右邊最後一位。所以，大端序有優勢，只看第一位就能知道是不是負數。

五、比較大小

下一個操作是比較大小。現在有三個數字，需要比較大小：43662576，594，2。

上圖是大端序排列，因為是從左到右排列，所以三個數字在右邊個位數對齊。比較大小時，計算機就不得不讀取每一個數的所有位，直到個位數，再進行比較。

如果改成小端序，就是下面的排列方式。

小端序是從右到左，所以三個數字在第一位對齊。計算機就不需要讀取所有位，哪個數字先讀不到下一位，就是最小的。比如，2這個數字就沒有第二位，所以讀到第二位時，就知道它是最小的。

所以，比較大小時，小端序有優勢。

六、乘法

接下來，再看乘法操作。

乘法是逐位相乘，每一輪乘法都要向前進位。

上圖是大端序的24165乘以3841。大端序的乘法是向左進位，也就是向左邊擴展，必須等到每一輪的結果都出來（上例是四輪），再相加統一寫入內存。

如果改成小端序的乘法，就不需要等待下一輪的結果，每一輪都可以直接寫入內存。

上圖是小端序的24165乘以3841。小端序的乘法是向右進位，也就是向右邊擴展，左邊的邊界不變。每一輪結果寫入內存後，就不需要移動，後面有變化只需要改動對應的位就行了。

因此，小端序的乘法有明顯優勢。

七、任意精度整數

上一個例子的從低位開始計算的特性，對於任意精度整數特別有用。任意精度整數又稱大整數，可以存放任意大小的整數。

它的內部實現是把整數分成一個個較小的單位，通常是 uint32（無符號32位整數）或 uint64（無符號64位整數），按順序組合在一起。

如果是大端序，第一個 u64 就是這個整數最大的部分。運算時，一旦這個數發生變化，需要進位，後面的所有位都必須移動和改寫。小端序發生進位時，往往就不需要所有位移動。

小端序的另一個好處是，如果逐字節的運算從個位數開始（比如乘法和加法），可以從左到右依次運算一個個 u64，算完上一個再讀取下一個。大端序就不行，必須讀取整個數以後再進行運算。

八、更改類型

最後一個例子是，C 語言有一種 cast 操作，可以強制改變變量的數據類型，比如把32位整數強行改變為16位整數。

上圖中，32位整數0x00000001更改為16位整數0x0001，大端序是截去前面兩個字節，這時指向這個地址的指針必須向後移動兩個字節。

小端序就沒有這個問題，截去的是後面兩個字節，第一位的地址是不變的，所以指針不需要移動。

九、總結

綜上所述，大端序和小端序各自的優勢如下。

如果需要逐位運算，或者需要到從個位數開始運算，都是小端序佔優勢。反之，如果運算只涉及到高位，或者數據的可讀性比較重要，則是大端序佔優勢。

十、參考鏈接

On Endianness, Karl Stenerud

（完）

推薦訂閱源

阮一峰的网络日志