慣性聚合 高效追蹤和閱讀你感興趣的部落格、新聞、科技資訊
閱讀原文 在慣性聚合中打開

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 科技爱好者周刊(第 390 期):没有语料,大模型就是智障 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 Kimi 的一体化,Manus 的分层 科技爱好者周刊(第 382 期):独立软件的黄昏 AI native Workspace 也许是智能体的下一阶段 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗?
字節序探析:大端與小端的比較
阮一峰 · 2022-06-03 · via 阮一峰的网络日志

今天談談一個重要的計算機概念,大家可能都聽說過它,但是很少深究,那就是字節序(Endianness)。

一、概念

字節序指的是,多字節數據的內存排列順序。這樣說比較抽象,使用圖形解釋就很好懂。

內存好比一排房間,每個字節是一間房。每間房都有門牌號(內存地址),從0號開始,然後是1號、2號......

0號字節的地址小,稱為低位內存;3號字節的地址大,稱為高位內存。

現在有一個數值abcd要放進這些房間,每個房間放一個數字,那麼有兩種放法。

第一種放法是,第一位a放在低位地址(0號),最後一位d放在高位地址(3號)。

這種排列稱為"大端序"(big-endian,簡稱 BE),即大頭在前,因為aabcd的大頭(最重要的數字)。

第二種放法是,第一位a放在高位地址(3號地址),最後一位d放在低位地址(0號地址)。

這種排列稱為"小端序"(little-endian,簡稱 LE),即小頭d在前。

大端序和小端序合稱字節序,這兩個名字來自18世紀的英國小說《格列佛遊記》。某國分成兩派,一派認為雞蛋應該從大頭吃起,稱為"大端派";另一派認為,雞蛋應該從小頭吃起,稱為"小端派"。兩派相執不下,誰也無法說服誰,最後甚至為此交戰。

二、可讀性

對於人類來說,不同字節序的可讀性是不一樣的。大部分國家的閱讀習慣是從左到右閱讀。

大端序的最高位在左邊,最低位在右邊,符合閱讀習慣。所以,對於這些國家的人來說,從左到右的大端序的可讀性更好。

但是現實中,從右到左的小端序雖然可讀性差,但應用更廣泛,x86 和 ARM 這兩種 CPU 架構都採用小端序,這是為什麼?

或者換一種問法,兩種不同的字節序為什麼會並存,統一規定只使用一種,難道不是更方便嗎?

原因是它們有各自的適用場景,某些場景大端序有優勢,另一些場景小端序有優勢,下面就逐一分析。

三、檢查奇偶性

小端序優勢最明顯的,大概就是檢查奇偶性,即通過查看個位數,確定某個數字是奇數還是偶數。

123456為例,大端序從左到右排列,計算機必須一直讀到最後一位的個位數6,才能確定這是偶數。

小端序是從右到左排列,個位數在第一位。所以,只要讀取第一位,就能確定它是偶數。

四、檢查正負號

一個類似的場景是檢查正負號,確定一個數是正數還是負數。

大端序的符號位在左邊第一位,小端序的符號位在右邊最後一位。所以,大端序有優勢,只看第一位就能知道是不是負數。

五、比較大小

下一個操作是比較大小。現在有三個數字,需要比較大小:43662576,594,2。

上圖是大端序排列,因為是從左到右排列,所以三個數字在右邊個位數對齊。比較大小時,計算機就不得不讀取每一個數的所有位,直到個位數,再進行比較。

如果改成小端序,就是下面的排列方式。

小端序是從右到左,所以三個數字在第一位對齊。計算機就不需要讀取所有位,哪個數字先讀不到下一位,就是最小的。比如,2這個數字就沒有第二位,所以讀到第二位時,就知道它是最小的。

所以,比較大小時,小端序有優勢。

六、乘法

接下來,再看乘法操作。

乘法是逐位相乘,每一輪乘法都要向前進位。

上圖是大端序的24165乘以3841。大端序的乘法是向左進位,也就是向左邊擴展,必須等到每一輪的結果都出來(上例是四輪),再相加統一寫入內存。

如果改成小端序的乘法,就不需要等待下一輪的結果,每一輪都可以直接寫入內存。

上圖是小端序的24165乘以3841。小端序的乘法是向右進位,也就是向右邊擴展,左邊的邊界不變。每一輪結果寫入內存後,就不需要移動,後面有變化只需要改動對應的位就行了。

因此,小端序的乘法有明顯優勢。

七、任意精度整數

上一個例子的從低位開始計算的特性,對於任意精度整數特別有用。任意精度整數又稱大整數,可以存放任意大小的整數。

它的內部實現是把整數分成一個個較小的單位,通常是 uint32(無符號32位整數)或 uint64(無符號64位整數),按順序組合在一起。

如果是大端序,第一個 u64 就是這個整數最大的部分。運算時,一旦這個數發生變化,需要進位,後面的所有位都必須移動和改寫。小端序發生進位時,往往就不需要所有位移動。

小端序的另一個好處是,如果逐字節的運算從個位數開始(比如乘法和加法),可以從左到右依次運算一個個 u64,算完上一個再讀取下一個。大端序就不行,必須讀取整個數以後再進行運算。

八、更改類型

最後一個例子是,C 語言有一種 cast 操作,可以強制改變變量的數據類型,比如把32位整數強行改變為16位整數。

上圖中,32位整數0x00000001更改為16位整數0x0001,大端序是截去前面兩個字節,這時指向這個地址的指針必須向後移動兩個字節。

小端序就沒有這個問題,截去的是後面兩個字節,第一位的地址是不變的,所以指針不需要移動。

九、總結

綜上所述,大端序和小端序各自的優勢如下。

如果需要逐位運算,或者需要到從個位數開始運算,都是小端序佔優勢。反之,如果運算只涉及到高位,或者數據的可讀性比較重要,則是大端序佔優勢。

十、參考鏈接

(完)