慣性聚合 高效追蹤和閱讀你感興趣的部落格、新聞、科技資訊
閱讀原文 在慣性聚合中打開

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 Kimi 的一体化,Manus 的分层 科技爱好者周刊(第 382 期):独立软件的黄昏 AI native Workspace 也许是智能体的下一阶段 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗? 科技爱好者周刊(第 360 期):Dan Wang 的新书
科技愛好者週刊(第 390 期):沒有語料,大模型就是智障
阮一峰 · 2026-03-27 · via 阮一峰的网络日志

這裡記錄每週值得分享的科技內容,週五發佈。

本雜誌開源,歡迎投稿。另有《誰在招人》服務,發佈程序員招聘信息。合作請郵件聯繫[email protected])。

封面圖

山東日照某住宅小區的彩色風雨連廊,入口處樹林還設了咖啡館。(via

沒有語料,大模型就是智障

如果現在做一個問卷調查,問大家"你覺得大模型是否具有智能?"

我相信,大多數人會是肯定的回答。

哪怕現在只是 AI 的初級階段,大模型已經能夠替代很多的人類智力勞動,確實非常神奇。

但是,我們不要忘記真實情況,大模型不是魔法,更不是具有自主智能的"硅基智能體",而是基於統計規律的語言模型,它的一切行為都基於數學計算。

最好的證據就是,如果讓它解決沒有訓練過的題目,也就是不存在統計規律的話,它根本解不出來。

這就是我今天想分享的一個實驗

兩位國外的研究者找了五個主流的大模型:GPT-5.2、O4-mini、Gemini 3 Pro、Qwen3-235B、Kimi K2。

他們讓大模型使用五種小眾的編程語言----Brainfuck、Befunge-98、Whitespace、Unlambda 和 Shakespeare----來編程解決各種問題。

這些小眾語言的共同特徵是,網上很少有它們的資料,因此不能用來訓練大模型。大家猜猜看,結果怎麼樣?

實驗結果用一句話總結,就是大模型的表現一塌糊塗。

這五個大模型的平均答題正確率僅為3.8%,即100道題可以答對3.8道。相比之下,它們處理 Python 問題的正確率可以達到90%。

更尷尬的是,僅有的那幾道答對的題目,都是入門級。更難的級別(初級、中級、高級),所有五個大模型的正確率都為0。

這個實驗充分說明了,大模型的表現(智能程度)首先由訓練材料決定:訓練的語料越多,表現越好,比如 Python 的語料遍地都是,大模型因此極其擅長解決 Python 問題;訓練的語料越少,大模型表現就越差,簡直跟智障一樣,沒什麼用處。

那麼,一個讓人好奇的問題就來了:如果某種冷門語言沒有語料,但有一本很詳盡的《使用手冊》,我們讓大模型學習這本手冊,它是否就能學會這種冷門語言編程呢?

MAI-Image-2

本週,微軟公司發佈了自家的圖像生成模型 MAI-Image-2

這個模型生成的圖像質量非常高,有評論認為,目前僅次於谷歌的 nano-banana-2。

微軟開放了網站 MAI Playground(下圖),現在可以免費生成圖片。

我試用後,圖像質感確實很好,非常逼真。比如,一隻狗在海里騎自行車。

但是,它的使用限制很多:(1)有爭議的、可能冒犯的圖片,都會拒絕生成;(2)每天的免費額度是15張,每次生成的間隔時間是30秒;(3)它只能生成長寬比 1:1 的圖片,其他分辨率都不支持;(4)不提供圖像編輯和加工,只能用來"文生圖"。

如果你需要通過文本生成高質量圖片,可以試試它。

科技動態

1、可玩的封面

紅牛公司推出了一本紙質的遊戲雜誌《GamePop》。

它的封面有一個可以玩的"俄羅斯方塊",是世界首本封面可以玩遊戲的書。

奧秘就是封面裡面,嵌入了一塊非常薄的柔性電路板。

這塊板配備了180個 RGB LED 燈、7個電容式觸摸按鈕、一顆32位 ARM 芯片。

它還包含一塊可充電電池,可以通過 Type C 充電。

可惜的是,這個封面是限量版,不公開出售。它得到了俄羅斯方塊公司的官方授權,全球僅發行150套,每套均有獨立編號。

2、收費的真人客服

企業都不喜歡提供真人的電話客服,因為成本很高,更希望改成機器應答的電話客服。

惠普公司想出了一個點子,將用戶往機器客服趕。

用戶打惠普的客服電話,會聽到一段語音提示,要你訪問官網自己去尋找答案。如果你堅持要真人客服,就要在線等待15分鐘。

如果中途掛了電話,再打就需要重新等待15分鐘。系統還會分別在第5、第10和第13分鐘提醒你,可以訪問網站或發郵件聯繫。

雖然這種做法很可惡,但未來可能成為常態:免費就只有 AI 客服或機器人客服,額外付費才有真人客服。

3、飛盤的玩法

怎樣扔飛盤,才能又快又遠?

一個美國的物理學家,找了幾十個學生進行實驗,使用不同手勢和角度扔出飛盤。他測量了飛行速度和扭矩,把結果寫成了論文。

他發現,將拇指放置在距飛盤外緣約3釐米的位置,可以獲得平均轉速和初始速度的最佳結果。

他還發現,轉速與初始速度存在線性相關,轉速越高,初始速度也越高。

所以,下次玩飛盤的時候,你要放對拇指的位置,然後用足力氣,反手甩出,就可以取得最佳結果。

文章

1、MkDocs 的緩慢崩潰(英文)

MkDocs 是著名的文檔網站生成工具,但是主要貢獻者之間有激烈矛盾,互相對抗,導致這個項目四分五裂。本文就梳理這件事。

2、大模型預測咖啡散熱(英文)

作者讓各種大模型給出咖啡散熱時間的公式,然後測量了實際的散熱時間,得到了一個排行榜。

3、下一個 App 很可能是無頭應用(英文)

如果我們未來都通過 AI 助手使用手機,那麼各種 App 就不需要顯示模塊了(無頭),只需向 AI 助手提供數據接口。

4、網頁前端數據壓縮的一種方法(英文)

本文介紹如何在前端,通過 canvas(畫布)將數據壓縮成一張圖片。

5、Ruby 是構建 AI 應用的最佳語言(英文)

作者使用 Python、JavaScript、Ruby 三種語言寫一個 AI Agent,比較後認為 Ruby 寫 AI 應用最方便。

6、古羅馬的混凝土建築(英文)

古羅馬人發現了混凝土,學會了用它澆築建築物。結果就是,古羅馬建築有古代最大的室內面積,並且非常堅固,保留到了今天。

工具

1、proxychains-rs

proxychains4 的 Rust 實現,指定某個進程走代理鏈。(@tianrking 投稿)

2、Flare Stack Blog

一個基於 Cloudflare Worker 的博客系統,集成 D1、R2、KV、Workflow 等服務。(@du2333 投稿)

3、Tunelo

一行命令將本地服務暴露到公網,只需要單個 4MB 二進制文件,使用 QUIC 協議。(@jiweiyuan 投稿)

4、ReadAny

桌面端 + 安卓端的電子書閱讀工具,自帶 AI 功能、語音朗讀和多端同步。(@codedogQBY 投稿)

5、RaTeX

純 Rust 實現的 KaTeX 兼容的數學渲染引擎,原生解析、排版 LaTeX 數學公式,支持各種環境。(@erweixin 投稿)

6、Work Review

開源的 Win/Mac 桌面應用,在後臺持續記錄當天使用過的應用、訪問過的網站等,便於整理成個人的工作軌跡。(@wm94i 投稿)

7、Valdi

SnapChat 發佈的 UI 框架,可以用類似 React 的語法編寫組件,然後編譯成 iOS、Android 和 macOS 的原生應用。

8、Npflared

架設私有 NPM 鏡像的工具,適合企業用來提供內部的 JS 軟件包。

9、Chokidar

一個 Node.js 模塊,用來監聽文件系統的各種事件(新增、刪除、編輯等),比原生的 fs.watch / fs.watchFile 功能強。

AI 相關

1、微信的龍蝦接口

微信官方本週發佈了龍蝦接口,AI 機器人可以向微信發消息了。

很多項目利用這個接口做二次開發,便於各種 Bot 和 Agent 網關的接入。

2、AI CLI Complete Notify

跨平臺桌面應用,AI 命令行任務(Claude code/Codex/Gemini)完成後,發出任務完成提醒,支持各種渠道(飛書/釘釘/企微 Webhook、Telegram、郵件、桌面/聲音提示)。(@ZekerTop 投稿)

3、Claude Config Manager

macOS 的 Claude 資源(Skills、MCP、Agent)桌面管理工具,提供一個圖形化的中央控制台。(@Daydayoneup 投稿)

4、TrustClaw

龍蝦 OpenClaw 的修改版,儘量消除代碼的風險點。

資源

1、Project N.O.M.A.D.

一個 Linux 應用,集成了各種人類知識(維基百科、全球地圖、在線課程、本地 AI 助手)等等,用於在斷網時查閱。(@15x3 投稿)

2、用於數據分析的 AI Coding Agent(英文)

著名開發者 Simon Willison 的培訓班講課資料,通過 AI 工具進行數據分析,有詳細步驟。

3、TypeScript 簡潔之書

一本開源的 TypeScript 教程,有中文版。

圖片

1、蘋果壁紙彩蛋

蘋果公司最近發佈了新筆記本 MacBook Neo,跟以前一樣,配一張特別的壁紙。

壁紙裡面嵌入了產品名,以前的壁紙也有這個彩蛋。

iMac

MacBook Pro

iPad Air

MacBook Air

iPad Mini

iPad Pro

1、兒童死亡率

現代人很難想象的是,人類歷史的大部分時間裡,兒童死亡率(在成年前死亡)一直接近50%。

上圖中,紅線就是嬰兒死亡率,一直穩定在50%左右。直到19世紀後期,才開始快速下降。

2020年,全球平均嬰兒死亡率是4.3%,最低的國家已經達到了0.3%。

文摘

1、別變成機器

我最近看到一句話:"只有奴隸才通過生產力來量化自身的存在價值。"

是啊,生產力越高,奴隸越有價值。

這讓我想到,如今的社交媒體上充斥著大量的奮鬥文化,許多人展示自己是多麼努力在提高個人生產力。

在我看來,這就是將自己跟機器做比較。大家認定,如果能像機器一樣,接收指令並高效地完成某個目標,自己就越有價值,就能取得人生成功。

社交媒體上,這種"奮鬥文化"有很多表現形式:(1)你還不夠努力。(2)你得早上五點起床。(3)你得第一個到,最後一個走。

這種文化的背後,就是要求人變成機器

機器確實很高效,但有一個問題:它是剛性的,以既定的模式和線性速度運轉,無法自動適應環境變化,也無法學習遊戲規則。

你不是機器,你是人。你的特點應該是靈活應變,快速適應。你不要追求極致的努力,而是要找到最有價值的解決方案。你要專注於真正重要的因素:速度、效率或質量,不要迷戀枯燥乏味的工作。

言論

1、

我們創造了一個文明,其中最重要的元素都深深地依賴於科學技術,但是我們還讓科學技術變得如此難懂。這會帶來災難,我們可能暫時僥倖逃脫,但遲早,這種無知和權力的易燃混合物會爆炸。

-- 卡爾·薩根

2、

巴黎以前總是堵車,市長想出一個辦法,大幅減少停車位,後來果然少有人開車了。

-- CNN

3、

一項研究發現,遠程教學下,外形出眾學生的作業成績,要比面對面教學時更低。

-- 《經濟學快報》

4、

這些年對我影響最大的事情,就是我變成了一個"白天型"的人。

我以前經常熬夜,有時會到天亮。最近五年,我強迫自己養成早起的習慣。現在,我的生活都在白天,親眼看到黎明和黃昏,讓我感到心安,生命與自然循環和諧一致。

-- 《成為一個白天生活的人》

5、

AI 很擅長將清晰的想法轉化為可運行的代碼。真正耗時的是弄清楚我到底想開發什麼。

-- lustin.fr

往年回顧

如何阻止 AI 爬蟲(#343)

一週是一年的2%(#293)

與孔子 AI 聊天(#243)

前端與後端,誰更難?(#193)

(完)