科技愛好者週刊（第 390 期）：沒有語料，大模型就是智障

這裡記錄每週值得分享的科技內容，週五發佈。

本雜誌開源，歡迎投稿。另有《誰在招人》服務，發佈程序員招聘信息。合作請郵件聯繫（[email protected]）。

封面圖

山東日照某住宅小區的彩色風雨連廊，入口處樹林還設了咖啡館。（via）

沒有語料，大模型就是智障

如果現在做一個問卷調查，問大家"你覺得大模型是否具有智能？"

我相信，大多數人會是肯定的回答。

哪怕現在只是 AI 的初級階段，大模型已經能夠替代很多的人類智力勞動，確實非常神奇。

但是，我們不要忘記真實情況，大模型不是魔法，更不是具有自主智能的"硅基智能體"，而是基於統計規律的語言模型，它的一切行為都基於數學計算。

最好的證據就是，如果讓它解決沒有訓練過的題目，也就是不存在統計規律的話，它根本解不出來。

這就是我今天想分享的一個實驗。

兩位國外的研究者找了五個主流的大模型：GPT-5.2、O4-mini、Gemini 3 Pro、Qwen3-235B、Kimi K2。

他們讓大模型使用五種小眾的編程語言----Brainfuck、Befunge-98、Whitespace、Unlambda 和 Shakespeare----來編程解決各種問題。

這些小眾語言的共同特徵是，網上很少有它們的資料，因此不能用來訓練大模型。大家猜猜看，結果怎麼樣？

實驗結果用一句話總結，就是大模型的表現一塌糊塗。

這五個大模型的平均答題正確率僅為3.8%，即100道題可以答對3.8道。相比之下，它們處理 Python 問題的正確率可以達到90%。

更尷尬的是，僅有的那幾道答對的題目，都是入門級。更難的級別（初級、中級、高級），所有五個大模型的正確率都為0。

這個實驗充分說明了，大模型的表現（智能程度）首先由訓練材料決定：訓練的語料越多，表現越好，比如 Python 的語料遍地都是，大模型因此極其擅長解決 Python 問題；訓練的語料越少，大模型表現就越差，簡直跟智障一樣，沒什麼用處。

那麼，一個讓人好奇的問題就來了：如果某種冷門語言沒有語料，但有一本很詳盡的《使用手冊》，我們讓大模型學習這本手冊，它是否就能學會這種冷門語言編程呢？

MAI-Image-2

本週，微軟公司發佈了自家的圖像生成模型 MAI-Image-2。

這個模型生成的圖像質量非常高，有評論認為，目前僅次於谷歌的 nano-banana-2。

微軟開放了網站 MAI Playground（下圖），現在可以免費生成圖片。

我試用後，圖像質感確實很好，非常逼真。比如，一隻狗在海里騎自行車。

但是，它的使用限制很多：（1）有爭議的、可能冒犯的圖片，都會拒絕生成；（2）每天的免費額度是15張，每次生成的間隔時間是30秒；（3）它只能生成長寬比 1:1 的圖片，其他分辨率都不支持；（4）不提供圖像編輯和加工，只能用來"文生圖"。

如果你需要通過文本生成高質量圖片，可以試試它。

科技動態

1、可玩的封面

紅牛公司推出了一本紙質的遊戲雜誌《GamePop》。

它的封面有一個可以玩的"俄羅斯方塊"，是世界首本封面可以玩遊戲的書。

奧秘就是封面裡面，嵌入了一塊非常薄的柔性電路板。

這塊板配備了180個 RGB LED 燈、7個電容式觸摸按鈕、一顆32位 ARM 芯片。

它還包含一塊可充電電池，可以通過 Type C 充電。

可惜的是，這個封面是限量版，不公開出售。它得到了俄羅斯方塊公司的官方授權，全球僅發行150套，每套均有獨立編號。

2、收費的真人客服

企業都不喜歡提供真人的電話客服，因為成本很高，更希望改成機器應答的電話客服。

惠普公司想出了一個點子，將用戶往機器客服趕。

用戶打惠普的客服電話，會聽到一段語音提示，要你訪問官網自己去尋找答案。如果你堅持要真人客服，就要在線等待15分鐘。

如果中途掛了電話，再打就需要重新等待15分鐘。系統還會分別在第5、第10和第13分鐘提醒你，可以訪問網站或發郵件聯繫。

雖然這種做法很可惡，但未來可能成為常態：免費就只有 AI 客服或機器人客服，額外付費才有真人客服。

3、飛盤的玩法

怎樣扔飛盤，才能又快又遠？

一個美國的物理學家，找了幾十個學生進行實驗，使用不同手勢和角度扔出飛盤。他測量了飛行速度和扭矩，把結果寫成了論文。

他發現，將拇指放置在距飛盤外緣約3釐米的位置，可以獲得平均轉速和初始速度的最佳結果。

他還發現，轉速與初始速度存在線性相關，轉速越高，初始速度也越高。

所以，下次玩飛盤的時候，你要放對拇指的位置，然後用足力氣，反手甩出，就可以取得最佳結果。

文章

1、MkDocs 的緩慢崩潰（英文）

MkDocs 是著名的文檔網站生成工具，但是主要貢獻者之間有激烈矛盾，互相對抗，導致這個項目四分五裂。本文就梳理這件事。

2、大模型預測咖啡散熱（英文）

作者讓各種大模型給出咖啡散熱時間的公式，然後測量了實際的散熱時間，得到了一個排行榜。

3、下一個 App 很可能是無頭應用（英文）

如果我們未來都通過 AI 助手使用手機，那麼各種 App 就不需要顯示模塊了（無頭），只需向 AI 助手提供數據接口。

4、網頁前端數據壓縮的一種方法（英文）

本文介紹如何在前端，通過 canvas（畫布）將數據壓縮成一張圖片。

5、Ruby 是構建 AI 應用的最佳語言（英文）

作者使用 Python、JavaScript、Ruby 三種語言寫一個 AI Agent，比較後認為 Ruby 寫 AI 應用最方便。

6、古羅馬的混凝土建築（英文）

古羅馬人發現了混凝土，學會了用它澆築建築物。結果就是，古羅馬建築有古代最大的室內面積，並且非常堅固，保留到了今天。

工具

1、proxychains-rs

proxychains4 的 Rust 實現，指定某個進程走代理鏈。（@tianrking 投稿）

2、Flare Stack Blog

一個基於 Cloudflare Worker 的博客系統，集成 D1、R2、KV、Workflow 等服務。（@du2333 投稿）

3、Tunelo

一行命令將本地服務暴露到公網，只需要單個 4MB 二進制文件，使用 QUIC 協議。（@jiweiyuan 投稿）

4、ReadAny

桌面端 + 安卓端的電子書閱讀工具，自帶 AI 功能、語音朗讀和多端同步。（@codedogQBY 投稿）

5、RaTeX

純 Rust 實現的 KaTeX 兼容的數學渲染引擎，原生解析、排版 LaTeX 數學公式，支持各種環境。（@erweixin 投稿）

6、Work Review

開源的 Win/Mac 桌面應用，在後臺持續記錄當天使用過的應用、訪問過的網站等，便於整理成個人的工作軌跡。（@wm94i 投稿）

7、Valdi

SnapChat 發佈的 UI 框架，可以用類似 React 的語法編寫組件，然後編譯成 iOS、Android 和 macOS 的原生應用。

8、Npflared

架設私有 NPM 鏡像的工具，適合企業用來提供內部的 JS 軟件包。

9、Chokidar

一個 Node.js 模塊，用來監聽文件系統的各種事件（新增、刪除、編輯等），比原生的 fs.watch / fs.watchFile 功能強。

AI 相關

1、微信的龍蝦接口

微信官方本週發佈了龍蝦接口，AI 機器人可以向微信發消息了。

很多項目利用這個接口做二次開發，便於各種 Bot 和 Agent 網關的接入。

wechat-rs-sdk（@tianrking 投稿）
WeChatBot（@jiweiyuan 投稿）
WeClaw（@idoubi 投稿）
WeChat-Channel（@nanbingxyz 投稿）

2、AI CLI Complete Notify

跨平臺桌面應用，AI 命令行任務（Claude code/Codex/Gemini）完成後，發出任務完成提醒，支持各種渠道（飛書/釘釘/企微 Webhook、Telegram、郵件、桌面/聲音提示）。（@ZekerTop 投稿）

3、Claude Config Manager

macOS 的 Claude 資源（Skills、MCP、Agent）桌面管理工具，提供一個圖形化的中央控制台。（@Daydayoneup 投稿）

4、TrustClaw

龍蝦 OpenClaw 的修改版，儘量消除代碼的風險點。

資源

1、Project N.O.M.A.D.

一個 Linux 應用，集成了各種人類知識（維基百科、全球地圖、在線課程、本地 AI 助手）等等，用於在斷網時查閱。（@15x3 投稿）

2、用於數據分析的 AI Coding Agent（英文）

著名開發者 Simon Willison 的培訓班講課資料，通過 AI 工具進行數據分析，有詳細步驟。

3、TypeScript 簡潔之書

一本開源的 TypeScript 教程，有中文版。

圖片

1、蘋果壁紙彩蛋

蘋果公司最近發佈了新筆記本 MacBook Neo，跟以前一樣，配一張特別的壁紙。

壁紙裡面嵌入了產品名，以前的壁紙也有這個彩蛋。

iMac

MacBook Pro

iPad Air

MacBook Air

iPad Mini

iPad Pro

1、兒童死亡率

現代人很難想象的是，人類歷史的大部分時間裡，兒童死亡率（在成年前死亡）一直接近50%。

上圖中，紅線就是嬰兒死亡率，一直穩定在50%左右。直到19世紀後期，才開始快速下降。

2020年，全球平均嬰兒死亡率是4.3%，最低的國家已經達到了0.3%。

文摘

1、別變成機器

我最近看到一句話："只有奴隸才通過生產力來量化自身的存在價值。"

是啊，生產力越高，奴隸越有價值。

這讓我想到，如今的社交媒體上充斥著大量的奮鬥文化，許多人展示自己是多麼努力在提高個人生產力。

在我看來，這就是將自己跟機器做比較。大家認定，如果能像機器一樣，接收指令並高效地完成某個目標，自己就越有價值，就能取得人生成功。

社交媒體上，這種"奮鬥文化"有很多表現形式：（1）你還不夠努力。（2）你得早上五點起床。（3）你得第一個到，最後一個走。

這種文化的背後，就是要求人變成機器。

機器確實很高效，但有一個問題：它是剛性的，以既定的模式和線性速度運轉，無法自動適應環境變化，也無法學習遊戲規則。

你不是機器，你是人。你的特點應該是靈活應變，快速適應。你不要追求極致的努力，而是要找到最有價值的解決方案。你要專注於真正重要的因素：速度、效率或質量，不要迷戀枯燥乏味的工作。

言論

1、

我們創造了一個文明，其中最重要的元素都深深地依賴於科學技術，但是我們還讓科學技術變得如此難懂。這會帶來災難，我們可能暫時僥倖逃脫，但遲早，這種無知和權力的易燃混合物會爆炸。

-- 卡爾·薩根

2、

巴黎以前總是堵車，市長想出一個辦法，大幅減少停車位，後來果然少有人開車了。

-- CNN

3、

一項研究發現，遠程教學下，外形出眾學生的作業成績，要比面對面教學時更低。

-- 《經濟學快報》

4、

這些年對我影響最大的事情，就是我變成了一個"白天型"的人。

我以前經常熬夜，有時會到天亮。最近五年，我強迫自己養成早起的習慣。現在，我的生活都在白天，親眼看到黎明和黃昏，讓我感到心安，生命與自然循環和諧一致。

-- 《成為一個白天生活的人》

5、

AI 很擅長將清晰的想法轉化為可運行的代碼。真正耗時的是弄清楚我到底想開發什麼。

-- lustin.fr

往年回顧

如何阻止 AI 爬蟲（#343）

一週是一年的2%（#293）

與孔子 AI 聊天（#243）

前端與後端，誰更難？（#193）

（完）

推薦訂閱源

阮一峰的网络日志

封面圖