惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
L
LINUX DO - 最新话题
Help Net Security
Help Net Security
The Last Watchdog
The Last Watchdog
Attack and Defense Labs
Attack and Defense Labs
www.infosecurity-magazine.com
www.infosecurity-magazine.com
PCI Perspectives
PCI Perspectives
NISL@THU
NISL@THU
L
LINUX DO - 热门话题
K
Kaspersky official blog
P
Privacy International News Feed
Cloudbric
Cloudbric
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
CERT Recently Published Vulnerability Notes
A
Arctic Wolf
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
The GitHub Blog
The GitHub Blog
Blog — PlanetScale
Blog — PlanetScale
Security Archives - TechRepublic
Security Archives - TechRepublic
博客园 - Franky
博客园_首页
S
SegmentFault 最新的问题
小众软件
小众软件
G
Google Developers Blog
B
Blog
Last Week in AI
Last Week in AI
人人都是产品经理
人人都是产品经理
Project Zero
Project Zero
I
Intezer
L
Lohrmann on Cybersecurity
T
Threat Research - Cisco Blogs
V2EX - 技术
V2EX - 技术
Schneier on Security
Schneier on Security
Forbes - Security
Forbes - Security
T
Tenable Blog
T
The Blog of Author Tim Ferriss
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
M
MIT News - Artificial intelligence
量子位
The Hacker News
The Hacker News
C
Cisco Blogs
G
GRAHAM CLULEY
AWS News Blog
AWS News Blog
P
Privacy & Cybersecurity Law Blog
T
Troy Hunt's Blog
Hacker News: Ask HN
Hacker News: Ask HN
Recorded Future
Recorded Future
MyScale Blog
MyScale Blog
V
Visual Studio Blog
爱范儿
爱范儿

News Hacker | 极客洞察

Rockstar GTA 6 团队组工会:薪酬透明、灵活工时、反 crunch 古罗马公寓:日常、城市规划与沉浸式体验 AI时代的专家价值:验证、经验与大学角色 Chad Whitacre 退 tech 转离线:Home Depot、印刷杂志、东正教社区 本地 Git remote:共享、隔离与 GitHub 误解 AI只该做琐事,别替代人情与创作 AISlop:检测 AI 生成代码坏味道的多语言 CLI 英国低价值采购系统:每月零申报的官僚负担 郁金香狂热:泡沫神话与理性争议 用 LLM 写代码,也要让人比模型更累 AI会重演前端“失去的十年”吗? AI 编程提产却压缩思考,工程质量与协作承压 Cloudflare 多 agent AI 代码评审引发成本与流程争议 500K AI电影“戛纳首映”被质疑只是公关噱头 8×H200跑2B模型到3k tok/s,“标准GPU”标题引争议 防水夹克演化:材料回潮、帽兜变迁与AI争议 意大利人与荷兰人教学时共享手势本能 Claude Code 隐藏配置考古:文档滞后、版本易碎与自动执行争议 大众汽车用 client assertion 阻断 Home Assistant 接入 Zot 支持 Claude Opus 4.8,评论聚焦 Claude Code 计费与 harness 神秘 Hy3 LLM 在 OpenRouter 霸榜:便宜、刷量与隐私争议 佛州 Blue Origin New Glenn 静态点火爆炸,堪比 N1 联网汽车监控升级:数据售卖、监管失灵与断网自保 Blue Origin New Glenn静态点火爆炸,发射台损毁恐延一年 住宅建造为何难规模化:地段、法规、偏好与收入 十种基础云:观云分类、光学现象与云计算误会 据称被 Shopify 收购后,Garnix 关停并开源 Bot Company疑借Airbnb私测家务机器人,致房屋受损 Coalton:Common Lisp 上的静态类型 Lisp,讨论集中在上手与类型建模 ktx:面向 data agents 的开源可执行上下文层,自动生成语义层与业务 wiki 宿舍起家的 nice!nano 蓝牙键盘模块卖到百万美元 可拆电源线:便利与安全、标准化之争 Bitburner:写脚本的增量游戏,像 Factorio,3.0 改 API 加 Darknet Justine 募捐争议:旧言论、事实失实与生活方式质疑 程序员逐帧考据《Tron: Legacy》终端镜头 LLM 写作、代码与设计的各种“味道” Bricks & Minifigs 被指扣留 20 万美元 LEGO 寄售收藏 日本 randoseru 书包:颜值惊艳,AI文风惹议 写作的“科学”只是反复写改和反馈 Zig Days:LLM 话题要不要软禁 Postgres 做 durable workflows:DBOS、Temporal 与自研队列之争 Google 搜索 AI化:用户、网站和 SEO 被边缘化 Anthropic 65 亿 Series H 融资,9650 亿估值与 run-rate 争议 波士顿—百慕大:低价机票改写度假版图 Raspberry Pi 6 争议:提速、降功耗与 MCU/USB-C 路线 Claude Code 动态工作流:Bun 重写、并行编排与 token 争议 GPT-4o 上更粗鲁的 prompt 略准,样本与语气定义遭质疑 《Permanent Upper Crow》:礼帽消费与债务循环的黑色讽刺游戏 美国量子投资或涉违法:法律、内线交易与科技泡沫之争 Claude Opus 4.8:小幅修正、4.7回退与Mythos悬念 20年聊天记录分析:社交圈收缩、旧友怀旧与隐私争议 纽约通过 pied-a-terre 税:二套房、低估值与避税争议 Zendesk 涨价4倍逼客户48小时重建,评论聚焦PE、AI自建与SaaS护城河 AI agent 权限疲劳小游戏:沙箱、YOLO 与安全提示之争 FPGA上的神经形态 Ising 机:被质疑是 buzzword 拼盘 Google AI Mode逼人迁移,DuckDuckGo涨28%但基数极小 OpenWRT 室内 Wi‑Fi 漫游:802.11r/k/v、uSteer 与兼容性坑 Meshtastic、MeshCore、Reticulum:离网 mesh 的价值与极限 五个 frontier LLM 对 1k 真实 fact-check claim 67% 分歧,No Abstain 争议大 Apple/Google 把 push 通知变成营销与控制战场 YouTube自动标记AI视频:误判、AI slop与过滤争议 EU罚Temu 2亿欧元:非法商品、安全与平台责任争议 Ruby/Java/TypeScript 做 DOCX 插件:MCPB 打包、GraalVM 原生编译与 Ruby 争议 UC教师称数学严重退化,要求STEM招生恢复SAT/ACT Gemini、Gopher、Finger:HTTPS之外的轻量网与反adtech讨论 AMD 收紧 Linux 版 Vivado 许可引发 FPGA 用户反弹 Claude Code显现PMF,但盈利与开源竞争仍存疑 Temu 因危险商品与合规失责被欧盟罚 2 亿欧元 Hallucinate:开源浏览器多人在线Rave 压力破坏海马体记忆整合与推理,教育体系却爱加压 SimCity 3000 4K版:经典等距城建与现代写实之争 企业 AI 账单爆表:tokenmaxxing 与高层乱推 CIA官员家藏4000万美元金条,FBI介入疑涉黑金 Rapira:苏联俄化 Pascal 解释器 Ferrari Luce EV遭讽成iPad车:设计和品牌双翻车 AI提效后:休假、加薪还是裁员? GPU-free AI 数据中心:HPC 旧瓶装新酒? 越狱 Kindle 跑 Rust/Slint,顺带聊 jailbreak 与 Kobo 替代 Go 将支持泛型方法,社区再吵“早该有还是补洞” Lua 的“绿色”能耗优化与 JIT 争议 Qwen3.7-Max 35小时优化未知硬件kernel获10×提速,引发真实性与基准质疑 Typst+Pandoc 模板:Markdown 直出 PDF 工作流 2MB“人类烹饪”被质疑:样本不全,更像食材搭配库 WSL 中 Claude Code 贴图失效:Windows Terminal 抢占 Ctrl+V,桥接可修复 Rands《The Ask》:中层管理、会议官僚与AI争论 Last.fm 独立回归:老用户怀旧、推荐争议与数据主权 依赖别乱更:锁版本、供应链与 CI 争议 Fano 平面式 Raft:少数节点也能达成共识 GitHub PR/API 再故障,评论区质疑 AI、Azure 与微软 Mini Micro虚拟复古电脑:硬件版与开源争议 Claude Code 日用:CLAUDE.md、Skills、subagents、MCP 命令碎片化与锁定争议 加拿大转向瑞典军机,摆脱美国军购依赖 伊朗互联网流量回升:停火信号、经济恢复与网络战争争议 旧 Intel MacBook 过热取暖,M 系列靠编译/LLM 才热 Joanna Rutkowska:自由潜水、具身性与 Claude 隐喻 特拉华 Fenwick Island 允许公司房主投票,空壳漏洞引争议 Steam Deck涨价逾200美元,AI抢RAM与通胀争议升温 Labubu与hyperreal:怪萌、稀缺炒作和中国潮玩出海 GPU 矩阵乘法会因数据可预测而提速 Tech CEO陷AI妄想:LLM迎合放大高层失真
Kefir C 编译器停更:作者因 LLM 抓取退出公开开发
2026-06-01 · via News Hacker | 极客洞察

🎯 讨论背景

Kefir 是一个小型 C compiler,源代码托管在 sourcehut(一个以 git 和邮件为中心的开源代码托管平台)上。作者宣布停止公开开发,理由是自己越来越不愿意无偿公开代码,因为大量 LLM crawler 会无视 robots.txt(网站告知爬虫抓取边界的惯例文件)并把开源内容吸进训练数据。评论迅速分成两大阵营:一边认为这破坏了 FOSS(Free and Open Source Software,Free/开源软件)的社会契约,另一边则强调 GPL、MIT 等许可证从未禁止商业使用或模型训练。随后讨论又延伸到 copyright、derivative work(派生作品)和 fair use(合理使用)这些法律概念,以及网站防爬虫和对 bot 施加强制惩罚的现实办法。

📌 讨论焦点

作者因 LLM 抓取失去公开发布动力

发帖人的核心情绪是:公开发布代码不再是默认善意行为,而是会被 LLM crawler 当成免费训练原料。评论里多次提到 robots.txt 被无视、网站被抓取流量拖垮,甚至有人开始考虑把站点改成密码墙或邮件审批才能自保。几位开发者说自己也开始减少或停止公开发布,转而经营只给自己用的私有项目,甚至直言 AI 时代让写代码这件事变得更像徒劳。整个讨论反映的是发布动机被重估,而不只是单纯的技术厌恶。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

反方:开源许可本就允许广泛使用

另一派认为,这种反应更多是在把 LLM 使用上升成对 FOSS 的泛道德化。有人强调 GPL、MIT 这类许可证本来就允许商业使用和广泛再利用,公开发布的前提从来不是“只能被好人使用”,也不可能限定下游是否拿去做模型训练。还有人说,若真的不接受这种交换,就应该从一开始不发布,而不是事后把不受欢迎的用途说成违约。对他们来说,真正的问题是具体的版权执法或产品行为,而不是 open source 本身失效。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

LLM 是否构成派生作品/复制

争论最密集的是 copyright 里的 derivative work(派生作品)到底该怎么界定。支持者把训练集比作 anthology(选集)或压缩后的语料库,认为只要模型能复现某个项目的实质代码,输出就应受原许可证约束,甚至模型权重本身也可能构成派生物。反对者则强调,copyright 保护的是具体表达,不是抽象模式或“学到了什么”,LLM 更像人类学习后再写出新代码,而不是把原文复制进输出。双方还拉出 Markov chain、transpiler、Hamlet、Emscripten 等类比,承认真正的灰区往往是那些确实逐字复现的极端案例。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10]

机器人滥用与网站防护

不少评论把问题直接归结为爬虫和 bot 对网站基础设施的消耗,而不只是版权争吵。有人认为大量自动化流量正在把“高信任互联网”拖成“低信任互联网”,因为抓取者无视 robots.txt、反复扫站,甚至让小站 100GB 级内容被一遍遍搬空。应对方案从最简单的用户名/密码墙、邮件申请访问,到按请求收费、提高法律罚则甚至刑事威慑都有;也有人提醒,现有的 HTTP 和 IP 层限流、封禁只是临时补丁。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10]

项目口碑与 AI 时代的创作焦虑

Kefir 本身也得到不少正面评价:有人说它是少数能通过完整 gcc torture tests 的小型 C compiler,虽然不如 tcc 快,但更正确,源码被形容得像一件作品。与此同时,关于 AI 时代写作和编程价值的焦虑很强,有人坚持手写实现才有乐趣,也有人认为 LLM 让代码变得更像廉价仿作,正在削弱原创和协作的意义。还有人把未来描述成 slop 泛滥、创造停滞,甚至说如果一个项目本来就是 one-person show,停止公开开发几乎等于终结,除非有人 fork。整体情绪介于惋惜、怀疑和退缩之间。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12] [来源13]

📚 术语解释

GNU GPLv3: 一种强 copyleft 开源许可证,要求基于其代码的衍生作品在发布时继续开放源码。

copyleft: 用版权法反向保护自由软件的机制,要求下游传播时保留同样的自由与开放条件。

robots.txt: 网站给爬虫的抓取规则文件,通常用来声明哪些路径不应被抓取,但一般不具强制力。

derivative work / 派生作品: 基于原作品改写、转换或再表达的作品,是这场关于 LLM 和版权争议的核心概念。

fair use(合理使用): 美国版权法中的例外原则,常被拿来争论训练数据或模型输出是否可合法使用。