慣性聚合 高效追讀感興趣之博客、新聞、科技資訊
閱原文 以慣性聚合開啟

推薦訂閱源

Google DeepMind News
Google DeepMind News
人人都是产品经理
人人都是产品经理
M
MIT News - Artificial intelligence
博客园 - 叶小钗
MyScale Blog
MyScale Blog
V
Visual Studio Blog
月光博客
月光博客
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
I
InfoQ
有赞技术团队
有赞技术团队
阮一峰的网络日志
阮一峰的网络日志
Jina AI
Jina AI
V
V2EX
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Blog — PlanetScale
Blog — PlanetScale
Last Week in AI
Last Week in AI
雷峰网
雷峰网
Stack Overflow Blog
Stack Overflow Blog
博客园 - Franky

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
安全公司战时之态:Anthropic、国防部及理想框架之局限
Keith MacKay · 2026-05-25 · via DEV Community

当SafetyCo启战之时:Anthropic、美国政府及理想框架之局限

欲行或显非义之事,硅谷有常法:先立框架,后言所求之事与框架相合。Anthropic之善,建一伦理之基,法度严谨之构——宪法式人工智能(Constitutional AI)、责任扩展之策(Responsible Scaling Policy)、可受用之规(Acceptable Use Policy)皆具锋芒。及至与国防部门(Department of Defense)借Palantir为介,则直指其构,曰:“观之,吾等良善。”

Anthropic/DOD之案,其值得研习者,非在决断之是非,而在其所显于理想之公司,如何应商贾之压力——及其框架,实护何物,抑或仅饰有用之辞.之理.


设境:拒之公司

Anthropic乃二零二一年由前OpenAI之领袖所创,其众多离去者,皆因信AI安全未获足够之重。其立基之旨:构强力AI,然必慎为之。,明示风险,严限有害之用。克劳德之用政,自始即明禁兵器之制,军略之向,众察之术,及致大害之文 [1]。

数载之间,此定位既诚且便。AI安全之域尚疏,品牌自别,而国防之部未遽叩门。然算计骤变。迨至二二四年末,AI已成国家安全之要,联邦政府于AI合约挥霍无度,Anthropic之敌——OpenAI、Google、Microsoft——皆以异法入政府之域[2]。

金在焉。所疑者,道能否存乎其接触之中也。


实际所遇何如

二零二四年末,Anthropic与Palantir及AWS结盟,使Claude得入美利坚情报机关及国防部门之机要云境[3]。其公开许诺之用,谨限于物流优化、人事决断之辅、情报析理。非自主兵器。非瞄准系统。非使Claude入于杀伐之链者。

微言实关大体。Anthropic立二铁律:一、勿滥察美利坚民;二、勿用全自主之兵器(能自辨、自择、自击目标,无需人干预者)[4]。此非空泛之愿,实为契约之要。

阿莫迪谨言明辨,曰:"半自主武器,如今乌克兰所使用者,于民主之卫至关重要。"其非难非在兵器系统之AI,而在尽去人于瞄准决断。彼书曰[5]:"边疆AI系统,实不可靠,不足以驭全自主武器。"

五角大楼之应:此等条件于行军用兵实属不切。彼特·黑格斯泰斯之署力主“凡合法用途皆可通”,无例外,无监临之责。当Anthropic持此见,国防部竟胁以命其为“供应链之患”,此乃国家安全之标签,寻常只予外敌[4]。

阿摩戴于公开之文告中,述克劳德之职司,盖涉"要务攸关之应用,若智识之析,模拟之演,经略之谋,网络之役,犹有他事" [5]。其责成扩用之策,将统辖所许之分类 [6]。宪法人工智能之训练之限,犹存其旧 [7]。

至二零二六年二月,Anthropic受压而稍弛其制 [4]。然未尝尽废之。Amodei公开言曰,公司"心有所不安,不能从"五角大楼之索求无限制之权 [5]。

府衙之应,迅若风驰。至二零二六年三月之初,特朗普之府命联邦诸司止用克劳德,并正式颁行供应链风险之号令[8]。五角大楼得六月之期,以渐汰旧制。官吏恫吓"重典严刑"[8],复引《国防生产法》[5]。特朗普总统于真理社斥Anthropic为"左翼狂徒"[8]。

阿摩戴指出其内在矛盾:当局既将Anthropic视为安全风险,又声称Claude对国家安全至关重要[5]。

此乃框架之事,鲜有为之者:以实代价,坚守界限。所问者,此何所昭示耶?


框架之辩

诚有此事。Anthropic(Anthropic)于此决断,其道甚正,远胜于众科技之公司于同类问题所持之原则。

考诸谷歌之 Maven 计于戊戌年,工程师抗辩 DOD 合同,为无人机影像分析之务,而谷歌未尝有深谋内审之思[9]。或微软之 JEDI 云计,其伦理审议实为法律与声誉之风险估量,非价值之践行也[10]。二事之中,公司先应而后虑伦理——若虑之,亦甚微耳。

Anthropic至少在付诸行动之前,公开场合高声发问。其界定禁用之类别预先此乃将合作系于既有之政策约束,而非创制新而更弛之规。以科技领域国防承包之标准衡之,此实属异常自律。

此框架早以隐微之式试之,犹未及DOD之冲突。Anthropic自愿弃"数百万之利"以限Claude之用,凡与中共相连之企业,并绝CCP所倡之网络攻击,欲肆虐Claude者[5]。此非伦理之戏也。乃公司承物质之费,以行其言定之限,而人犹未察也。

是故其规训终及于出口:Anthropic虽受法律之胁,犹不欲尽废其制,遂失其约,而非弃其架也。此果非Google与OpenAI所遇,盖二者未尝立界,为政所不便耳。

此框架亦显真哲学之立场:强人工智能入 authoritarian governments 或 non-state actors 之手,尤甚。之险,甚于美利坚政府所部署之强人工智能,而受监督焉。就人工智能安全之论,其说颇有可取。若克劳德将参军事决策,则宜有以安全为重之公司共议,毋使此域委诸行事不谨之开发者。


疑者之读

然框架有弊,此弊尤显。

验证之难.Anthropic之限,系于Palantir与DOD能否恪守其用界。Anthropic何以知Claude被用诸所禁之事?密境非设而不可察。此框架原可责成,然实无甚效.

利源之难。 一公司之营收,若多系于客,则权势之势易。后之议Claude所许为者,必于拒之有实财之境。前所立之规,较之需拒利以行规者,固易辩也。

此乃先例之患。 此决断之最重者,非Palantir之约也。乃其内传之信也——致诸僚属,致来日之主,致股肱之资——关于可容之折衷。嗣后每遇“此可乎?”之决断,皆将系于此焉。格局迁矣。

定义之难。 何谓可容之用例,实为重负之问。物流优化,易断也。外邦民情之情感分析乎?签证申请人之自动风险评分乎?社会动荡之预测威胁建模乎?此皆存于谱系,而公告中所言之明晰界限,遇敌对之实战压力则难立。据报,Claude已整合于委内瑞拉针对总统尼古拉斯·马杜罗之行动之情报与规划流程中[4]。"情报分析"乃在所容之用例之列。然所谓情报分析,实则为广博之范畴。

立意之难。 吾辈不复臆测Anthropic将屈于压力。二〇二六年二月,其已屈矣。面五角大楼之威,欲定其为国家安全供应链之风险,Anthropic弱其公然所立之护栏[4]。然则其持更硬之立场,拒全然之顺从,受其所禁[8]。其证实实纷纭:框架虽因压力而动,亦止于公司愿弃其业之处。此非多数框架所为。亦非外人所见之硬立场之实。


此乃实为案例之研

Anthropic/DOD之境,非独关乎军纪或AI之策,实乃案例之研,显价值驱动之企,势盛至价值观具实经济之果时,其变若何。

凡处此境者,皆得同识:初无失时所作之框架,及至施行,则见真金白银弃于案上。以理念为基之框架,非在导易决,而在导难。者。国防部之决,甚坚。Anthropic(Anthropic)有所召。其召之当否,关乎实证之问,吾辈方始应之。所限虽屈于二〇二六年二月,然亦存于至要之基——公司非尽弃其约,实失其约也。

吾辈之所能者。所言,此过程较之他者,诚然无欺。Anthropic未伪称决断之易,未默然延其政令;乃公然辩护所行之拓。其划界焉——纵使此界或难施行。


管理之训

此有故事之版本,凡成长之企业,其领袖终将经历之。汝有框架——乃价值之系,使命之旨,公开承诺于行事之道。然一人携巨款而入,足以考验之。

陷局非在应允,而在假意应允非移界限。Anthropic应允矣,然亦言:此乃界限所在,此乃吾辈信此决断合乎正道之由。此说可辩。不可辩者,受此利而望人莫察己之变位也

。为立价值之组织者,Anthropic之例,实为实用之模:此框架须先于压力而生。若尔撰AI伦理之策,而后国防部来电,汝所撰非约束之文,乃辩解之辞也。于人工智能之世,能持真道义者,乃立此框架之公司也。其前也彼需之——是故于低风险之际决断,以验其纲之有牙也。

Anthropic是也,大抵如是。齿折于丙申年二月,继而持于公司所愿弃利之界。经此,宰辅之训有二:一者,压境未至,先构其纲;二者,预决其迁之度,盖压境既至,此决已为所建之文脉所定矣。


定论

此乃答案:Anthropic(Anthropic)稍抑,复持之。政府行其威。Claude(Claude)今正式出联邦部署,至少六月,虽仅表之[8]。退役将军Jack Shanahan(杰克·沙南)称Anthropic之安全措施“合理”,疑行政之决系“出於审慎分析抑或政治考量”[8]。

竞逐之局昭然若揭。谷歌于二零二五年弃其不持械之誓,OpenAI则于二零二六年二月去其使命宣言中“安全”二字[4]。二者皆留,Anthropic划界自守,终遭逐出。今诸人工智能公司所悟之训曰:若客为美利坚政府,而政令相向,则伦理之束实为累也。

此问较难:持框架而失其业,框架果为成耶?为败耶?

其乐观之解:框架得效。使Anthropic未全屈于所认非道之求。公司受实责,未尽弃其制。此乃责实之状也。

悲观者视之:Anthropic今已脱离政府AI。少谨小慎微之开发者(无碍伦理之框架者)将填补此空。市场择优而容,持原则之公司反受惩。其于军事系统实际之AI应用,终归不利。

二说或同时为是。此故,此案尤堪研习。

复有更广之先例之虑:此府以联邦采购之权,伐一国之企业,以其持守伦理之故[8]。若此模式得持,则余之科技界将受寒意甚巨。无人复敢画线,恐为指定为国家安全之威胁。

Anthropic之持守,其谋略之智愚,与道义之是非,实为二事。道义之是非,昭然若揭。谋略之智愚,则系于数载之内,政府AI之变局,及美利坚之政柄,其或再决,以企业设限为伴,值此良伴乎?


Anthropic 持线而失其约,Google 与 OpenAI 不持线而守其约。何者之策,于受此人工智能系统影响者,产出更善?此问,吾未闻有善答者——愿闻深思此道者之见.

参考文献

  1. Anthropic 可接受使用政策
  2. OpenAI悄然撤销禁用ChatGPT于"军事与战事"之令(二零二四年一月)—The Intercept
  3. Anthropic与Palantir联手将Claude AI模型引入AWS以供美国政府情报与国防运作(二零二四年十一月)—Palantir公告
  4. 五角大楼与Anthropic争辩军事AI之规约(二零二六年二月) — 論法意 (多爾西、施瓦茨、博德、阿薩德、雷尼奇 / 独立法律審查諮詢委員會,由設計責任研究所負責)
  5. 大羅阿莫戴伊就吾與戰部之議言之聲 — 安斯派克提克,二〇二六年
  6. 安斯派克提克責任擴張方針
  7. 憲法之人工智能:無害於人類之反饋 — 白氏等著,安斯派克提克,二〇二二年
  8. 天仁之禁:当德义之界成官府之的(三月二六) — 政策之稳
  9. 谷歌之役,员工抗军事人工智能之议(五月十七,二零一八) — KQED
  10. 微软得意外之胜,获百亿美元国防合同(十月一九) - Wired杂志

若此言得君心,兹附相关文论:

  • MCP:其志、其险、其道
  • 君之AI事业何以乏善可陈

凯斯·麦凯者,EY-Parthenon软件战略组(SSG)之首席技术官也,专精于人工智能之颠覆及私募股权与企业客户之技术审慎。SSG之人工智能颠覆实验室,速评人工智能如何转变并威胁既有之商业模式与价值链。凯斯执教于东北大学,且撰文论人工智能、战略、管理及技术诸题。