慣性聚合 高效追蹤和閱讀你感興趣的部落格、新聞、科技資訊
閱讀原文 在慣性聚合中打開

推薦訂閱源

Google DeepMind News
Google DeepMind News
大猫的无限游戏
大猫的无限游戏
GbyAI
GbyAI
WordPress大学
WordPress大学
雷峰网
雷峰网
博客园_首页
L
LangChain Blog
Blog — PlanetScale
Blog — PlanetScale
Last Week in AI
Last Week in AI
博客园 - Franky
M
MIT News - Artificial intelligence
S
SegmentFault 最新的问题
博客园 - 【当耐特】
Jina AI
Jina AI
腾讯CDC
Y
Y Combinator Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
Stack Overflow Blog
Stack Overflow Blog
宝玉的分享
宝玉的分享
罗磊的独立博客

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
為何您的AI安全戲劇正在扼殺創新:一位產品經理的混沌資本指南
Jai kora · 2026-05-20 · via DEV Community

為何您的AI安全戲劇正在扼殺創新:一位產品經理的混亂資本指南

我的六歲女兒還不懂規則。她以純粹的好奇心來接觸問題,這種好奇心能穿透層層繼承的假設。看著她讓我想起了一件不舒服的事:我們正在用同樣的風險避險策略來管理AI產品,這與我們在1990年代發貨實體產品時所用的策略相同,那時失敗意味著要召回庫存,並在黃金時段電視上發表道歉。

但這裡有變化:失敗的成本已經崩潰到接近零,而我們仍然像發射太空穿梭機一樣行事.

演化問題

在聽到近期與實際已推出產品的AI產品領導者的對話後,我一直在思考基礎原則。演化並未優化安全。它優化了具有巨大錯誤容忍度的快速迭代。生存下來的生物不是那些擁有最佳防護措施的生物,而是那些能夠最快適應變化條件的生物。

然而這裡我們還在建立複雜的AI安全框架,讓每一個決策都變得緩慢。我們在扮演風險管理角色,而同業競爭對手們卻在從真實用戶互動中學習。

令人不適的真相:大多數AI安全措施並沒有保護用戶。它們是在保護產品經理免於與仍然認為軟件部署像製造一樣的執行官進行困難對話。

金色路徑謬誤

當前正統觀念宣揚建立輔助措施,使「金色路徑」成為唯一路徑。這聽起來負責任,直到你意識到它假設我們知道對於從未存在過的AI產品,「金色路徑」是什麼樣子。

傳統的產品開發有物理限制,迫使我们在行動前要謹慎思考。你無法輕易地召回已發貨的產品或透過一夜間部署來修補硬體錯誤。這些限制創造了有價值的習慣,圍繞著前期的規劃和風險緩解。

人工智能發展有不同的限制。你可以立即撤銷模型變更。你可以精準地進行 A/B 測試演算法行為。你可以實施在毫秒內啟動的 circuit breaker。物理現實已經改變,但我们的管理實踐還沒有。

人工智能產品的混沌工程

我所觀察到最成功的AI產品團隊,並非那些安全程序最嚴謹的團隊。而是那些從第一天起就為了可控混亂而設計其系統的團隊。

這意味著開發能夠优雅處理預期之外的 AI 行為的產品,而不是試圖完全阻止這種行為。當您的 AI 助手生成奇怪內容時,您的產品是优雅地降級,還是崩潰了整個用戶體驗?

真正的 AI 安全不是關於防止 AI 做出預期之外的事情。它是關於開發足夠強韌的產品,讓預期之外的 AI 行為變成一個功能,而不是一個錯誤。

代理差距

在接納人工智能不確定性與試圖消除它的團隊之間,存在著日益增長的分歧。差異不在於技能或資源,而在於代理權。蓬勃發展的團隊給予人員快速實驗的權限,並對結果負責。

传统的產品管理框架假設你可以事先定義需求,並根據預設的指標衡量成功。AI 產品需要一種不同的方法:定義限制而不是需求,衡量學習速度而不是僅僅是結果指標。

許可架構

在 AI 世代,技術領導最重要的工作是建立更好的框架,而不是建立更好的權限。它是在給予權限和承擔責任。框架很簡單:告訴人們他們可以實驗,如果任何事不順利,就歸咎於系統設計,而不是個人決策。

這需要您重新建立您的產品架構,圍繞快速實驗而非可預測的執行。您的基礎設施應該讓嘗試新事物比維持現狀更容易。

最適化陷阱

我們在優化我們所擁有的,而不是探索可能的事務。這是自然的人類行為,但在AI產品開發中,這尤其危險,因為情況每月都在變化。

AI 產品的品質並不在於不良率或六西格瑪指標。它是在於建立用戶實際需要的東西,這需要不斷探索鄰近可能。如果你每個實驗都需要三週的批准流程,你就無法有效地探索。

為數位演進建設

在人工智能領域獲勝的團隊,並非是安全文件記錄最完善的團隊。而是那些創造了能夠讓好點子從任何地方湧現並迅速在組織內部傳播的環境的團隊。

這意味著接受大多數實驗會失敗,但優化失敗的速度而不是防止失敗。當失敗的成本低廉且快速時,你可以承受更頻繁地犯錯。當失敗的成本高昂且緩慢時,你不能承受錯誤。

將會主宰未來十年的公司,不會是那些率先解決人工智能安全問題的公司。它們將是那些在其他人還在撰寫安全文件時,學會將受控混亂作為競爭優勢的公司。

你的六歲孩子不需要許可才能保持好奇心。或許你的人工智能產品團隊也不需要。