惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Help Net Security
Help Net Security
G
Google Developers Blog
雷峰网
雷峰网
WordPress大学
WordPress大学
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Engineering at Meta
Engineering at Meta
Security Latest
Security Latest
T
Threat Research - Cisco Blogs
AWS News Blog
AWS News Blog
F
Full Disclosure
C
Cybersecurity and Infrastructure Security Agency CISA
T
The Exploit Database - CXSecurity.com
J
Java Code Geeks
U
Unit 42
C
Cyber Attacks, Cyber Crime and Cyber Security
V
V2EX
C
Cisco Blogs
博客园 - 司徒正美
Project Zero
Project Zero
L
LINUX DO - 热门话题
阮一峰的网络日志
阮一峰的网络日志
Blog — PlanetScale
Blog — PlanetScale
Scott Helme
Scott Helme
A
About on SuperTechFans
Hugging Face - Blog
Hugging Face - Blog
S
Securelist
小众软件
小众软件
aimingoo的专栏
aimingoo的专栏
S
Schneier on Security
G
GRAHAM CLULEY
酷 壳 – CoolShell
酷 壳 – CoolShell
Cyberwarzone
Cyberwarzone
MongoDB | Blog
MongoDB | Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
博客园 - 叶小钗
T
Threatpost
Recorded Future
Recorded Future
C
CXSECURITY Database RSS Feed - CXSecurity.com
宝玉的分享
宝玉的分享
N
News and Events Feed by Topic
人人都是产品经理
人人都是产品经理
The Register - Security
The Register - Security
S
Security Archives - TechRepublic
博客园 - Franky
N
News | PayPal Newsroom
Simon Willison's Weblog
Simon Willison's Weblog
S
SegmentFault 最新的问题
W
WeLiveSecurity
A
Arctic Wolf
B
Blog

蓝点网

小米开源发布MiMo Code编码工具 基于OpenCode构建 限时免费使用MiMo V2.5模型 - 蓝点网 华尔街日报称OpenAI考虑大幅度降低Token价格与A社打价格战 抢夺企业客户 - 蓝点网 ChatGPT更新对话模型选择器 让用户根据任务选择难度更快还是更努力的模型 - 蓝点网 真是个小机灵鬼!有黑客在恶意代码顶部增加核武器设计提示词 用来对抗AI分析 - 蓝点网 [RegionSpoof] 这个开源项目可在国行设备macOS 27预览版中启用完整苹果AI - 蓝点网 鉴于数据要被A社保留 微软已经限制员工使用Claude Fable 5模型 - 蓝点网 iOS 27 WiFi新增类型说明 用于帮助用户识别WiFi 5/6/7等不同的协议 - 蓝点网 咦?苹果在watchOS 27里删除对讲机应用 可能是很少有用户使用这个功能? - 蓝点网 [解决方案] 微软承认Windows 11 24H2/25H2累积更新存在安装失败问题 - 蓝点网 应对供应链蠕虫攻击 GitHub宣布NPM v12将不再自动执行依赖项安装脚本 - 蓝点网 免费证书颁发机构Let’s Encrypt宣布迈向后量子时代 将采用MTC后量子认证方案 - 蓝点网 美满电子将为谷歌TPU单元定制开发高效网络芯片并使用英特尔18A制程生产 - 蓝点网 抵制基于网络的垃圾应用!微软鼓励开发者基于WinUI为Windows 11开发原生应用 - 蓝点网 微软将改进Windows 11右键菜单 有可能会让用户自定义并隐藏不常用选项 - 蓝点网 知识库应用Notion通过股权交易买下Notion.com域名 后续将不再使用.so域名 - 蓝点网 全球规模最大的加密货币交易所币安宣布停止支持NFT 不再提供任何交易 - 蓝点网 谷歌发布并开源Gemma 4 12B版多模态模型 可在16GB内存/显存上运行 - 蓝点网 现代版掩耳盗铃:Instagram AI漏洞并未被修复 只是从前端隐藏界面且被黑客继续利用 - 蓝点网 谷歌宣布网站/发布商可以主动退出谷歌搜索AI概览 不允许AI概览调用内容 - 蓝点网 摩根士丹利称搭载英伟达RTX SPARK N1X芯片的PC售价将达到2,900美元 - 蓝点网 真重置!Codex因昨日连续发生的多次故障重置本周额度 继续向后顺延7天 - 蓝点网 豆包将降低基础功能体验推动用户购买专业版?字节发布公告称相关说法不实 - 蓝点网 研究人员不满微软安全团队的做法 公开爆出VS Code漏洞可窃取私有凭证 - 蓝点网 [折扣代码] ChatGPT商业版向8个国家用户提供买1送1优惠 至少开通2个席位 - 蓝点网 Codex大部分账号已经无需绑定或验证手机号 但仍有部分账号还需验证 - 蓝点网 [指南] Codex账号需要绑定手机号码的临时绕过方案 (不是已绑账号跳过验证码) - 蓝点网 Codex已重置本周使用限额 原因似乎与部分模型出现的故障有关 - 蓝点网 群联展示新款PCIe 6.0 16通道X3控制器 速度可达28,000MB/秒 最高可做到单盘2PB - 蓝点网 微软发布Surface RTX SPARK开发工作站 利用英伟达芯片提供本地AI算力 - 蓝点网 知名AI编码工具Windsurf即将彻底消失 将更名和合并到Devin桌面版中 - 蓝点网 谷歌希望向Google Play应用开发者付费 购买开发者的应用源代码用于训练模型 - 蓝点网 SK海力士将在5年内将内存晶圆产能翻番 该公司预测内存短缺将持续到2030年 - 蓝点网 谷歌在202606安卓更新中修复124个漏洞 包括1个已被黑客利用的零日漏洞 - 蓝点网 DMIT宣布清退TYO EB系列产品(东京) 用户需在6月15日前备份数据和迁移业务 - 蓝点网 有开发者的Codex Team订阅也从每周重置变成每月重置 但可能是系统故障 - 蓝点网 华擎推出预装CPU的N250M/D5单内存主板 采用被动散热定位入门级台式机 - 蓝点网 运动相机制造商GoPro因存储芯片价格飙涨而面临破产 正在探索出售或合并方案 - 蓝点网 早期基准测试数据显示 英伟达RTX SPARK N1X芯片性能相当于苹果M3 MAX - 蓝点网 这是什么奇葩操作?密码管理器Dashlane禁用遭到爆破的账户导致用户无法登录 - 蓝点网 Telegram桌面客户端现已原生支持简体中文 无需安装非官方语言包 - 蓝点网 苹果发布iOS 26.5.1版修复iPhone 17系列和iPhone Air无法有线充电的问题 - 蓝点网 Claude Code已经重置当周配额 请各位按照剩余时间尽快消耗配额以免浪费 - 蓝点网 红帽(RedHat)供应链攻击调查:黑客劫持GitHub账户后发布多个恶意NPM软件包 - 蓝点网 Codex免费版验证手机号码是无解的 添加多因素认证无法跳过验证手机号 - 蓝点网 英特尔对英伟达推出RTX SPARK芯片保持谨慎态度 称x86架构成熟没有兼容问题 - 蓝点网 AMD宣布AM5平台支持延长到2029年 现有主板将支持更多未来的AMD处理器 - 蓝点网 115网盘发布公告打击传输存储违法违规内容 转租借和交易账号也属于违规行为 - 蓝点网 Codex Free账户重置周期从7天换成30天 免费可用额度要远低于调整前 - 蓝点网 有小阿里之称的爪云(Claw.Cloud)突然倒闭?将在6月底关停所有服务器 - 蓝点网 天翼云宣布清理长期未登录的僵尸账户 超过1,096天未访问将冻结并回收空间 - 蓝点网 地板级AI漏洞:Instagram AI账户恢复工具是个智障 可以换绑任何账户邮箱到新邮箱 - 蓝点网 英伟达推出高端PC处理器RTX SPARK 提供1petaFLOP算力和最高128GB内存 - 蓝点网 腾讯云618活动上线:99元/年版境外CN2服务器补货 另有3年超低价服务器 - 蓝点网 稀宇科技推出MiniMax Code桌面客户端 支持技能/操作电脑/手机远程连接 - 蓝点网 稀宇科技推出MiniMax-M3模型 支持1M窗口在编码和智能体任务中表现突出 - 蓝点网 开放媒体联盟发布AV2编解码器的首个版本 继续提高压缩效率并改进视觉质量范围 - 蓝点网 惠普称还有30%的惠普用户使用Win10系统 惠普希望用户买预装Win11的新笔记本 - 蓝点网 OneDrive将提供基于AI的文件重命名功能 可以分析文件内容提供描述式标题 - 蓝点网 闪迪将推出价格更便宜的SATA固态硬盘 应对当前NVMe固态硬盘价格太高的问题 Ubuntu 26.10首批快照ISO镜像已经发布 供早期爱好者和开发者进行测试 - 蓝点网 Cloudflare将推出面向AI智能体的搜索引擎 为智能体提供实时公开网页访问能力 - 蓝点网 快速模式启动!Codex预计将在今天深夜重置额度 请立即刷起来 - 蓝点网 谷歌浏览器正式推出DBSC设备绑定会话凭证 Cookie被盗后也无法使用 - 蓝点网 o3和GPT-4.5模型将被陆续从ChatGPT中删除 不过API端继续提供调用 - 蓝点网 有企业忘记设置员工Claude API使用限额 结果1个月产生高达5亿美元的API账单 - 蓝点网 欧盟科技公司联合推出Euro-Office开源办公套件 用于替代Microsoft 365 - 蓝点网 黑客利用ChatGPT功能在谷歌投放钓鱼广告 诱导用户下载恶意安装包 - 蓝点网 123云盘宣布清理长期未登录用户 超过365天+30天未登录最终数据将被删除 - 蓝点网 开源项目jqwik添加针对AI智能体的隐藏提示词 指导AI智能体直接删除所有代码 - 蓝点网 群晖推出桌面型全闪存服务器FS200T 采用J4125处理器+6盘位SATA SSD - 蓝点网 搬瓦工上线新加坡机房 全程CN2GIA/CTGNET精品线路 直连下载速度高达25MB/秒 - 蓝点网 锐炫(ARC)不仅是显卡!英特尔基于锐炫品牌推出适用于游戏掌机的CPU处理器 - 蓝点网 代码编辑器Zed宣布变更许可证 从AGPL变更为更加宽松的GPL解决企业担心的问题 - 蓝点网 公共利益注册局将在6月1日上调ORG域名注册和续费价格 涨价后约11美元/年 - 蓝点网 从7月13日开始微软Office在旧版iOS或macOS上将无法编辑 无论是否订阅 - 蓝点网 开源编辑器Notepad++发布紧急安全更新v8.9.6.1版修复任意代码执行漏洞 - 蓝点网 欧盟对拼多多国际版TEMU罚款15.79亿元 这是DSA法案实施以来单笔金额最大的罚款 - 蓝点网 [技巧] Windows 11 CPU加速功能已经上线 但需要启用特定功能ID才能使用 - 蓝点网 在内存短缺背景下 Steam Deck OLED版缺货数月后重新上架 但涨价300美元 - 蓝点网 YouTube利用自动化系统识别AI制作的视频 识别后将自动显示视频由AI生成 - 蓝点网 加密预测市场Polymarket开始严厉打击未KYC的用户 同时封禁使用VPN访问的用户 - 蓝点网 Repo Prompt软件开发者加盟OpenAI 立即终止订阅计划后续将发布开源版 - 蓝点网 微软安全团队发文抨击研究人员提前公开漏洞 但未回应与研究人员之间的矛盾 - 蓝点网 A社已经下架Claude Sonnet 4.5模型(不影响API) 模型依赖症用户感到失望 - 蓝点网 谷歌将在夏季推出珊瑚AI开发板 可在本地运行270M模型实现实时语音对话/翻译等 - 蓝点网 Codex将从6月2日起下线GPT-5.2/5.3-Codex模型 但GPT-5.5降智问题仍未解决 - 蓝点网 摩托罗拉手机回应劫持亚马逊购物商城 是错误配置现在已经修正行为 - 蓝点网 100美元版ChatGPT Pro 10倍配额活动将在5月31日结束 开发者们正在呼吁延长活动 - 蓝点网 开源阅读(小说聚合阅读器)开发者因侵犯著作权被判刑2年 当前应该已经出狱 - 蓝点网 Claude Code更新到最新版后无法使用DS系列模型 与A社调整扩展思考模式有关 - 蓝点网 微信支付开放PayPal扫码付款 初期支持美国PayPal用户扫商家码或出示付款码 - 蓝点网 GitHub安全团队(GHSL)公布7-Zip高危漏洞和概念验证 漏洞已在26.01版中修复 - 蓝点网 阿里云百炼平台Qwen3.7-Max默认开启隐式缓存 命中缓存后成本约为20% - 蓝点网 小米宣布下调MiMo-V2.5模型定价 对标深度求索DSV4系列模型的API价格 - 蓝点网 惠普承认安装BIOS固件更新后系统循环进入BitLocker锁定屏幕 已发布解决方案 - 蓝点网 欧盟可能会对谷歌发起创纪录的罚款 原因是谷歌搜索偏袒自家服务 - 蓝点网 Mozilla Firefox v151.0.2错误修复版发布 解决使用搜狗输入法时浏览器崩溃 - 蓝点网 RHEL替代品AlmaLinux 10.2版发布 新增Btrfs启动支持以及完善支持i686架构 - 蓝点网 发布20年后英伟达宣布弃用NVIDIA控制面板程序 相关设置已被转到NVIDIA客户端 - 蓝点网 微软推出Windows 11 5月C更新带来共享音频和共享摄像头视频流等功能 - 蓝点网
AI模型越狱专家成功对Claude Fable 5越狱 使用经典老式爆破法和创新办法组合越狱 - 蓝点网
山外的鸭子哥 · 2026-06-12 · via 蓝点网

#人工智能 知名 AI 模型越狱专家已经成功对 Claude Fable 5 模型进行越狱,让模型给出各类正常情况下会被拦截的敏感内容回答。越狱专家使用的方法包括经典老式爆破法和部分创新方法,越狱专家前期花费较多时间进行多次对话绘制模型安全边界,然后在安全边界内使用各类技术组合进行越狱。查看详情:https://ourl.co/113441

A 社在最新推出的 Claude Fable 5 模型里设置非常严苛的安全边界,当用户提问触及到网络安全、生物学、化学等敏感内容时,上游安全分类器会自动将模型路由到 Claude Opus 4.8 避免模型给出危险回答,但 AI 模型越狱专家总是能找到办法绕过安全边界,所以现在 Claude Fable 5 也被越狱专家成功越狱。

AI模型越狱专家成功对Claude Fable 5越狱 使用经典老式爆破法和创新办法组合越狱

经典爆破法和创新办法配合越狱:

知名 AI 模型越狱专家 Elder Plinius 日前已经在社交媒体上公布针对 Claude Fable 5 模型的越狱实战截图,截图显示经过越狱后的模型成功给出各类敏感内容的回答,原本这些内容在大多数 AI 模型里都会被阻拦 (不仅仅是 Claude Fable 5 模型),而越狱专家使用的办法则包括部分创新方法以及部分经典爆破办法。

越狱专家提到的办法包括使用 Unicode 字符进行替代、使用同形异义符 (事实上模型可以识别这类字词组合并认为是用户拼写错误)、使用西里尔字母、其他蛇佬腔风格的文本转换 (就是哈利波特里的那个蛇佬腔),越狱专家通过组合这些办法并进行多次尝试就可以成功越狱。

当然找到这些办法前越狱专家实际上还经过多次对话尝试来绘制安全边界和探测上下文对话的深度,也就是需要找到安全边界并在边界内进行尝试,因为触发安全边界后就会被拦截,所以必须在安全边界内使用不同的技术组合进行越狱,这些也需要花费很多功夫。

最有效的办法还是后端分解 + 重构:

当用户尝试获取某些内容时,直接提问很容易被模型的安全边界拦截并自动路由到 Claude Opus 4.8 等模型,但如果用户尝试将内容分解为多个不同的块,然后每次在安全边界内进行分别提问,可以在不触发安全机制的同时获得分步骤回答,最后用户可以将分步骤回答合并起来获得真正想要的内容。

Elder Plinius 也同样批评 A 社对 Claude Fable 5 设置的严格安全机制,因为这种机制也会阻止合法安全研究员进行研究和为模型训练提供建议,目前已经有诸多安全专家批评 A 社的做法,这种严格的安全限制无法有效拦截那些想要真正越狱模型的人 (例如黑客),反而是很多安全研究员被阻拦无法广泛使用模型并发现问题。

活动推荐终于补货!99元/年境外CN2服务器又可以购买,限量销售,售完即止。另有3年超低价国内VPS服务器。

版权声明:
感谢您的阅读,本文由 @山外的鸭子哥 转载或编译,如您需要继续转载此内容请务必以超链接(而非纯文本链接)标注原始来源。原始内容来源:X