惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Cloudbric
Cloudbric
E
Exploit-DB.com RSS Feed
SecWiki News
SecWiki News
Forbes - Security
Forbes - Security
N
News | PayPal Newsroom
S
Security @ Cisco Blogs
Schneier on Security
Schneier on Security
V
V2EX - 技术
S
Secure Thoughts
W
WeLiveSecurity
Google DeepMind News
Google DeepMind News
C
CERT Recently Published Vulnerability Notes
NISL@THU
NISL@THU
S
Securelist
S
Security Archives - TechRepublic
Know Your Adversary
Know Your Adversary
V
Vulnerabilities – Threatpost
Security Latest
Security Latest
Recent Commits to openclaw:main
Recent Commits to openclaw:main
G
GRAHAM CLULEY
H
Hacker News: Front Page
Microsoft Azure Blog
Microsoft Azure Blog
I
Intezer
Google Online Security Blog
Google Online Security Blog
美团技术团队
阮一峰的网络日志
阮一峰的网络日志
T
The Exploit Database - CXSecurity.com
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Webroot Blog
Webroot Blog
Jina AI
Jina AI
Engineering at Meta
Engineering at Meta
P
Proofpoint News Feed
The Cloudflare Blog
I
InfoQ
L
LangChain Blog
U
Unit 42
P
Proofpoint News Feed
S
Schneier on Security
S
Security Affairs
Y
Y Combinator Blog
T
Tenable Blog
N
News and Events Feed by Topic
MyScale Blog
MyScale Blog
量子位
Google DeepMind News
Google DeepMind News
Cyberwarzone
Cyberwarzone
博客园 - 聂微东
D
Darknet – Hacking Tools, Hacker News & Cyber Security
GbyAI
GbyAI
AWS News Blog
AWS News Blog

分享发现

推荐 2 个好玩的在线游戏站 Claude code 的 Designs 和 Routines 居然是独立额度,我的 Claude Pro 订阅又升值了 偶然看到一篇文章《文化已死:当绝大多数人听的音乐,读的书都来自 10 年前》,给大家推荐一下,非常值得一看 66 个入狱教程 国家超算互联网平台提供 Coding Plan(20 元/100 元两档) supergeo.info 送兑换码 V2EX › 登录 古风提示词 Bright Data 代理和 Browser API 90 天 6 折,优惠码 BESTPROXY60 飞机上 Starlink 测速 zig 写的 100kb 的 wasm 可以 http 读写任意 git 仓库 GPT Image 2 韩文 prompt 实测:不是“能看懂”,而是“能还原” 网页端 GPT-5.5 Thinking 体感好快啊,这速度第一反应还以为是降智到 4o-mini 了 新开中转站,有 GPT 包月可以薅,分享给有缘人 google 搜索的 AI 模式(自动右侧弹出)是个谜啊? 小红书下场做 app 工厂 做了一个 GEO 工具平台,想听听大家对 AI 搜索优化的看法 XChat 正式上架 App Store 了 大 F 彻底沦为历史了,公司宣布停业。 记一次 QQ 被盗事件记录 codex 5.5 强的离谱 用 Claude 做了视频“关于 ping0.cc 静默上传用户真实 IP” AI 辅助英语学习,无推广,讨论一下 gpt5.5 写完界面,还会进行截图查看效果 DeepSeek4 的数据没清理好啊,估计有得折腾 做了一个自动识别云朵的网站 claude 太抠门了 继上次讨论自媒体问题后,我决定下架流量最大的视频 DeepSeek V4 上线了! deepseekv4 来了 DeepSeek V4 正式发布了! 搞起,试试试试!附官网更新的模型链接 模型之外, Codex 也更新了 Auto-review 功能,不用 Full access 了 DeepSeekV4 来了, 希望可以抗衡御三家 DeepSeek V4 上了,连发布会都省了 DeepSeek V4 终于来了,是牛子是马拉出来溜溜 一个性价比极高的数据冷备份路子 苹果中国官网挂了 Gemini One 免费 4 个月邀请链接,,稳不稳 今日乐子:天星银行(AirStar)改名象象银行(Elebank) 分享两个我刚开源的 Codex 插件: Spec 驱动开发 + 飞书知识库接入 “WildCrad 余额兑换 gpt 会员”, Gemini 警告“疑似诈骗” 支付宝的神券团购怕是自己都没用过吧 《 AI 带来的革命性改变,为何还没发生 》 分享一个用自然语言整理 Chrome 书签的小工具 微信聊天记录时间 BUG 我觉得比这个什么问界趴窝更奇葩的是这个豆包 AI,看完雷军得被当场气晕 使用中转站要擦亮眼睛!不说别的,倍率计算 充值好乱。 DeepSeek API 更新新模型了? 图一乐 Prompt|让 GPT-Image-2 根据记忆为你设计一个书房 vibe 了一款记忆训练游戏 3 月工作了 269 个小时,于是奖励了自己一辆唐 L EV 我怀疑最近有人拿 v 站当小红书来使了 简单分享下自己回农村后试图搞短视频/直播电商的经历 codex 新模型 大家有更新吗 收集一下对老年人友好的记忆类的小游戏 超顶! GPT-Image 2 图像模型全量上线,很强大 问一下你给 AI 的印象,估计大家估计都是 tony Stark opus 4.7 消耗太快了 说个暴论: gpt plus 比 5x claude code 还耐用啊 今天不小心把 typc-c 线插进电脑 usb-A 母口了,还是不够“防呆” 安徽宿松未婚生子退彩礼案会不会给一些人提供了思路? [填坑] 德国沃达丰 eSIM 手机号充值 & 保号教程 避雷这个中转站,三天两头不行,还不退款 你见过 AI 被“逼疯” 了吗? 手机贴膜之 类纸膜 [虚拟机挂微信也会掉线] 下文 谷歌商店的 Mi Fitness 似乎不能连接国行的小米手环了 招商银行真是奇葩,半夜三更偷偷给你的银行卡签约在线支付 小米+ iPhone 双持体验分享 Aniu——利用 AI 进行全自动操作模拟仓炒股的程序 为什么你该停止使用 Ollama 亲测已撸|成功拿下德国 O2 eSIM 卡申请记录分享 [开源分享] transpec,开发框架转换工具 使用 bitwarden 导致 Chrome 浏览器卡顿的问题 Claude Design 新发现? qwem3.6 35b a3b 官方模型写刘备文 6 得很 [开源]浏览器里设计 3D 键盘,打开就能玩 今年的 lenny newsletter 年订阅大包 大家觉得值不值? 签到 bug 正好在整十日 喜大普奔, authy 可以收到验证码了 再开一贴,讨论 claude code 的平替 qq 邮箱居然开始有广告了 通过 AI 编程 Token 用量,也能“大概”能看出你靠 AI 的盈利能力 openai 注册不需要手机号了,日本、美国节点测试都可以 中转站三步曲 看看你的中转站到哪一步了 Codex 这个申请权限的交互好有意思 移动下场了。免费送一个月 coding Plan(3w 次调用) Codex 又更新了 我的语言学习,基础打好后,学习就会变得无痛 浅试了一下 Qwen3.6-35B-A3B,很强 DESIGN.md 被反诈拦截 第一次在自媒体上赚到钱 用回测筛选因子的一点经验分享 阿里百炼平台上 glm5.1 了 花了两周整理了一份比特浏览器(BitBrowser)中文指南,从下载到指纹防关联全覆盖 v2ex 是 good hacker for spamming program 🤣 我发现支付宝新推出的 AClaw 能够解决账单自动导出的难题! 慢讯, Gemini 推出 Mac 客户端 分享一个自己做的 Nginx 可视化配置工具,实时请求动态预览! [实测生产环境稳定运行半年以上没毛病] claude code 会话团队 hermes 抄袭中国团队 EvoMap 的开源引擎 Evolver
MIMO 这个是写得真好。里面提到 agent coding 几乎每个痛点我都遇到过
tf2 · 2026-06-11 · via 分享发现
mxT52CRuqR6o5

1

mxT52CRuqR6o5      2 天前

光靠 goal 不是能完全解决做没做完,还得加上目标可验证
我这边有个目标明确但难以验证的任务,我现在完全不知道怎样才能让 AI 把这个任务做完,也不知道到底做到什么程度才算做完,你每次下达任务 AI 都能往前前进一些

xuyang2

2

xuyang2      2 天前

> MiMo Code + MiMo-V2.5-Pro outperforms Claude Code + Claude Sonnet 4.6 across all three evaluations.

为啥不放跟 Claude Code + Claude Opus 4.6 的对比

shunia

3

shunia      2 天前

@mxT52CRuqR6o5 #1 不知道怎么验证不也可以问 AI 吗?
有现成经验的且不说,如果确实是没有现成可以借鉴的,可以和 AI 一起头脑风暴,迭代几轮,怎么样都比卡住不知道怎么办要好很多。

hidemyname

4

hidemyname      2 天前

@xuyang2 #2 在编程上别说 mimo 2.5pro 和 opus 对比了,你让 glm 5.1 和 qwen 3.7 max 比比试试,吹的飞起,用起来还是比不过;

shunia

7

shunia      2 天前

它这个 blog 写的意外的好,言简意赅,只不过越往下读 AI 味儿越重,笑死个人。
希望再出一篇技术细节详解,这篇有些部分写的还是太笼统了。

FantaMole

8

FantaMole      2 天前

从它这个跑分来看 Mimo Code + 2.5 Pro 和 Mimo Code + 2.5 没有拉开本质差距啊,工程化做的有这么好?

tf2

9

tf2      2 天前

@FantaMole 原文

需要说明的是,这些 Benchmark 衡量的仍是对单个仓库级问题的一次性解决能力。MiMo Code 的多数设计目标——多轮记忆、后台状态维护、完成度验证、跨 session 进化——主要体现在持续几十轮的真实开发场景中,这些优势需要在实际使用中才能充分体现。

FantaMole

11

FantaMole      2 天前

@tf2 就这个意思就让我觉得很...我抓不住他们的宣传重点在哪,意思是这个 Mimo Code 的 harness 做的很好,在长任务使用下即使自家模型不行,但仍能超越其他模型?还是能补齐能力较差的模型短板,让 V2.5 也能在普通任务赶超 V2.5 Pro ?但是这个 CLI 又不收钱,那我用 Sonnet 配 Mimo Code 岂不是无敌了,干嘛要用他们家的模型,能打出组合技吗

tf2

12

tf2      2 天前

@FantaMole 你要从宣传的角度去理解,那直接输。。

我的理解就是 V2.5 pro 有的时候就是想得太多。V2.5 指令遵循比较强,有的时候反而更加反应快。

我现在是复杂问题分析给 pro ,写好 plan 就直接 v2.5 上手改

wkend

14

wkend      2 天前

mimo 这几天用起来感觉还不错,改错的时候就给你解决错误,基本不会产生新问题,把送的 token 用完了,买了字节的方舟 plan ,试了试 kimi ,发现改错长生新问题的概率比 mimo 多,对代码动作比较大

kongkongye

16

kongkongye      1 天前

@shunia #7 往下读着读着感觉不太对劲,像翻译 cc 的文章而来,差点以为是 cc 相关功能的中文翻译版了