惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
T
ThreatConnect
SecWiki News
SecWiki News
F
Future of Privacy Forum
AWS News Blog
AWS News Blog
C
Cisco Blogs
A
Arctic Wolf
Vercel News
Vercel News
The GitHub Blog
The GitHub Blog
Scott Helme
Scott Helme
V
V2EX
博客园 - 叶小钗
阮一峰的网络日志
阮一峰的网络日志
K
Kaspersky official blog
G
Google Developers Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
P
Privacy International News Feed
C
Cyber Attacks, Cyber Crime and Cyber Security
N
News | PayPal Newsroom
Schneier on Security
Schneier on Security
NISL@THU
NISL@THU
Microsoft Azure Blog
Microsoft Azure Blog
量子位
The Hacker News
The Hacker News
Stack Overflow Blog
Stack Overflow Blog
Security Latest
Security Latest
M
Microsoft Research Blog - Microsoft Research
Google Online Security Blog
Google Online Security Blog
博客园_首页
C
CXSECURITY Database RSS Feed - CXSecurity.com
I
InfoQ
Google DeepMind News
Google DeepMind News
Y
Y Combinator Blog
The Cloudflare Blog
Microsoft Security Blog
Microsoft Security Blog
Martin Fowler
Martin Fowler
Cisco Talos Blog
Cisco Talos Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
Troy Hunt's Blog
F
Fox-IT International blog
S
Security @ Cisco Blogs
博客园 - 司徒正美
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Comments on: Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
L
LINUX DO - 最新话题
GbyAI
GbyAI
Project Zero
Project Zero
腾讯CDC
T
Tailwind CSS Blog

IT之家

华为何刚:FreeClip 2 典藏版耳夹耳机还有专属星海蓝、珠光银双配色 福特烈马亚马逊限量版 SUV 上市:原厂涉水喉,39.98 万元 - IT之家 法式复古踏板摩托车:9980 元起标致 Django Compact 正式上市,配双通道 ABS 续航近 300 公里 北京将推广手术机器人租赁模式 - IT之家 华为余承东官宣黄渤、于和伟成为鸿蒙智行问界 M9 品牌大使 - IT之家 12.99 万元起 2026 款比亚迪海狮 06 DM-i 正式上市:满油满电综合续航 1845km 问界 M9 成为中国制造“十四五”成就展唯一入选新能源汽车,与 C919、福建舰等大国重器并列展出 - IT之家 京东拼拼小程序更名“京东折扣超市”,统一品牌实现线上线下一体化运营 - IT之家 摩根士丹利:全球人形机器人出货约 90% 来自中国,有望成为下一个电动汽车产业 - IT之家 小米推出 1499 元米家无线吸尘器 4 Pro:230AW 大吸力,以旧换新 1219 元 约 1000 行代码搭起网页 AI 智能体:微软 Webwright 让 GPT-5.4 跑分提升 81% 荣耀王飞:耳夹耳机不需要区分左右耳绝对是提升体验极好的功能 - IT之家 微软 14 页文档披露:Win11 定位 AI OS,成为企业工作流“智能画布” 九州风神预告单塔均热板风冷散热器冰立方 AK700 VC - IT之家 传音 Infinix 发布 Hot 70 手机:配色随温度变化,6000mAh 电池 小米汽车发布 Xiaomi Auto World Model 世界模型全新框架:重建 + 生成一体化,主流基准测试全面 SOTA 酷冷至尊冰神 B360 TV 水冷散热器发售:6" 960×480 LCD 屏,699 元 酷凛推出 AM-120 散热风扇:环状 7 扇叶结构,黑白双色售价 59/64 元 国内首创:首台鲜食蚕豆采收机器人研发成功,采收成功率超过 90% - IT之家 鸿蒙智行全新一代问界 M9 汽车华为途灵龙行平台宣传视频陷 AI 争议,现场实拍画面曝光 约 80GB 大小:Steam 和 Xbox 版《007:初露锋芒》游戏不支持预载 Perplexity 开源内部安全扫描工具 Bumblebee,助力行业应对软件供应链投毒 - IT之家 谷歌回应 Antigravity 用户额度抱怨:重置配额,推出 Gemini 3.5 Flash(Low) 三体公司原 CEO 许垚被执行死刑:毒杀游族网络创始人林奇 - IT之家 北京配置 15.9 万个新能源小客车指标:家庭中签率约 36.5%,入围分数创历史新低 - IT之家 老车主痛点解决:鸿蒙智行问界汽车五月 OTA 开推,新增支持方向盘音量调节选项设置功能 - IT之家 消息称英特尔加码玻璃基板,新墨西哥州工厂瞄准全球首座量产基地 - IT之家 比亚迪仰望 U7 获推 OTA 升级:新增哨兵模式高风险视频云端传输、智能蟹行等 LEOPOLD 推出数字小键盘 FC220TP PD,支持三模连接 - IT之家 突破 300℃ 服役瓶颈,中国科学院金属所研发新型耐高温、高强、高模铝基复合材料 - IT之家 没有退路就是胜利之路:何庭波称基于韬定律华为有了加速度,只会越来越好 - IT之家 联想小新 Air 13/15 上架预约:搭载全新英特尔酷睿 5 320 处理器 特斯拉超级充电卡向非特斯拉车主开放:尝鲜版 79 元 50 度电,畅享版 599 元 400 度电 微软确认三星图库 9 月 30 日起停止直接同步至 OneDrive 思特威、紫光展锐联手布局 MicroLED 高速光互连,打造国产化 AI 算力集群短距高速互连方案 vivo 首款无线头戴降噪耳机官宣 5 月 29 日发布:238g、跨生态无缝三连接 首款真无线水冷:华硕推出 ROG 飞龙 4 无线水冷,支持触点式无线快接 用户反馈智能家居版谷歌 Gemini AI 短板:猫当成浣熊,袋鼠识别为“人” - IT之家 Finalmouse 公布 Starlight X 鼠标:11 年来首款全新模具,TMR + 机械微动 华为 FreeClip 2 典藏版耳夹耳机官宣 6 月 1 日与 nova 16 系列手机同台发布 苹果 M6 MacBook Pro 爆料:升级均热板设计、优化风扇散热 终审落槌:“北京汽车制造厂”不能再用“北汽”字样,赔偿北汽集团 30 万元 - IT之家 利民推出 GN 系列金牌全模组电源:日系三大厂主电容,5 年质保 - IT之家 小米 YU7 标准版汽车正式开启交付:家族设计 + 蛟龙底盘,23.35 万元起 万代南梦宫《艾尔登法环》电影片场视频泄露,康威城堡变“风暴城” - IT之家 中国软件评测中心:预测今年我国养老机器人市场规模将破百亿元 - IT之家 外媒测试英特尔酷睿 9 273PQE 处理器游戏表现,未明显领先 i9-13900K 天钡推出 i5 1235U 款 NAS 主机 WTR MAX,M.2 带宽有所调整 腾讯深圳新总部“企鹅岛”已有 1.4 万人“上岛”,员工可享 2000 元档公寓租金 鸿蒙智行问界 M6 汽车上市首月交付量突破 2 万台,售价 25.98 万元起 工信部:截至 4 月末我国 5G 基站数首次突破 500 万个,5G 移动电话用户超 12.62 亿 小米 17T/Pro 手机渲染图再曝,时隔 4 年重返印度市场 酷冷至尊 Hyper 612 APEX Pro ARGB 版 CPU 风冷散热器开售,429 元起 贾跃亭 FF 最大的人形及仿生机器人销售订单诞生,红杉教育直接签订 23 台 海尔发布全球最轻 AI 运动外骨骼机器人:仅重 1.75kg,单腿最大助力 16N·m 星河动力智神星系列火箭发射工位(一期)正式竣工 - IT之家 结束两个月的付费独占:周杰伦新专辑《太阳之子》登陆苹果 Apple Music 国区 - IT之家 京东红包今日 10:00 再加码,猜拳至高赢 5 元 “粉木耳”包装设计被指低俗擦边?盒马致歉:全部下架、坚决反对低俗不良信息 - IT之家 小米 REDMI K90 至尊版疑似入网,支持 100W 有线充 AOC 方小白 V6 系列“U27V6RL / WW”27 英寸显示器开售:4K 80Hz / FHD 310Hz 双模,1799 元 森海塞尔推出 MOMENTUM 5 Wireless 头戴式耳机,降噪增强多达三倍 索尼因顽皮狗在本世代未能推出新作而感到不满,《星际:异端先知》发售遥遥无期 - IT之家 惠普调查 BIOS 更新故障,EliteBook / ZBook 部分机型启动卡死 抖音:过去一年在谣言治理工作中引入大模型技术,谣言被处置时平均浏览量下降 62% - IT之家 DriftGuard 宣称破解 XBOX 手柄校准限制:支持全系型号、结果永久写入内存 - IT之家 唯卓仕发布 Vintage Z1 Pro 闪光灯:最高 1/8000 秒快门同步、支持 TTL,289 元 微信鸿蒙版 App 发布 8.0.18.17 邀测升级 悉尼灯光节表演发生技术故障,近 90 架无人机坠海 - IT之家 扫码扔垃圾能赚钱?我国 297 城居民小区垃圾分类基本实现全覆盖,智能回收与 AI 焚烧加速推进 消息称 Anthropic 酝酿公开上线最强模型 Mythos,短暂现身 Claude Code 直播间摆拍绑架?公安部网安局集中通报 5 起网络谣言典型案例 - IT之家 互联网广告乱象频发:虚假宣传、AI 伪造专家,用“医用级”当噱头骗宝妈 - IT之家 Torvalds 再发飙:AI 干扰 Linux 内核节奏,撑大 RC5 体量 腾讯《洛克王国:世界》发布优化通知,称后续版本更新将杜绝关键调整未进行公告的情况 - IT之家 不换设计直接降温:SK 海力士发布控温散热存储技术“iHBM”,降低热阻超 30% - IT之家 Kimi K2 系列模型 API 官宣下线,将不再维护和支持 微软敦促 Win11 用户升级安全启动证书,旧版下月到期 - IT之家 Anthropic 新模型震动金融圈,欧洲央行紧急开会要求升级网络防御 - IT之家 小米汽车晒 YU7 GT“情绪体验”:含专属主题、设计等,运动声浪支持 40W 外放 苹果 iPhone 17 Pro 首次全场直播足球赛:特写更沉浸、广角较吃力 演都不演?黄仁勋批评 CEO 以 AI 为由裁员“只是为了显得自己很聪明” Netflix《赛博朋克:边缘行者 2》首支预告片官宣 7 月 4 日发布 爱玛 × 华为达成合作,两轮车有望支持智能行车辅助系统、星闪等技术 - IT之家 IT早报 0526:华为高端芯片 2031 年剑指 1.4 纳米;抖音副总裁李亮辟谣短视频“猪食论”传言;华为麒麟 2026 芯片峰值频率首超 3GHz;稚晖君正式担任上纬新材董事长... 创纪录:欧盟将对谷歌开出近 10 亿欧元反垄断罚单 - IT之家 免费游戏《坦克世界:HEAT》今日登陆 PS5、Xbox、Steam,支持中文和跨平台联机 - IT之家 荣耀 Earbuds 耳夹式耳机 Pro 支持自适应左右耳佩戴,王飞称不会有标出 L / R 的左右脑互搏问题 法拉利首款纯电车型 Luce 登场,前苹果设计师 Jony Ive 参与打造 美国政府诉苹果反垄断案再起波澜:苹果称 DOJ“程序性拖沓”并要求法院介入 - IT之家 OpenAI GPT-5.6 模型曝下月发布:AI 上下文 150 万 tokens,优化前端界面生成 全球首个!我国 6G 试验频率获工信部批复,有望在 2030 年前后正式商用 首个海外品牌:海盗船 DDR5 内存条被发现采用长鑫 DRAM 芯片 加文 · 贝克最新对话,细谈前沿模型、晶圆及巨头格局:如果只能盯一个指标来判断 AI 泡沫,我会盯台积电产能决策 小米汽车:YU7 GT 目前暂无登陆《跑车浪漫旅 7》游戏的计划 - IT之家 小米米家洗衣机 Pro 波轮 10kg 开售:1.28 洗净比、9 重减震降噪,899 元 Galaxy S26 Ultra 手机装上骑仕 V3 Pro 手柄,三星、雷蛇在中东及北非发起联动 33 岁智元机器人 CTO“稚晖君”彭志辉出任上纬新材公司董事长 - IT之家 过河拆桥?扎克伯格一边计划裁员,一边称“让 Meta 员工参与训练 AI 效果更好” 需求疲软,日产旗下子公司取消在英国生产电动汽车动力总成计划 - IT之家
谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
2026-05-26 · via IT之家

IT之家 5 月 26 日消息,谷歌 DeepMind 最新推出 AlphaProof Nexus,结合大语言模型(LLM)生成证明与 Lean 形式化验证,在 353 个开放的 Erdős 问题中自主解决 9 个,并解开 2 个悬而未决 56 年的问题。

IT之家注:Lean 是一种形式化证明语言和证明助手系统。研究者可以把数学命题、定义和证明步骤写成严格可检查的代码,编译器会逐步判断每一步是否合法。

Erdős 问题(Erdős problems)是由 20 世纪最高产的匈牙利数学家保罗 · 埃尔德什(Paul Erdős)提出的一系列数学猜想和问题,涵盖组合数学、数论、图论和几何等领域。

根据谷歌论文内容,AlphaProof Nexus 在 353 个开放的 Erdős 问题中解决了 9 个,其中 2 个问题已悬而未决 56 年。

Six charts plotting solve rate (Y-axis) against mean cost in USD (X-axis) for Erdős problems 12(i), 12(ii), 125, 138, 152, and 26. Four agent variants are color-coded: (A) basic in blue, (B) basic with AlphaProof in orange, (C) basic with evolution in green, and (D) full in red. Numbers at data points indicate the number of sub-agents. On easier problems, all variants converge at high solve rates; on harder problems like erdos_125, solve rates stay low overall but rise with more sub-agents and higher cost.

AlphaProof Nexus 还在 OEIS(整数序列在线百科全书)的 492 个开放猜想中证明了 44 个,解决 1 个存在 15 年的 Hilbert 函数问题,并改进了凸优化中的已知界限。每个问题的推理成本只要数百美元。

在架构方面,AlphaProof Nexus 由 4 个复杂度递增的 AI 智能体组成:

  • Agent A 只依赖 Gemini 3.1 Pro 与 Lean 编译器循环交互。

  • Agent B 接入 AlphaProof,补全缺失证明片段。

  • Agent C 加入类似 AlphaEvolve 的进化机制,让多个证明草稿共享、评分、排序。

  • 功能最完整的 Agent D 则整合了上述能力。

原本用于攻克 Erdős 问题的是 Agent D,但研究者发现,最简单的 Agent A 其实也能证明这 9 个已解问题,只是在最难题目上花费更高。

Three-column diagram showing AlphaProof Nexus's proof process for Erdős problem #125: on the left, the Lean input file with EVOLVE-BLOCK markers and a sorry placeholder; in the center, the prompt with prior attempts, Elo ratings, and the current plan; on the right, the step-by-step proof with chain-of-thought reasoning, search-replace operations, AlphaProof calls, and final validation of all six sub-goals.

研究团队认为,这反映出 2 点变化:底层模型能力持续提升,以及编译器反馈对 LLM 推理的“锚定”作用越来越强。

IT之家附上参考地址

相关阅读:

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。