惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
T
ThreatConnect
SecWiki News
SecWiki News
F
Future of Privacy Forum
AWS News Blog
AWS News Blog
C
Cisco Blogs
A
Arctic Wolf
Vercel News
Vercel News
The GitHub Blog
The GitHub Blog
Scott Helme
Scott Helme
V
V2EX
博客园 - 叶小钗
阮一峰的网络日志
阮一峰的网络日志
K
Kaspersky official blog
G
Google Developers Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
P
Privacy International News Feed
C
Cyber Attacks, Cyber Crime and Cyber Security
N
News | PayPal Newsroom
Schneier on Security
Schneier on Security
NISL@THU
NISL@THU
Microsoft Azure Blog
Microsoft Azure Blog
量子位
The Hacker News
The Hacker News
Stack Overflow Blog
Stack Overflow Blog
Security Latest
Security Latest
M
Microsoft Research Blog - Microsoft Research
Google Online Security Blog
Google Online Security Blog
博客园_首页
C
CXSECURITY Database RSS Feed - CXSecurity.com
I
InfoQ
Google DeepMind News
Google DeepMind News
Y
Y Combinator Blog
The Cloudflare Blog
Microsoft Security Blog
Microsoft Security Blog
Martin Fowler
Martin Fowler
Cisco Talos Blog
Cisco Talos Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
Troy Hunt's Blog
F
Fox-IT International blog
S
Security @ Cisco Blogs
博客园 - 司徒正美
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Comments on: Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
L
LINUX DO - 最新话题
GbyAI
GbyAI
Project Zero
Project Zero
腾讯CDC
T
Tailwind CSS Blog

雷峰网

石头科技入选2026福布斯中国DTC跨境影响力品牌,本土化运营链接全球市场 | 雷峰网 阿里云加速AI出海,发布全新海外AI产品官网Qwen Cloud | 雷峰网 两个月融资4亿美元,国际资本与产业资本同时加码零一汽车 | 雷峰网 北纬诺贝巅峰对话|乔·韦曼走进中关村两院,深度解读AI时代企业增长新逻辑 | 雷峰网 一台手掌大小、300克的AI主机,为什么能跑122B模型? | 雷峰网 把18A塞进主流轻薄本,英特尔「WildCat Lake」想让人人用上AI PC | 雷峰网 速卖通Brand+开放韩国站:2026市场投入激增至3倍 | 雷峰网 港中文李鸿升团队论文 MindVLA-U1:VLA 不再输给 VA,语言真正进入自动驾驶决策 | 雷峰网 华为发布AIDC数据基础设施全栈方案,覆盖数据湖至智能体框架五大层级 | 雷峰网 独家丨AWS大中华区战略客户团队负责人、L8高管顾凡将加入支付巨头Visa | 雷峰网 独家解读丨Anthropic每赚100块,为何会被马斯克顺走50? | 雷峰网 小鹏副总裁:小鹏可能是唯一欢迎特斯拉FSD入华的车企;有员工喊出「学三星罢工」!曝台积电Q1净利大增58%反降薪;DeepSeek一月内宕机三次 | 雷峰网 数字华夏发布新一代人形机器人“星行侠P2”,加速机器人场景落地 | 雷峰网 何小鹏的赌局:GX狂降12万,换一场不能输的冲高 | 雷峰网 十年出货超10万台,越疆以全栈自研与数据闭环布局具身智能 | 雷峰网 独家丨前美团外卖技术负责人入局餐饮具身模型,「元节智能」获千万级种子轮融资 | 雷峰网 安克消噪耳机搭载AI音频芯片Thus™ A1,获吉尼斯“最清晰通话”认证 | 雷峰网 联想中国基础设施业务上财年实现两位数增长 刘军解读背后四大驱动力 | 雷峰网 Manus创始人计划融资10亿美元回购公司;曝知名招聘平台主动申请破产;特斯拉官宣:监督版FSD登陆中国! | 雷峰网 寻找 AI 的「第三语言」:中间表示如何打通多模态鸿沟 | CVPR 2026 谷歌掀桌,一口气甩出16个AI王炸 | 雷峰网 Anthropic 花 3 亿美金买下 API「修路工」,打响连接层暗战 我们不看阿里财报 | 雷峰网 FSD入华前奏?曝特斯拉国内9城急招智驾测试员;曾对标乔布斯!大疆的对手GoPro要被卖了:3年亏损近40亿;字节Seedance 2.1即将发布 | 雷峰网 对标特斯拉FSD,Momenta借势出海 | 雷峰网 DeepSeek组建Harness团队,非「超能力者」不要?中国AI开启「做产品」的关键一跳 | 雷峰网 清华大学 X 追觅扫地机:共建校级实践基地,开启顶尖工程师“养成计划” | 雷峰网 独家丨腾讯云国际中东和北非区域副总裁胡丹离职 | 雷峰网 阿里云为什么「重构自己」? | 雷峰网 OpenAI放弃的事,为什么阿里可能做得成 | 雷峰网 阿里国际接近盈利背后,速卖通品牌化与AI提效双线并进 | 雷峰网 对话朱郴:深度拆解金山办公2026民企分销渠道打法 | 雷峰网 抖音“前沿科技首发计划”启动,首站落地Google I/O 2026大会 | 雷峰网 拿下韩国市场跨境平台第一!速卖通持续加码韩国市场 | 雷峰网 我在矿山深处送拼多多快递 | 雷峰网 万字长谈丨同济工智院华先胜:工程智能,是 AI 的「成人礼」 | 雷峰网 复旦可信具身智能研究院&上海交大:给自动驾驶装上可检索的「空间记忆」丨CVPR 2026 | 雷峰网 商汤国香资本合伙人李扬:GPU估值翻倍、RISC-V站上台前,资本如何锁定确定性? | 雷峰网 万字长谈丨同济工智院华先胜:工程智能,是 AI 的「成人礼」 | 雷峰网 智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速 | 雷峰网 7.3折!近5年折扣力度最大的一届天猫618,5月21日正式开卖 | 雷峰网 有人凌晨4点收到解雇信…Meta全球再裁8000人,赔偿方案曝光;沉寂半年露面!东方甄选前CEO孙东旭直播卖书;长鑫科技IPO,5月27日上会 | 雷峰网 全球首部95分钟AI长片将在戛纳电影节首映,由Seedance 2.0制作 | 雷峰网 拆解有道“子曰4”全量开源:如何通过重构思维链打下落地成本? | 雷峰网 国产GPU进军AIPC:铠大师与摩尔线程达成生态共建合作 | 雷峰网 2026 字节跳动奖学金启动!首次开放全球申请,奖励名额增加 | 雷峰网 上线一周登顶 Skill 商店热榜,AnySearch 正在重构“AI 时代搜索引擎” 从宜宾走向全球,MOVA智能制造基地正式量产 | 雷峰网 独家丨AWS大中华区顾凡、凌琦、朱翊三位 L8 高管离职 | 雷峰网 2026上半年最大IPO:Cerebras 上市,撕开美股「五大AI阵营」权力裂缝 | 雷峰网 阿里云面向Agentic时代全面升级,重磅发布全新“芯-云-模型-推理”技术体系 | 雷峰网 贝塔无限连续完成种子轮、种子+轮数亿元融资,以系统工程重构消费级具身智能 | 雷峰网 趋境科技完成数亿元 Pre-A 轮融资,加速建设高品质 AI Token 生产基础设施 全场景L4级自动驾驶第一股!驭势科技港股上市,引领L4级自动驾驶规模化落地 | 雷峰网 “声智融合、智启未来”全场景语音AI技术与产业发展战略研讨会在北京大学成功召开,开启语音交互的未来生活方式 | 雷峰网 独家丨大疆首款全景无人机上市以来全球出货量超12.5万台,市占率超98% | 雷峰网 Ozon Global调研:超七成俄买家认可中国商品质量改善,评价超越价格成首选中国商品依据 | 雷峰网 代码驱动的视觉感知:为什么说「看得懂代码」才是大模型攻克理科题的真正钥匙 |CVPR 2026 | 雷峰网 理想汽车×火山引擎:AI智能助手纵深防御体系,为AI系上“安全带” | 雷峰网 出海四小龙合围亚马逊!全球电商流量前三AliExpress、Temu占两席 | 雷峰网 权威报告:中国AI云市场爆发,阿里云占比38.1%稳居第一,超二三四名总和 | 雷峰网 端启未来 万物新生||江原科技携新品亮相2026全球人工智能终端展 | 雷峰网 自动跟价再打八折引商家不满,京东采销怒斥:可去竞对平台寻找机会;Meta 计划全球裁员约7800人,AI转型引员工抗议;马斯克告OpenAI败诉 | 雷峰网 20万级满配运动SUV昊铂S600开启预售,权益价18.89万起 | 雷峰网 “6·18”观察丨自动跟价再打八折,京东采销怒斥商家群聊截图惹争议:“可以去竞对平台寻找机会” | 雷峰网 百度2026年Q1:总营收321亿元 AI业务占比达52% | 雷峰网 Figure机器人直播干活一整天,效果越惊艳,质疑越凶猛 | 雷峰网 2027年迈向十万台产能:矩阵超智开启具身智能量产元年 | 雷峰网 一封律师函引发的GitHub风暴:拓竹为何惹毛了全球极客? | 雷峰网 对话关梦龙:他想用 Agent 拯救你手机里的 100G 废片 快手装不下可灵了 | 雷峰网 魔法原子惊艳亮相戛纳 中国智造登临国际顶级文化盛典 | 雷峰网 豆包上线博物馆讲解模式,官方合作覆盖超20家头部博物馆 | 雷峰网 AI座舱热度持续攀升,佑驾创新引领智能座舱进入大模型时代 | 雷峰网 京东上海总部大楼「歪」了?最新通报:涉事工地已停工;话费直接扣?三大运营商齐发Token服务;卢伟冰:下半年不少国产旗舰手机将超万元 | 雷峰网 2026 Shokz Day圆满收官:韶音以「随我动听」开启全场景声态新时代 | 雷峰网 奇安信集团与北京八中签署战略合作协议 青少年人工智能安全培养基地正式揭牌 | 雷峰网 CVPR 2026 自动驾驶与协作智能梳理:模型正在走向可控真实世界 | 雷峰网 CVPR 2026 视频模型趋势梳理:不止生成下一帧,更要理解下一步 | 雷峰网 从外购到自研:中国车企夺回底盘定义权 | 雷峰网 智界V9上市发布:重塑MPV高端市场格局 | 雷峰网 CVPR 2026 四篇论文透视:大厂如何靠「算法瘦身」对抗算力涨价? | 雷峰网 追觅造车再遇坎坷:主体公司股权被冻结232万,实控人为追觅科技CEO俞浩 | 雷峰网 OpenClaw预示未来:智能体角色范式转变,AI需要具备执行能力 | 雷峰网 桌面CNC元年:资本疯抢「小拓竹」,五轴是风口还是伪命题? | 雷峰网 首次披露!载合卡车完成10亿元级战略融资,开创车云一体AI重卡全新赛道 | 雷峰网 果粉大喜!苹果深夜官宣降价:iPhone17Pro进入6000元档 ;传前华为车BU总裁被架空,千里科技高层震荡持续;虎鲸文娱旗下妙鸭相机团队解散 | 雷峰网 马斯克幼子虎头包走红,淘宝店主:店铺已经开了19年,销量翻了十几倍 | 雷峰网 端侧智能体迈入拐点,联发科如何把AI平台做成可交付的能力? | 雷峰网 对话销售易总裁邓永富:借力腾讯,能否在SaaS大洗牌中「攒足」筹码? | SaaS+Agent十人谈 | 雷峰网 芯驰科技完成近1亿美金C轮融资,加码汽车到具身智能全栈「芯」突破 | 雷峰网 独家丨望圆科技IPO只差临门一脚,权力交班暗藏风险 | 雷峰网 阿里财报:速卖通Brand+加速品牌接入,活跃买家渗透超30% | 雷峰网 文远知行最新财报:「高筑墙、广积粮」,营收超预期,Robotaxi用户规模翻倍 | 雷峰网 马化腾:腾讯AI发展不急于乱抢地盘,过去抢别人地盘基本失败了;思科拟裁员约4000人,投入更多资源到AI;林俊旸被曝创立新AI实验室 | 雷峰网 全球AI药物递送第一股剂泰科技挂牌港交所,“制药界Space X”开启生物制药新纪元 | 雷峰网 李佳琦:今年天猫618补贴预算再加30% | 雷峰网 联发科技×阶跃星辰,音乐大模型可视化部署,AI适配效率迎来质的飞跃 | 雷峰网 “收钱”Skill来了!度小满发布 ClawPay | 雷峰网 阿里云外部收入增长40%创新高,AI收入占比首破30% | 雷峰网
Code Arena放榜:阿里千问3.7编程能力超越GPT、Gemini,仅次于Claude系列 | 雷峰网
2026-05-26 · via 雷峰网

5月26日凌晨,全球权威三方编程榜单Code Arena放榜,阿里最新旗舰模型Qwen3.7-Max得分1541,超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一众模型,仅次于Claude系列,在大模型厂商中排名全球第二,这也标志着在代码理解与生成领域,千问3.7成功跻身全球编程模型第一梯队。

 Code Arena放榜:阿里千问3.7编程能力超越GPT、Gemini,仅次于Claude系列

图说:Code Arena榜单显示,凭借Qwen3.7-Max,阿里位列全球第二 

编程能力是当下模型智能水平的核心指标,而Code Arena是由知名第三方大模型盲测平台LMArena推出的最具影响力的榜单之一。与传统的代码基准测试不同,Code Arena并不考核孤立的代码片段生成或传统算法题,而是由开发者出题,要求模型从零生成完整的、可交互的Web应用程序,并交由用户对匿名模型的生成效果进行两两PK,由投票综合生成榜单,因此Code Arena也被认为是目前全球最具公信力的AI编程能力评测之一。经全球开发者以真实使用体验盲测投票,千问3.7模型编程能力位居前4,打破由Claude-Opus-4.7和4.6统治已久的前四格局,Qwen3.7-Max也成为目前榜单中唯一突破1540分大关的国产大模型。

据了解,面向Agent打造的Qwen3.7-Max在编程、智能体、长程任务等核心能力上实现了大幅突破,不但能在数小时内独立完成专业团队耗时2周的复杂项目端到端交付,大幅提升办公自动化和企业级生产力,甚至可以持续运行35小时、累计超1000次工具调用的复杂长程任务,自我编程优化芯片内核。

Qwen3.7-Max发布后迅速在全球引发强烈反响。大量独立开发者、AI创作者、企业用户第一时间在社交媒体上分享了测评结果:多位开发者评价其"长程自主执行能力令人印象深刻""是真正能把事情做完的智能体基座模型";有AI机构在相同提示词下同步横评了Qwen3.7-Max、Claude-4.7与GPT-5.5,发现千问3.7较上代的性能提升幅度最大、推理成本最低,在输出速度和生成质量两个维度上相较其他模型均有明显优势。

雷峰网(公众号:雷峰网)

雷峰网版权文章,未经授权禁止转载。详情见转载须知