惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
WordPress大学
WordPress大学
T
Tailwind CSS Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
C
CXSECURITY Database RSS Feed - CXSecurity.com
宝玉的分享
宝玉的分享
T
Threatpost
Google DeepMind News
Google DeepMind News
N
News and Events Feed by Topic
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
The Cloudflare Blog
Microsoft Azure Blog
Microsoft Azure Blog
云风的 BLOG
云风的 BLOG
Recent Announcements
Recent Announcements
NISL@THU
NISL@THU
MongoDB | Blog
MongoDB | Blog
美团技术团队
大猫的无限游戏
大猫的无限游戏
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
博客园 - 三生石上(FineUI控件)
B
Blog RSS Feed
Spread Privacy
Spread Privacy
W
WeLiveSecurity
Recorded Future
Recorded Future
D
DataBreaches.Net
The GitHub Blog
The GitHub Blog
P
Privacy International News Feed
P
Proofpoint News Feed
A
Arctic Wolf
Vercel News
Vercel News
D
Docker
L
LangChain Blog
C
Cybersecurity and Infrastructure Security Agency CISA
V
Visual Studio Blog
U
Unit 42
Project Zero
Project Zero
Apple Machine Learning Research
Apple Machine Learning Research
L
LINUX DO - 热门话题
雷峰网
雷峰网
S
Securelist
阮一峰的网络日志
阮一峰的网络日志
S
SegmentFault 最新的问题
酷 壳 – CoolShell
酷 壳 – CoolShell
T
Threat Research - Cisco Blogs
小众软件
小众软件
N
News and Events Feed by Topic

IT之家

消息称大疆 Pocket 4 目标超千万,可能是一英寸 CMOS 出货量最大的单品 OpenAI 回应马斯克要求罢免奥尔特曼:搞法律突袭,扰乱诉讼 - IT之家 鸿蒙智行问界 M6 预订量突破 10 万台,预售 26.98 万元起 今年一季度全国铁路完成固定资产投资 1379 亿元,西十高铁、雄商高铁山东段联调联试 - IT之家 首届北京市中学生人形机器人足球赛今日启动,近 50 支队伍参赛 - IT之家 涉及“赵一鸣是日本品牌”等,抖音处置 1500 余条谣言内容 - IT之家 广汽集团与海尔集团签约,探索“人车家”互联生态 - IT之家 亚马逊调整云游戏平台 Luna 业务模式,取消 Ubisoft+、GOG 等第三方商店 消息称华擎将推出 X870E Taichi White,补全 AMD 800 系白色旗舰主板缺失 长城汽车归元平台首款方盒子全球征名,十二佳提名公布 - IT之家 消息称雷克萨斯新车即将支持苹果数字车钥匙 - IT之家 普京要求俄罗斯加速自研有竞争力的 AI 模型,彻底转向国产技术 - IT之家 影石刘靖康:已开源保真全景无人机仿真平台 AirSim360、DAP 全景度量深度模型等核心成果 - IT之家 长安汽车总经理赵非:当前车企仅靠卖车已难以盈利 - IT之家 地平线创始人余凯:4 月 22 日推出中国第一款舱驾融合智能体芯片“星空” - IT之家 冯兴亚:广汽集团具身智能机器人即将量产,飞行汽车预计今年完成适航认证并量产交付 - IT之家 模块化笔电制造商 Framework CEO 痛批业界追逐“AI 优先”,称个人计算设备可能就此消亡 16 年来首次:小米首届员工运动会今天启幕,雷军压轴致辞 - IT之家 比亚迪廉玉波:新能源汽车产业正进入确定性与不确定性并存的阶段 - IT之家 阿耳忒弥斯 2 号宇航员安全返回地球,有哪些技术和科研收获 - IT之家 曝索尼 Alpha 7R VI 全画幅无反相机将随 100-400mm f/4.0 GM 镜头一同登场,发布会预计在 5 月 小米产教融合最新成绩披露:合作院校超 400 家、成都基地启用 - IT之家 亚马逊 CEO 贾西:自研芯片年化收入预估 500 亿美元,规模超 AMD 与英特尔 马来西亚推动“AI 城市”转型,目标 2030 年成为“AI 国家” Galaxy S24 Ultra 手机用户反馈三星人为设限,无法使用 Galaxy Buds4 Pro 耳机高清语音 广汽集团董事长冯兴亚:当前县级市场新能源汽车渗透率不到 20% - IT之家 消息称《地铁:离去》新作下周公布,有望 State of Play 发布会亮相 广汽新一代智能座舱架构与电子电气架构明日发布,将宣布芯片生态建设的重大突破 - IT之家 苹果预订台积电 6 万片晶圆产能,2027 年全力冲刺 AI 服务器芯片 日本经济产业省向 Rapidus 追加 6315 亿日元支持,加速下一代半导体研发 差 10%:消息称三星 2nm 工艺良率卡在 60%,无缘代工高通第六代骁龙 8 至尊版芯片 岚图汽车卢放:有话语权的企业宣传技术要控制言行,不要去误导人 - IT之家 我国业界首个产业协同平台,“太空算力专业委员会”启动成员征集 - IT之家 梅赛德斯-AMG CLA Shooting Brake EQ 高性能电动旅行车路测图曝光 特斯拉 Semi 电动卡车电池架构曝光:创新垂直立方设计,攻克低温续航衰减难题 - IT之家 加州初创公司 PowerStation 投放新型快充站:完全太阳能供电,限时免费开放 - IT之家 蔚来 2026 款乐道 L90 将搭载神玑 NX9031 辅助驾驶芯片,4 月 21 日上市 卢放谈岚图与华为合作:是战略合作,也是两个独立主体,对双方快速成长非常重要 - IT之家 OpenAI 回应 Axios 工具安全事件,敦促苹果 Mac 用户更新 ChatGPT 等应用 滴滴 Robotaxi 将采用混合派单模式,系统判断是否派给无人驾驶汽车 - IT之家 岚图汽车董事长卢放:如果原材料价格再涨,最后一定会传到终端 - IT之家 华为靳玉志:L3 是走向完全自动驾驶的必经阶段,今年或为全球自动驾驶元年 - IT之家 吉利杨学良谈未来的汽车:是智能移动终端和数据载体,更是生态入口 - IT之家 爱因斯坦预言百年后,引力波有望揭示宇宙大爆炸原初黑洞 - IT之家 53 分钟超长全食:美国载人绕月任务记录罕见深空日食奇观 - IT之家 美国联邦航空管理局另类招聘:欢迎游戏玩家应征空管 - IT之家 华为靳玉志重申不造车:致力于成为智能网联汽车时代的“电子螺丝钉” - IT之家 京东否认做网约车业务:新项目 4 月 13 日上线 爱沙尼亚选择不跟进青少年社媒禁令:解决不了问题,孩子们总有办法绕过 - IT之家 本月生效:微软 PowerShell 7.7 预览版起全面转向 MSIX 火狐 Firefox 浏览器公司 Mozilla 痛批微软:强推 Copilot,限制用户选择 长安汽车回应“上百辆网约车频现电池故障”诉讼:涉及单一车辆,谴责夸大舆论 - IT之家 李斌:蔚来高峰时一年要买 3 亿美元的英伟达芯片,自研芯片已经替公司省了很多钱 - IT之家 壹号本 ONEXStation 迷你 AI 工作站上架:395 + 128GB + 1TB 首发 18999 元 OpenAI 奥尔特曼住所遭燃烧瓶袭击后发声:AI 担忧不应演变为暴力行为 - IT之家 消息称 Epic 正开发迪士尼 IP 射击游戏:类似《Arc Raiders》,11 月发布 保时捷 911 GT3 Sport Cabriolet 敞篷车曝光 消息称行业首款横向阔折叠华为 Pura X Max 与 Pura 90 系列一起登场 笔记本同款陶瓷铝合金材料,华硕推出 ZenMouse MD202 无线鼠标 - IT之家 索尼 INZONE 首款开放式游戏耳机:英纵 H6 Air 曝光,199 克、支持 7.1 环绕声 vivo 公布 OriginOS 6 四月体验升级亮点:支付宝新能源充电上岛,小 V 圈搜可查食物热量 橙色版 OPPO Find X9 Ultra 手机渲染图曝光 Snap 与高通扩大合作,骁龙 SoC 将持续为 Specs 系列智能眼镜提供支持 工信部原副部长苏波:预计 2030 年新能源汽车国内市场渗透率将超七成 - IT之家 开源电子书管理工具 Calibre 9.7 发布:支持 HTTPS 离线模式、增强搜索稳定性 F1 紧急调整 2026 赛车混动规则,解决最高 70 公里时速差问题 小米手机今日起正式调价,REDMI K90 Pro Max 上涨 200 元 无视用户反对,美国车企正逐渐将订阅制功能视为核心收入来源 - IT之家 HD 现代重工成功建造全球首批氨动力船舶 - IT之家 佳明 CIRQA Smart Band 健身手环曝光,专注压力恢复监测 索尼将于 4 月 15 日发布 INZONE 英纵游戏电竞外设新品 努比亚回应红魔 11 Pro 系列手机遭 3DMark 除名事件:展示硬件极限性能 谷歌安卓酝酿自动备份新方案:手机照片视频直存 PC,不用付费存云盘 - IT之家 微信鸿蒙版 App 8.0.16.55 正式版更新发布,安装次数即将突破 5000 万次 小米汽车:新一代 SU7 新功能预计下月起向其他车型 OTA 推送 Anthropic 和 OpenClaw 的博弈:“龙虾”之父 Steinberger 的 Claude AI 账号短暂被封 我国首个海上注碳增气项目开工,年封存超百万吨二氧化碳 - IT之家 动态磁贴情怀难消:微软揭秘 5 种 Win11 开始菜单原型方案 ChatGPT 用户规模过于庞大,欧盟拟依据《数字服务法》严管 OpenAI - IT之家 首次落地欧洲,特斯拉 FSD 受监督版本在荷兰获批 - IT之家 美国载人绕月飞船返回地球,溅落在预定海域 - IT之家 微软重塑 Win11 预览版体验:简化频道、全量推送、切换更顺 - IT之家 英国政府警告:若科技公司未能删除非自愿私密影像,高管将面临监禁 - IT之家 微软推送 Dev 26300.8170/Beta 26220.8165 预览版:FAT32 格式化支持 2TB 微软推送 Win11 Canary 29565.1000/28020.1812 预览版:增强触控板、优化拖拽托盘 科技巨头 AI 需求激增,大举投资小型模块化反应堆 - IT之家 IT早报 0411:DeepSeek V4 将于 4 月下旬正式发布;阿里认领神秘 AI 视频模型“欢乐马”;华为 Pura 系列发布会定档 4 月 20 日;第二批 625 亿国补资金下达... 马斯克的 XChat 独立消息应用 17 日登陆苹果 iPhone / iPad:无广告、防截图、阅后即焚 场馆人为失误,导致 NBA 常规赛直播被 Apple TV 更新打断 美法院裁定:Meta 必须面对马萨诸塞州的青少年成瘾诉讼 - IT之家 CounterPoint 报告 2026Q1 全球手机出货量:苹果 iPhone 同比增 5%、三星降 6%、小米降 19% Omdia 报告 2026Q1 全球手机出货量:三星市占 22%、苹果 20%、小米 11% 有望让 Cookie 攻击走向历史,谷歌 Chrome 浏览器 Windows 版 146 更新引入 DBSC 功能 海上平板车:海军最新型半潜船亮相,首次进行夜间装载潜浮训练 - IT之家 消息称欧盟委员会计划将 ChatGPT 列为“超大型搜索引擎”,OpenAI 或面临更严格监管 - IT之家 央视起底 AI 造谣乱象:制作门槛低、辟谣压力大,“AI 标注”并非免责牌 - IT之家 三星 Galaxy A57 5G 手机国行发售:Exynos 1680 芯片、5000mAh 电池,3299 元起 512GB 版 2119 美元 → 2199 美元,三星 Galaxy Z Fold7 折叠屏手机部分配置在美国涨价 VGN 推出“闪电 68”有线机械磁轴键盘:采用三芯片方案、可选两种轴体,599 元起 - IT之家 联想推出 2026 款来酷斗战者“战 7000”笔记本,i7-13645HX + 16G + 512G + RTX5060 售 7699 元起
AI 同传 2.8 秒延迟,阿里通义千问发布实时语音翻译模型 Qwen3.5-LiveTranslate
2026-05-20 · via IT之家

IT之家 5 月 20 日消息,据通义实验室消息,通义千问团队发布了 Qwen3.5-LiveTranslate-Flash 实时语音翻译模型,该模型在语种覆盖、延迟控制和音色保留等方面实现显著突破,旨在解决跨境直播、跨国会议等场景中的实时同传痛点。

IT之家附官方详细介绍如下:

跨境直播卡顿、跨国会议延迟、AI 配音“机器感”太重…… 实时同传一直卡在“延迟、语种、音色”三大痛点。

Qwen3.5-LiveTranslate-Flash 给出了解决方案:支持 60 种语言的音频输入和文字输出,29 种语言的音频输出,端到端字均延迟低至 2.8 秒,还能保留说话人的原声特征。

核心亮点速览

Qwen3.5-LiveTranslate

  • 输入音频和输出文本语种从 18 种提升至 60 种,输出音频从 10 种提升至 29 种;

  • 语音同传字均延迟降低至 2.8 秒;

  • 支持实时音色克隆,翻译后仍保留说话人原声特征;

  • 内置热词能力,专有名词和行业术语翻译更精准。

Qwen3.5-LiveTranslate 能听懂和翻译 60 种语言,其中 29 种可以实现语音输出。输入音频和输出文本语种从 18 个大幅提升至 60 个,输出音频语向从 10 个提升至 29 个,覆盖更多国家与区域的语言互译组合,满足跨境会议、直播出海、在线课堂、商务谈判等多语同传需求。

引入全新 Readable Unit(可读单元)实时翻译技术,在保证译文可读性与语义连贯的前提下,实现更激进的流式输出。端到端字均延迟降低到 2.8 秒,适用于直播、连麦、发布会等对时延极敏感的场景。

支持 Real-time Voice Cloning(动态跨语言音色克隆)。在同传过程中自动捕捉并复刻说话人音色特征,译文在不同语言间依旧保持“同一个人”的声音质感与情绪表现力。主播、嘉宾、主持人的身份一致性大幅提升,沉浸感拉满。

内置动态热词(Hotword)引擎,最高支持 1000 个自定义词条。对人名、地名、品牌、产品型号、行业术语进行优先识别与优先翻译。支持场景动态配置与实时更新,显著降低技术发布会、医疗 / 法律 / 金融会议、企业内训中“术语翻错、名字听错”的风险。

我们将模型放入高频实战环境,复杂场景依旧稳定发挥:

跨国会议 & 出境旅游

多语混说 / 复杂口音:会议室多语种交替发言、带口音表达,模型精准切分并同步译。

智能硬件落地:搭配千问 AI 眼镜在泰国点餐实测,语音交互 + 实时同传无缝衔接,沟通零障碍。

直播带货 & 影视出海

数字与规格精准翻译:直播连麦中,商品参数、价格、折扣数字翻译准确率极高,带货宣发不断档。

古文 / 文化内容同传:准确理解并翻译古典文言文,语义连贯且保留文化韵味,字幕与配音同步流畅。

视觉消歧辅助

结合多模态理解能力,在语境模糊时自动引入视觉信息辅助判断,大幅降低“一词多义”导致的翻译歧义。

在公开多语言语音翻译基准(FLEURS、CoVoST2)上,Qwen3.5-LiveTranslate-Flash 翻译准确率优于当前主流语音大模型,显著优于前代 Qwen3-LiveTranslate-Flash,在语言覆盖和翻译质量上均实现突破。

凭借可读单元流式策略,Qwen3.5-LiveTranslate-Flash 相比 Qwen3-LiveTranslate-Flash 将首字延迟降低 3.45 秒、字均延迟降低 1.88 秒,最终实现端到端字均延迟 2.8 秒,翻译质量几乎无损。

相比上一代,Qwen3.5-LiveTranslate-Flash 在核心参数与功能上实现了全面进阶,详细对比如下:

Qwen3.5-LiveTranslate 是基于 Qwen3.5-Omni Thinker-Talker 架构打造的翻译大模型。面向同声传译场景,我们采用 chunk-wise 流式输入机制,引入可读单元来控制语音合成粒度,在保证同传体感的同时有效降低时延。此外,借助动态跨语言音色克隆技术,模型在翻译时能够实时识别并模仿说话人的原始音色。

从“能翻译”到“实时同传”,Qwen3.5-LiveTranslate-Flash 用更低延迟、更多语种、更自然音色,为跨境协作、内容出海、智能硬件提供新一代语音基础设施。

立即体验

Blog:https://qwen.ai/blog?id=qwen3.5-livetranslate

Demo:https://omni.qwen.ai/live-translate

阿里云百炼:即将上线

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。