惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Simon Willison's Weblog
Simon Willison's Weblog
G
Google Developers Blog
Spread Privacy
Spread Privacy
I
InfoQ
V
V2EX
S
Schneier on Security
小众软件
小众软件
C
CERT Recently Published Vulnerability Notes
博客园 - 聂微东
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Stack Overflow Blog
Stack Overflow Blog
T
Threat Research - Cisco Blogs
L
Lohrmann on Cybersecurity
Recent Announcements
Recent Announcements
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Attack and Defense Labs
Attack and Defense Labs
云风的 BLOG
云风的 BLOG
The Hacker News
The Hacker News
S
SegmentFault 最新的问题
C
Cybersecurity and Infrastructure Security Agency CISA
NISL@THU
NISL@THU
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
GbyAI
GbyAI
Latest news
Latest news
S
Secure Thoughts
Project Zero
Project Zero
MongoDB | Blog
MongoDB | Blog
I
Intezer
Security Latest
Security Latest
Apple Machine Learning Research
Apple Machine Learning Research
Vercel News
Vercel News
N
Netflix TechBlog - Medium
V2EX - 技术
V2EX - 技术
量子位
T
Threatpost
T
The Blog of Author Tim Ferriss
Y
Y Combinator Blog
T
Tor Project blog
A
Arctic Wolf
Microsoft Security Blog
Microsoft Security Blog
T
The Exploit Database - CXSecurity.com
大猫的无限游戏
大猫的无限游戏
T
Tailwind CSS Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
C
Check Point Blog
博客园 - Franky
Google DeepMind News
Google DeepMind News
The Register - Security
The Register - Security
The GitHub Blog
The GitHub Blog
L
LINUX DO - 热门话题

清华大学 TUNA 协会

金枪鱼之夜:Automaton is all you need? | 清华大学 TUNA 协会 金枪鱼之夜:ICU Done Wrong: 如何构建多文种的文本索引 | 清华大学 TUNA 协会 金枪鱼之夜:迎新 & Vanilla OS 3 - Immutable and Reproducible Operating System | 清华大学 TUNA 协会 2026 年春季学期社团联合招新(百团大战) | 清华大学 TUNA 协会 金枪鱼之夜:Avrova Donz 与九条命的镜像站架构艺术 | 清华大学 TUNA 协会 金枪鱼之夜:实验物理垃圾佬的高性能 GPU 集群 | 清华大学 TUNA 协会 金枪鱼之夜:OSPP 2025 项目成果分享 | 清华大学 TUNA 协会 金枪鱼之夜:vLLM: 简单、高效、低成本的大模型推理框架 | 清华大学 TUNA 协会 JetBrains x TUNA 技术交流开放日专题讲座 | 清华大学 TUNA 协会
金枪鱼之夜:开元-2B:全流程开源的端侧模型预训练实践 | 清华大学 TUNA 协会
清华大学 TUNA 协会 · 2025-12-20 · via 清华大学 TUNA 协会

金枪鱼之夜:开元-2B:全流程开源的端侧模型预训练实践

时间: 2025-12-20 19:00-21:00 地点: 三教 1102 tunight llm
资源链接:

清华 PACMAN 实验室近期联合鹏城实验室发布了基于全国产算力训练的端侧模型——鹏城脑海-2.1-开元-2B(PCMind-2.1-Kaiyuan-2B,简称开元-2B),它的一大特点是保证了包括训练数据在内的全流程开源。TUNA 很荣幸邀请到了 PACMAN 实验室的罗开荣同学为我们介绍开元-2B 模型及其训练过程中使用的框架,欢迎大家一起学习!


开元-2B依托鹏城实验室“脑海2”集群进行模型预训练,主要特点包括:

  1. 全流程开源:不同于一般仅开源模型权重的“开源”模型,开元-2B 完全基于符合开源许可的数据进行训练,并开源了处理后的训练数据、数据处理框架及训练框架;
  2. 全国产算力训练:数据处理基于鲲鹏 920 集群,模型训练基于昇腾 910A 集群,并通过模型结构调整适配国产硬件的数值精度;
  3. 高效训练:综合改进数据处理和训练策略,使用 2.2T 数据、20 亿总参数、14 亿非嵌入参数进行训练,最终模型在全开源系列模型中实现了参数-性能的帕累托最优。

具体细节可参见技术报告: https://arxiv.org/pdf/2512.07612


活动信息: