惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

U
Unit 42
WordPress大学
WordPress大学
T
The Exploit Database - CXSecurity.com
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
Security Latest
Security Latest
Know Your Adversary
Know Your Adversary
D
Darknet – Hacking Tools, Hacker News & Cyber Security
S
Schneier on Security
T
Tailwind CSS Blog
Recent Announcements
Recent Announcements
B
Blog
P
Proofpoint News Feed
Y
Y Combinator Blog
L
Lohrmann on Cybersecurity
罗磊的独立博客
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Application and Cybersecurity Blog
Application and Cybersecurity Blog
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
G
GRAHAM CLULEY
T
Threat Research - Cisco Blogs
aimingoo的专栏
aimingoo的专栏
博客园 - 【当耐特】
L
LangChain Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
H
Hackread – Cybersecurity News, Data Breaches, AI and More
AI
AI
MyScale Blog
MyScale Blog
Latest news
Latest news
Stack Overflow Blog
Stack Overflow Blog
Forbes - Security
Forbes - Security
A
Arctic Wolf
Recent Commits to openclaw:main
Recent Commits to openclaw:main
T
The Blog of Author Tim Ferriss
Last Week in AI
Last Week in AI
PCI Perspectives
PCI Perspectives
宝玉的分享
宝玉的分享
NISL@THU
NISL@THU
B
Blog RSS Feed
H
Heimdal Security Blog
E
Exploit-DB.com RSS Feed
G
Google Developers Blog
N
Netflix TechBlog - Medium
V
Visual Studio Blog
美团技术团队
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
S
Securelist
Attack and Defense Labs
Attack and Defense Labs
Hacker News - Newest:
Hacker News - Newest: "LLM"
C
CXSECURITY Database RSS Feed - CXSecurity.com
W
WeLiveSecurity

博客园 - gogoy

LangChain的Deep Agents学习 Java 开发中 一篇文章讲清楚VO,BO,PO,DO,DTO的区别 云原生:Mesh化架构模式(sidecar模式)、容器vsPod Serverless 介绍 Spring单例Bean并发安全问题分析和解决 图解直接映射(Direct mapped)、全相联(Fully-associative)和组相联(Set-associative)cache缓存基本原理 【台大机器学习系列1】机器学习2021 人工智能交互中的角色与提示词:System、User与Assistant 台大李宏毅 2025 AI Agent 新课来了!(即李宏毅机器学习2025) 一文搞懂Passkey(转) RISC-V、x86、ARM技术对比解析 各种函数依赖及规范化解决 SSE协议与HTTP协议 操作日志 “二清”详解:支付产品必须知道的“清结算规矩” 金融通识:国内支付清算体系CNAPS2 Mockito教程(单测mock) zookeeper TCP相关经典 Java常见的超时及设计
为什么大语言模型推理要分成 Prefill 和 Decode?
gogoy · 2025-09-18 · via 博客园 - gogoy
一句话解释:Prefill 和 Decode 的分工 大语言模型生成文本的过程本质上是给定上下文,逐词预测下一个词。但在实现上,这个过程被明确地分成两个阶段: 为什么不能用一个阶段做完? 因为输入和输出的计算特性完全不…