惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

GbyAI
GbyAI
Google DeepMind News
Google DeepMind News
T
Tenable Blog
D
DataBreaches.Net
Google DeepMind News
Google DeepMind News
T
The Blog of Author Tim Ferriss
M
MIT News - Artificial intelligence
D
Docker
A
About on SuperTechFans
P
Privacy International News Feed
C
Cyber Attacks, Cyber Crime and Cyber Security
C
Cisco Blogs
Recent Announcements
Recent Announcements
博客园_首页
C
CXSECURITY Database RSS Feed - CXSecurity.com
有赞技术团队
有赞技术团队
L
Lohrmann on Cybersecurity
V
Visual Studio Blog
P
Privacy & Cybersecurity Law Blog
美团技术团队
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
N
News | PayPal Newsroom
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Recent Commits to openclaw:main
Recent Commits to openclaw:main
Blog — PlanetScale
Blog — PlanetScale
N
Netflix TechBlog - Medium
Simon Willison's Weblog
Simon Willison's Weblog
WordPress大学
WordPress大学
E
Exploit-DB.com RSS Feed
MyScale Blog
MyScale Blog
H
Hacker News: Front Page
Latest news
Latest news
Vercel News
Vercel News
IT之家
IT之家
月光博客
月光博客
V
V2EX
P
Palo Alto Networks Blog
Application and Cybersecurity Blog
Application and Cybersecurity Blog
F
Fortinet All Blogs
aimingoo的专栏
aimingoo的专栏
S
Security Affairs
B
Blog RSS Feed
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
www.infosecurity-magazine.com
www.infosecurity-magazine.com
酷 壳 – CoolShell
酷 壳 – CoolShell
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Know Your Adversary
Know Your Adversary
Cisco Talos Blog
Cisco Talos Blog
人人都是产品经理
人人都是产品经理
I
InfoQ

博客园_首页

Linux实操--组管理、权限管理和定时任务 - NE_STOP Java + EasyExcel 实现单个接口导出多个Excel - LucaJu Mem0 源码解析系列(二):提示词工程的深度剖析 TaskFlow究竟是什么?和普通Skills技能有什么区别 - Winton-H 图论证明题 - 洛苡hh 嘉立创开源:应该是全网MicroPython教程最多的开发板 - FreakStudio Hermes Agent 集成实践:从协议到生产 - Newbe36524 2026年AI编程工具横评:Cursor、Codex、Claude Code、Zed、Windsurf - 曦远Code Java程序员必看的RAG入门教程 - 苏三说技术 2026 AI效率神器:Superpowers + Claude Code 保姆级教程 - 狂师 本地大模型部署全攻略:从 0 到 1 玩转 Ollama - MeteorSeed 【从0到1构建一个ClaudeAgent】内存管理-上下文压缩 - 程序员Seven .NET 高级开发 | 设计、实现一个事件总线框架 - 痴者工良 电子小白入门之NE555 - Tlink 3. WorkBuddy:隐藏玩法,一键召唤专家,让 AI 以"专家身份"给你干活 - 岳小哥AI 和AI一起搞事情#3:Claude Teammate 游戏开发翻车实录 - 风雨中的小七 【OpenClaw】通过 Nanobot 源码学习架构---(7)Memory - 罗西的思考 C# .NET 周刊|2026年3月3期 - InCerry 我在 Debian 11 上把 K8s 单机搭起来了,过程没你想的那么顺(/opt 目录版) - 陌陌卡上 深度学习进阶(七)Data-efficient Image Transformer - 哥布林学者 CLI+Skill搭建浏览器AI自动化框架,告别一切重复枯燥任务 - 技术爬爬虾 告别Token账单无底洞:OpenClaw本地部署,重塑企业数据主权的唯一解 - 清风915938629 FastAPI+Vue:文件分片上传+秒传+断点续传,这坑我帮你踩平了! - 一名程序媛呀 SBTI 爆火后,我做了个程序员版的 CBTI。。已开源 + 附开发过程 - 程序员鱼皮 多模态检索开始进入工程期:用 Sentence Transformers 搭建可落地的 Multimodal RAG 100多行代码实现一个最简单的Agent(用ReAct) Claude Code 通关手册(八):推荐 5 个 Hooks,代码质量提升 3 倍 - 暮色之狐 老板:“有人截图了!”。安全部门:“收到,马上查暗水印!” - why技术 技术之外,皆是人间 C#/.NET/.NET Core技术前沿周刊 | 第 69 期(2026年4.01-4.12) - 追逐时光者 Snack JSONPath 项目架构分析 - 带刺的坐椅 Claude Code Buddy 小析:一个非核心功能,如何体现产品的细节完成度 - 葡萄城技术团队 AI新时代下的图床管理方案-Cloudflare图床+MCP+Skills方案指南 - bingo彬哥 化繁为简:顺丰速运App如何通过 HarmonyOS SDK实现专业级空间测量 - HarmonyOS_SDK 从零实现富文本编辑器#13-React非编辑节点的内容渲染 - WindRunnerMax AI开发-python-langchain框架(3-23-OpenAI Functions风格Tool Calling智能助手) - 万笑佛 .NET + AI 进阶实战:基于类的技能开发 - 打造可治理的 Agent 能力模块 - NetCoreKevin 【从0到1构建一个ClaudeAgent】规划与协调-技能 - 程序员Seven 上周热点回顾(4.6-4.12) - 博客园团队 电子小白的工具三件套:面包板、杜邦线、万能板 - Tlink 单表五亿数据的查询优化 | Mysql、StarRocks - 痴者工良 WorkBuddy:从“我是谁”到“帮我干活” - 岳小哥AI C# 如何减少代码运行时间:7 个实战技巧 - 码农刚子 基于HelixToolkit.SharpDX 渲染3D模型 - 笺上知微 从零开始的双臂具身VLA起源及现阶段发展综述 - SkyXZ 记对 xonsh shell 的使用, 脚本编写, 迁移及调优 - pluvium27 受够了Vibe Coding的失控?换个起点,让AI事半功倍 - 海滨code 从开始配置漏洞环境到漏洞复现流程 - 難しい 关于10年工作经验的程序员对OpenClaw的实战经验分享以及看法 - 虚无境 Any metadata 的内存布局 - chaoguo1234 C# .NET 周刊|2026年3月2期 - InCerry 我帮你测过了,测试圈排名第二的 Skill 依然很牛逼 - 久曲健 Skill Discovery | 无监督技能发现的经典工作总结 - MoonOut PbootCMS 网站内容数量多导致访问慢?这些实用优化方案帮你提速! - 家兴网络技术工作室 上下文工程是什么?过时了么?一文讲明白! - 一枫说码 网站漏洞怎么发现并修复?一篇实用指南(附完整流程) - 家兴网络技术工作室 开了 TUN 模式还是直连?90% 的人都踩过这个坑 Github日报|2026年04月12日 - AI一族 AScript扩展多种脚本语言 - rockey627 AI 学习笔记:Agent 的记忆机制 - 凌杰 你能被装进一个文件里吗?——7 万人把同事"蒸馏"成了 AI - 我没有三颗心脏 Claude Code 通关手册(七):给 AI 装上技能包——Skills 完全指南 - 暮色之狐 在浏览器中快速编辑代码:VSCode Web 集成实践 - Newbe36524 蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷 - To_Carpe_Diem Spring AI Aliababa和AgentScope,哪个更好? - 苏三说技术 Etsy 把 1000 个 MySQL 分片迁进 Vitess:425TB 数据背后的真正问题不是性能,而是运维规模 - ChatInfo MicroPython LVGL基础知识和概念:底层渲染与性能优化 - FreakStudio 数据库草图算法 Python 潮流周刊#146:CPython 引入 Rust 的进展 - 豌豆花下猫 最小生成树 - mofei1116 红日靶场七:从外网入口、容器逃逸到 AD 接管的完整利用链复盘 - YouDiscovered1t 分享四款开源且实用的 Kafka 管理工具 - 追逐时光者 vLLM 权重加载机制全解析:从挑战到理想架构 LCT 学习笔记 - ACehomoxue Avalonia UI 12.0.0 正式发布:架构演进和性能飞跃 - 张善友 当 AI Agent 把调用链拉长,延迟开始成为一门生意 - ChatInfo conhost.exe 无法显示 U+2717 - 145a 太秀了,我把自己蒸馏成了 Skill!已开源 - 程序员鱼皮 ASP.NET Core 内存缓存实战:一篇搞懂该怎么配、怎么避坑 - 邓磊Lei 基于 Ghostty 带有分割标签页和为 Claude 编程设计的通知终端 - BugShare AI 焊死入口:教育的“操作系统级”重塑 - 郝hai 初级Java开发工程师使用sql脚本编写代码的过程是简单而且不糊涂 - CoderOilStation Claude Code通关手册(六):MCP协议完全指南 - 暮色之狐 边框灯光环绕动画特效实现指南 - Newbe36524 开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0 我所理解的Python元模型 - Artech 【从0到1构建一个ClaudeAgent】规划与协调-TodoWrite - 程序员Seven Claude 和 Codex 在审计 Skill 上性能差异探究 - ACai_sec AScript如何实现中文脚本引擎 - rockey627 【渗透测试】HTB Season10 Garfield 全过程wp - dynasty_chenzi Android 开发者为什么必须掌握 AI 能力?端侧视角下的技术变革 - SharpCJ 树状数组正确性证明 - AC-wyr 你的 AI 焦虑,可能比 AI 本身更危险——ATM 机没有消灭银行柜员,但恐慌消灭了你的判断力 - 我没有三颗心脏 一个拉胯的分库分表方案有多绝望?整个部门都在救火! - 冰河团队 动态规划入门必学之走方格问题 - Ofnoname PostgREST 与 PostgreSQL 角色权限配置全解析(生产级实践) - SheepDog1998 使用 UEFI 图形输出协议 GOP 在屏幕上显示图像的方法 - 阿源- Claude Code通关手册(五):组建你的AI专家团队,子代理系统 - 暮色之狐 一个程序员到架构师的催婚路之感悟(整整10年后的催婚相亲感悟) - MisterLip 用 Agent Skill 自动生成工作周报 - 赵康
15天学会AI应用开发(六)使用离线大模型对文本生成摘要
aqi00 · 2026-06-14 · via 博客园_首页

上一篇文章末尾使用了在线大模型压缩文本生成摘要,但该方式会消耗Token,不便初学者长期使用,更好的办法是采用离线大模型来生成文本摘要。

一、离线大模型的种类

国内常用的离线大模型有阿里Qwen、智谱GLM、深度求索DeepSeek、百度文心等等,以千问的文本大模型为例,又有Qwen1.5-1.8B-Chat和Qwen1.5-0.5B-Chat两种。
Qwen1.5是一系列不同大小的解码器语言模型,包括基础语言模型及其对齐的聊天模型。它基于Transformer架构,使用SwiGLU激活函数、注意力QKV偏置、组查询注意力、滑动窗口注意力与全注意力混合等技术。此外,Qwen1.5还提供了改进后适应多种自然语言和代码的分词器。

其中Qwen1.5-1.8B-Chat的模型页面为 https://modelscope.cn/models/Qwen/Qwen1.5-1.8B-Chat ,名称中的1.8B指的是18亿参数(1.8 Billion),模型文件大小为3.69GB。
Qwen1.5-0.5B-Chat的模型页面为 https://modelscope.cn/models/Qwen/Qwen1.5-0.5B-Chat ,名称中的0.5B指的是5亿参数(0.5 Billion),模型文件大小为1.25GB。

对于大模型来说,参数的数量就是模型的“脑子大小”,越多越好。

参数越大(比如1.8B),大模型越聪明、懂的多、逻辑好、写文章 / 推理更强;缺点是占内存 / 硬盘更大、对电脑配置要求更高、跑得慢。
参数越小(比如0.5B),大模型越傻瓜,复杂推理、写长文不行,只能日常聊天、简单问答;优点是占用空间小、手机 / 低配电脑都能离线跑、速度飞快。

本教程涉及到的代码使用场合,推荐使用Qwen1.5-1.8B-Chat,因为0.5B的大模型往往给不出令人满意的回答。

二、下载离线大模型

在下载离线大模型前,要先在命令行执行下面的pip安装命令:

接着命令行通过cd命令进入Python工程的所在目录,再执行下面的模型下载命令:

上面下载命令的“--model”参数表示离线大模型为“Qwen/Qwen1.5-1.8B-Chat”,而“--local_dir”参数表示离线大模型的本地保存目录。

注意Qwen1.5-1.8B-Chat的总大小为3.69GB,下载过程较耗时,请耐心等待。下载完毕,即可在Python工程的目录下方找到qwen1.5-1.8b-chat文件夹,里面保存的便是Qwen1.5-1.8B-Chat的具体模型文件。

三、使用离线大模型输出摘要

接下来演示如何使用Qwen1.5-1.8B-Chat对一段文本生成摘要。在编写Python代码前,要先在命令行执行下面的pip安装命令:

然后编写下面的Python摘要测试代码:

运行上面的Python代码,输出日志结果如下:

可见离线大模型Qwen1.5-1.8B-Chat输出了原始文本经过压缩后的摘要文字,还支持设置返回内容的Token长度(max_new_tokens),并且不消耗Token,适合初学者练习AI应用开发。

本系列的AI应用开发文章目录为《15天学会AI应用开发全目录(零基础小白,零Token消耗)》。