惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Microsoft Azure Blog
Microsoft Azure Blog
S
Securelist
V
Vulnerabilities – Threatpost
C
Cyber Attacks, Cyber Crime and Cyber Security
Schneier on Security
Schneier on Security
Cyberwarzone
Cyberwarzone
Simon Willison's Weblog
Simon Willison's Weblog
Hacker News - Newest:
Hacker News - Newest: "LLM"
P
Palo Alto Networks Blog
T
Troy Hunt's Blog
SecWiki News
SecWiki News
Security Archives - TechRepublic
Security Archives - TechRepublic
T
The Blog of Author Tim Ferriss
Project Zero
Project Zero
Microsoft Security Blog
Microsoft Security Blog
The Register - Security
The Register - Security
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
J
Java Code Geeks
F
Full Disclosure
阮一峰的网络日志
阮一峰的网络日志
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Attack and Defense Labs
Attack and Defense Labs
Know Your Adversary
Know Your Adversary
WordPress大学
WordPress大学
PCI Perspectives
PCI Perspectives
N
News | PayPal Newsroom
The Last Watchdog
The Last Watchdog
酷 壳 – CoolShell
酷 壳 – CoolShell
P
Privacy & Cybersecurity Law Blog
P
Proofpoint News Feed
V
Visual Studio Blog
C
CERT Recently Published Vulnerability Notes
H
Help Net Security
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
云风的 BLOG
云风的 BLOG
月光博客
月光博客
T
The Exploit Database - CXSecurity.com
I
InfoQ
大猫的无限游戏
大猫的无限游戏
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
U
Unit 42
腾讯CDC
小众软件
小众软件
V2EX - 技术
V2EX - 技术
罗磊的独立博客
Cloudbric
Cloudbric
Recorded Future
Recorded Future
IT之家
IT之家
Google DeepMind News
Google DeepMind News
C
CXSECURITY Database RSS Feed - CXSecurity.com

博客园 - aqi00

15天学会AI应用开发(九)利用Chroma持久化向量数据 15天学会AI应用开发(八)使用向量数据库实现RAG功能 15天学会AI应用开发(七)有了大模型为什么还要引入RAG 15天学会AI应用开发(六)使用离线大模型对文本生成摘要 一文速览 HarmonyOS 6.1.1 推出的十个新特性 15天学会AI应用开发(五)使用AI摘要来压缩上下文消息 15天学会AI应用开发(四)根据Token长度截断历史对话 15天学会AI应用开发(三)把历史对话作为提示词会怎样 15天学会AI应用开发(二)为什么编写提示词这么重要 15天学会AI应用开发(一)搭建AI大模型应用开发环境 一文理清 HarmonyOS 6.0.2 涵盖的十个升级点 FFmpeg开发笔记(一百零二)国产的音视频移动开源工具FFmpegAndroid FFmpeg开发笔记(一百零一)跨平台的开源音视频移动框架MobileFFmpeg 一文速览 HarmonyOS 6.0.1 引入的十个新特性 一文读懂 HarmonyOS 6.1 带来的十大重要升级 新书《鸿蒙HarmonyOS 6应用开发:从零基础到App上线》出版啦 FFmpeg开发笔记(一百)国产的Android开源视频压缩工具VideoSlimmer FFmpeg开发笔记(九十九)基于Kotlin的国产开源播放器DKVideoPlayer FFmpeg开发笔记(九十八)基于FFmpeg的跨平台图形用户界面LosslessCut FFmpeg开发笔记(九十七)国产的开源视频剪辑工具AndroidVideoEditor FFmpeg开发笔记(九十六)采用Kotlin+Compose的视频编辑器OpenVideoEditor FFmpeg开发笔记(九十五)国产的开源视频美颜工具VideoEditorForAndroid FFmpeg开发笔记(九十四)基于Kotlin的国产开源推拉流框架anyRTC FFmpeg开发笔记(九十三)国产的Android开源视频编辑器EpMedia FFmpeg开发笔记(九十二)基于Kotlin的开源Android推流器StreamPack FFmpeg开发笔记(九十一)基于Kotlin的Android直播开源框架RootEncoder FFmpeg开发笔记(九十)采用FFmpeg套壳的音视频转码百宝箱FFBox FFmpeg开发笔记(八十九)基于FFmpeg的直播视频录制工具StreamCap FFmpeg开发笔记(八十八)基于Compose的国产电视直播开源框架MyTV FFmpeg开发笔记(八十七)采用Kotlin的手机开源播放器VLC-Android FFmpeg开发笔记(八十六)基于Node.js的国产视频编辑开源框架OpenCut FFmpeg开发笔记(八十五)基于PyQt和FFmpeg的开源视频剪辑器OpenShot FFmpeg开发笔记(八十四)使用国产的librestreaming实现RTMP直播 FFmpeg开发笔记(八十三)国产的视频裁剪框架AndroidVideoTrimmer FFmpeg开发笔记(八十二)使用国产直播服务器smart_rtmpd执行推流操作
15天学会AI应用开发(十)把文本嵌入模型换成国产模型
aqi00 · 2026-06-28 · via 博客园 - aqi00

前面两篇文章在演示RAG功能时,做向量化的文本嵌入模型都用国外的all-MiniLM-L6-v2,该模型主要适用英文,对于中文总体也能用,但在细节上处理欠佳。本文就来介绍如何使用国产离线的文本嵌入模型替换国外模型,以及如何体现国产模型的比较优势。

一、all-MiniLM-L6-v2的缺点

虽然all-MiniLM-L6-v2的优点很多,比如下列几点:

1、体积极小:几十 MB,随便本地离线下载
2、速度超快:CPU 就能跑,不用显卡
3、通用好用:英文很强,中文也能用(日常 RAG 足够)
4、适配所有向量库:FAISS、Chroma、Milvus 全都兼容

但是all-MiniLM-L6-v2的缺点也很明显,就是它对中文的理解能力一般,有时会出现一些似是而非的错误。

比如之前的文章《15天学会AI应用开发(八)使用向量数据库实现RAG功能》,运行Python测试代码时,如果输入的问题是“RAG是什么”,输出日志结果如下:

然而原始的知识库是这样的:

可见问题“RAG是什么”的正确答案是第二条知识“RAG代表检索增强生成,通过检索外部知识提升大模型回答准确性。”,但all-MiniLM-L6-v2返回的答案却是最后一条知识“RAG让大模型能引用外部知识,避免胡说八道。”,说明all-MiniLM-L6-v2对中文的支持不够精准。

对于专业中文的RAG来说,更好的办法是换成国产的文本嵌入模型,比如BGE-small、BGE-base、Qwen-Embedding等等。

二、下载中文嵌入模型BGE-small

BGE-small的模型页面为 https://modelscope.cn/models/BAAI/bge-small-zh-v1.5 ,模型文件大小为192.25MB。

在下载离线大模型前,要先在命令行执行下面的pip安装命令:

接着命令行通过cd命令进入Python工程的所在目录,再执行下面的模型下载命令:

上面下载命令的“--model”参数表示离线大模型为“BAAI/bge-small-zh-v1.5”,而“--local_dir”参数表示离线大模型的本地保存目录。

下载完毕,即可在Python工程的目录下方找到bge-small-zh-v1.5文件夹,里面保存的便是BGE-small的具体模型文件。

三、结合BGE-small与FAISS实现RAG

接下来演示如何使用BGE-small与FAISS实现RAG检索功能。在编写Python代码前,要先在命令行执行下面的pip安装命令:

然后编写下面的Python检索测试代码,与之前教程的代码相比,仅仅把all-MiniLM-L6-v2改成了bge-small-zh-v1.5:

运行上面的Python代码,根据提示先输入问题“RAG是什么?”,再输入问题“RAG有哪些作用?”,输出日志结果如下:

可见在回答问题“RAG是什么?”的时候,BGE-small正确返回了第二条知识“RAG代表检索增强生成,通过检索外部知识提升大模型回答准确性。”。
在回答问题“RAG有哪些作用?”的时候,BGE-small也正确返回了最后一条知识“RAG让大模型能引用外部知识,避免胡说八道。”

由此说明,中文嵌入模型确实比国外的all-MiniLM-L6-v2拥有更准确的中文检索结果。

本系列的AI应用开发文章目录为《15天学会AI应用开发全目录(零基础小白,零Token消耗)》。