惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

V2EX

AI 时代的天才程序员 有什么你们用过的稳定好用的 ai coding 方法/流程/心得吗 opus 4.7 是不是出问题了? 用 crontab 让 codex-cli 指定时间自动发 ping 命令,能收到 pong, 但没有开始计算 5 小时额度,是指令太短了吗? 到底是哪些人一直在做吴语维基百科的搜索优化啊 clash + fluent reader 获取 rss 源跳转到 127.0.0.1:9000 的问题 告别 Django Admin!这个 NodeJS 全栈框架让你在 DTO 中直接配置 Table/Form 渲染 我们联合智谱 AI、阿里云, 5 月 31 日在深圳办了一场 AI Demo Day Google Pro 每月 1000 AI 积分取消 我自己使用 gpt5.5 中转的一些发现。 做了一个给 SKILL.md 跑分的工具,可以帮你写出更强的 skill 小道消息, 开始抓中转站站长了吗? [AI 编程] 如何给已有项目添加合适的预读取文档,提高准确率 成都本地有玩军模的么? V 站有没有摩友,求推荐 150cc 踏板 antigravity cli 每一次启动几乎都要做一次验证 记一次 Cursor 在安装安全软件后 Surge 分流错误的排查 转生到 AI 时代,我不再相信一键生成代码的传说(从需求到测试: AI 参与研发链路的实践总结) 笔记软件感悟,知识复利才是核心 使用 agent 控制浏览器调试页面的正确姿势是什么? 武侯立交地铁口优质好房 实例讲解什么是上下文治理 老虎账户被注销后能还能直接激活吗? 分享一下我开发的服务器探针系统,可监控 SSH 登录事件 其实我们一直在反击不惜一切代价的大变革 机场升级协议 AnyTLS,公司网络连不上了。 一个可以让 AI 做出更漂亮 UI 的网站, 直接在项目根目录下执行`npx getdesign@latest add {风格}`就可以让 AI 拥有这个设计风格. 公益-中转站-20$ Claude API 企业中转 入群即送 10 美元额度 我自己摸索着做了一个管理 SSL/TLS 证书的小工具,分享了,各位大佬能不能给点建议 有点小郁闷,偷偷喜欢很久的女生有一点点口气 咨询 gpt 账号渠道 教你怎么脱单,聊怎么避坑。从高中同学到结婚生娃,陪你聊聊长期关系与家庭的“一地鸡毛” 公司茶水间有 7 个杯子 特斯拉官宣 FSD 入华 [招聘-可远程] AI Agent 基础设施创业公司招 AI Engineer|北上广深杭 / 新加坡 推荐自用满血 codex 小站点,全 plus 账号,福利订阅免费赠送先到先得(5.21) 参考 WRC 的 G 力图做了这个 drivepose 记录 G 值、俯仰角、侧倾角、时速等 [日本急聘/可远程/AI 数据库工程师 1 名] 不需要日语,年收 400-800 万日元 看了下刮胡刀,发现自己 4 年前都在用盒刀了,现在想尝试下双面刀,穆乐 R89 这类的,有没有大佬来讲讲体验 分享一个苹果风控反向检测代理 IP 是否是家庭宽带 ISP 520 有人去外面翻垃圾桶吗? 求个精准度高的经纬度 / 方位角 / 工具 升级到 ios 26.5 以后 玻璃效果在手机晃动的时候会有真实玻璃的光影效果 想请教一下大家,如何稳定使用 claude code,稳定使用的成本是多少呢? 家用老式吸顶灯无线开关选择,求推荐 如何解决快递不放菜鸟驿站快递小哥不敢放门卫/门口得问题? macos 升级到 26.5 后, safari 经常报错 [因为出现问题,此网页已重新载入] ,尤其是在关闭标签页后,前一个关联页面就报错。 求 CodeX 便宜订阅,最好能到自己账号上面 假如我没有脑出血的话,现在也应该是人生赢家了吧 十几年的 Google 账号,最近刚用来登录 Claude,目前网页版养号中 我也来聊聊,为什么会有“原生家庭问题” 出 VPS(HostDZire 洛杉矶 4h6g) 55 欧元/3 年 感觉国内智能家居的开关控制都不太专业,特别是米家 不知道大家用没用过 SRS 流媒体服务器,最近社群开始了一波作者与用户的非正常对接,不知道大家怎么看的 claude code 有好用的 windows 平台上的图形界面吗? 如何评价上海交大某同学用豆包 P 收款图,私吞部分奖金的行为 五月份被裁,五月底入职新公司,不知道怎么过下去了? [送 CDK] 2026 住宅 IP 推荐:用了三个月没掉过线,新用户最高领 50GB [杭州] 求助:窗边的三棵大树被人为破坏致死,该如何维权? [问与答] 有没有大佬搞过 Apple 新出的商务平台 一到夏天,手就非常油,弄得电脑,手机,鼠标等油迹迹的,有啥办法可以解决么 [生活] 求推荐好用的刮胡刀 2 关于您的 Google AI Pro 订阅的变更 GPT 5.5 的降智是不是有点严重 小白想问个跨平台开发 app 的问题,请指教 有些商品的“以旧换新+国补”真就是满满的套路 [推广] 新用户福利 | ChaoyeAPI 免费 10 刀额度等你来拿 同为 m5 32+1tb 配置下选 macbook air 还是 pro ? BriefFeed AI 洞察上线:从你刚看过的社交媒体信息流里提取线索 [推广] 就 120 人收藏的零食分享贴,我做了个报表 鉴于中文播客有质量有深度的少, 想听些英语播客, 求推荐 网站网页文字加解密 条件不好,找不到对象,是不是该彻底不婚主义 纯 plus/pro 号池 gpt5.5 新建中转站需要测试一下并发压力 www.aigcwe.com [程序员] 我第一次发现,原来连我这种干了 8 年的程序员,也回答不了年轻人的问题 从对齐到执行: grill-me + goal, AI 编码的完整工作流 [问与答] 关于非全日制研究生问题 2026 年了,还是忍不住做了一个浏览器翻译工具 😅 |免费体验! 写了一个本地优先的 RSS 阅读器 聊聊学历、专业和转行 如今的你探索未知世界和个人成长的占比还有多少呢?大家一起进步啊 [分享创造] 世界无障碍日:我上线了“破己行动”,一款拒绝“同情式”设计的辅助工具 Linux 嵌入式,智慧能源行业, 20K x 14 疯狂星期四, V 你 50 相机拍了 RAW 照片只能在电脑上看?写了个 App 让手机 USB 直连就能预览导出 chrome 插件 V2EX 好像用不了 Antigravity 3.5 Flash 额度消耗的巨快,好像是 3.1 Flash 的 6 倍, reddit 上哀嚎遍野 谷歌 Gemini Omni Flash 模型视频生成效果真不错,搓了一个多模态 AI 视频生成站,欢迎体验 还有什么免费,功能全,且国内节点覆盖比较全的云拨测站? 有做网页逆向的兄弟吗?现在有了 ai 自动化,是否都能直接搞定了? [问与答] 坛里有不少大厂的,看招聘要求都是本科起 民办大专升本的会被歧视么. [怀旧游戏] The Virtual OS Museum 说真的,谷歌这次的 Gemini omni 更新太拉垮了,都打不过 seedance 2 [Vibe 项目] SparkBin— 为 Vibe Coder 打造的 AI 项目教练,从想法到变现的 6 阶段框架,为你的奇思妙想修正轨道 新手求教, Macbook pro 怎么买 手搓了个让 Claude Code、Codex、Cursor 共享记忆的小工具 路由器 5ghz 可以覆盖全屋, 2.4ghz 反而不能是咋回事? [宽带症候群] 请问下各位大佬们,在帝都的三家基础运营商,不管是固网宽带还是移网,以下科学上网协议,哪个更靠谱、更相对稳定、速度流畅不太受限严重的?以下哪个协议受 QoS、GFW、运营商 DPI 系统影响严重? 验证 OpenAI 生成的图像 上传图片,即可检验该图像是否出自 OpenAI 的 AI 工具之手
RAG 难以让人满意啊
archxm · 2026-04-17 · via V2EX

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

  • 文档是日常工作的运维知识点。
    • 比如设置 ssh 免密登陆、设置 sudo 权限、git 的常用操作、等等。
    • 暂时用这些文档来,后续想把公司业务流程放进去。
  • 先后试了 obsidian 和 anythingllm ,都不能达到目的。
  • 我想要的是:我输入一个关键词,它能找到相关文档。
  • 当然,这是初步需求。
  • 后续需求,大概是,进行适当联想和总结。
  • 现状是,比如我让它给我找 ssh 内容,压根就不准。
  • 我想,现在这些 ai 产品,大概率就是骗投资的。
  • 类似秦国时期的商鞅变法,先做宣传:
    • 谁把这根柱子从西门搬到东门,谁就得 10 根金条。
    • 这种蠢事,就很容易得到宣传,先把气氛搞起来。
  • 我认为, 如今的 ai ,或者说:大模型,确实是可以提升生产力的。
  • 但是,这玩意盈利模式,不清晰。
    • 结局就是,普遍做做样子,东西搞出来,投资人满意,赏你个三瓜两枣。
    • 但是实际使用,很难用。
  • 最近公司不太忙,待会我找个 python 库,再搭一个看看。

  • 知识点
  • 检索
  • 生产力

    82 条回复    2026-04-19 23:27:04 +08:00

    YanSeven

    1

    YanSeven      2 天前   ❤️ 1

    agent 可能更合适一点了现在,譬如检索。顶尖的 agent ,譬如 claude code ,codex 已经很精确了。底层也不复杂,不需要什么向量数据库。

    fennu2333

    2

    fennu2333      2 天前   ❤️ 1

    你的需求似乎也不复杂,不想用太多 token 的话向量数据库混合索引的简单 naive rag ,愿意用 token 的话好好组织文件结构用 agentic 搜索应该问题都不大

    archxm

    3

    archxm  

    OP

       2 天前

    @YanSeven 我用的本地模型,试了 qwen 和 llama ,感觉 llama 稍微好点。但整体还是难以让人满意。
    比如,我文档里,有 logrotate.md ,介绍了日志压缩的一些知识点,logrotate 的一些配置。我在问答里,要求找日志压缩,它告诉我说我库里没这方面的内容。

    archxm

    4

    archxm  

    OP

       2 天前

    @fennu2333 需求当然简单,但这是初始需求,先探索一下,后续会把业务文档放进去,那个就量大了。
    文档不用能外面的 ai ,数据不能外传,所以用的本地模型,暂时用的小模型,比如 3b 这种。
    其实我这种需求,直接用 es 做索引不就行了吗,试一试 LLM 是因为,这不感觉它挺强的吗,必然要尝试新技术。

    sunzhuo

    5

    sunzhuo      2 天前   ❤️ 1

    notebooklm 试了吗?我用过完全没有幻觉。

    meteor957

    6

    meteor957      2 天前 via Android   ❤️ 1

    数据最好是结构化的,chunk 切分合理。我发现召回的 chunk 和文档整体的关联也很困难,比如人物的第一次出场是第几章。

    elevioux

    11

    elevioux      2 天前   ❤️ 1

    其实吧,现在 LLM 的上下文已经足够,为什么要切呢,直接喂整页就好了。只要 LLM 能根据问题,定位到所需的一页或几页即可。

    nomansky

    12

    nomansky      2 天前

    还不如先调用 bash mcp 'grep -i ssh*.md' 一波,

    zhaoziling

    13

    zhaoziling      2 天前   ❤️ 1

    @archxm 你这种情况,我碰到过类似的,你没法用外面的 AI ,本地模型又是比较小的,只能自己累一点搞复杂一点,首先你的数据是否有结构化的可能,不然不好弄,自己能总结出来或者喂一部分典型样例给 AI 让 AI 总结出来,然后用 AI 对数据进行结构化处理,再整体转成向量化数据库,用的时候配合余弦相似度和元数据索引,效果还可以,向量化用的模型需要你自己好好挑一下,国内有几款比国外的更适配中文

    woshishui2022

    14

    woshishui2022      2 天前

    用本地搭建的 3b 小模型的使用效果;来评价现在的商用大模型?
    再固执的程序员也得承认 AI 有用,而且代码写的很好吧;时代已经来了,抗拒也没用啊

    lu5je0

    15

    lu5je0      2 天前   ❤️ 11

    看了半天,你用的本地 3b 模型。你搁着拿着自己焊的三轮车评价保时捷呢

    archxm

    16

    archxm  

    OP

       2 天前

    @sunzhuo notebooklm 是谷歌的吧?我想试,但提示说我所在区域不支持使用。再次询问谷歌 ai ,说让我在外区重新注册账号,太麻烦了,不现实,再说公司内部文档,不方便透露出去,不能调用外部 api

    Livid

    20

    Livid  

    MOD

    PRO

       2 天前   ❤️ 1

    NLEmbedding + Gemma4 的效果,全部跑在本地 Mac 上。

    GPLer

    21

    GPLer      2 天前   ❤️ 1

    都不说 claude 、gpt 、gemini 御三家了,要测试大模型能力好歹部署个满血的 glm-5.1 、minimax 2.7 、deepseek v3.2 吧,3b 测了跟没测有什么区别。😅

    archxm

    22

    archxm  

    OP

       2 天前

    @lu5je0 公司电脑弱,用的 3b ,感觉 qwen 不如 llama 。
    家里的高配电脑能跑 35b ,昨晚也试了,总体感觉也是,不堪用。

    GPLer

    23

    GPLer      2 天前   ❤️ 5

    @archxm 你的观点是 RAG 不行,我的观点是 3B 不行,没人说一定要一开始就大投入,但你不应该因为 3B 不行就说 RAG 不行。

    cat9life

    26

    cat9life      2 天前   ❤️ 2

    @archxm #19 哥们,越争辩越暴漏了你真的不了解。3b 连测试的必必要性都没有。Livid 建议的 Gemm4 27b 感觉各方面就很均衡

    archxm

    27

    archxm  

    OP

       2 天前

    @Livid #20
    @GPLer #21 我也就 20 几个 markdown ,都是日常 linux 的运维经验,每个文档也就 3k 左右,这个数据量,3b 也该够了吧?实际上,家里电脑跑 27b 似乎也是效果一般。

    GPLer

    29

    GPLer      2 天前   ❤️ 3

    @archxm 3b 模型只能日常对话,基本上没有实用价值,数据量和模型大小没有直接关系,跟上下文长度以及长文本能力有关,3b 也许长文本能力还行,但是模型能力不行也没用。
    27b 风评还是不错的,如果效果一般可能是 RAG 配置问题,可以先不用 RAG ,试试都放到一个文件夹里,然后用 opencode 等 agent 平台配置模型,然后将目录所在位置告诉它,测试这种情况下的问答效果,速度会慢很多,但是大模型自己探索后应该能答对,如果这样子可以,后面可以让模型写个 skills ,将检索的技巧做成技能。

    qppq54s

    30

    qppq54s      2 天前   ❤️ 1

    确实难以让人满意,后面真能让人满意了估计又会迎来一波 ai 的爆发

    GPLer

    31

    GPLer      2 天前   ❤️ 2

    @GPLer 另外 目前家用最强的模型 gemma4 31b 、qwen3.5 27b 、qwen3.6 35b_a3b ,如果要测试最好在这三个里选,测试下来稠密模型效果比激活参数小的 MoE 模型好很多。

    archxm

    32

    archxm  

    OP

       2 天前

    @qppq54s 整体看,我是看好 ai 的,确实能提高生产力,比搜索引擎方便。
    但如果想要对 ai 进行二次加工,我觉得还是有很多活要干的。

    fkmc

    33

    fkmc      2 天前

    fastgpt 云服务 先体验下

    dsd2077

    35

    dsd2077  

    PRO

       2 天前 via Android   ❤️ 1

    楼主看看这个,这是我们自己实现的 RAG 系统,采用向量+FTS 双重检索,准确率非常的高。更别说那些大厂做的产品了。

    sampeng

    36

    sampeng      2 天前 via iPhone   ❤️ 1

    obsidian+claude code 。大力出奇迹

    deepbytes

    37

    deepbytes      2 天前 via iPhone

    只要你学得够慢,你就不用学。
    ai 时代发展前期,迭代太快,像龙虾之后又来个爱马仕,再迭代 2 个月,再出个占用更低内存,不用 token ,全依赖本地模型,你怎么办……

    huaweii

    39

    huaweii      2 天前 via Android   ❤️ 2

    rag 的核心是 chunck/sectionization 和 embedding 。

    都是需要根据实际使用场景定制才有好的召回效果。当然更灵活的是 agentic rag 但是一样需要定制。

    不在乎隐私的试试 notion 。

    obsidian 和 anythingllm 这种你要把它们当成一个项目开发的大框架,仔细配置和定制,才能有你这种复杂的使用效果。

    laminux29

    42

    laminux29      2 天前   ❤️ 2

    RAG 这种需求非常难做。

    如果想把所有文档全量导入 AI ,现有 AI 没有这么大的上下文窗口。前面有人提到 Google 的 NotebookLLM 效果好,是因为它的窗口比其他主流 AI 大,但也只是大一些。当文档数量超出某个数量级,它也会出现问题。

    如果做剪枝,比如提取关键字、向量化、分块、甚至引入复杂的搜索引擎与工作流,都容易出现丢失信息与精度不够的问题。

    这种情况下,要确保精度,只能学习人类,把文档一页一页地拆解,拆解后的内容与规范文档一段一段地喂给 AI ,这样做虽然精度足够了,但 tokens 与任务完成时间又会爆炸。如果不介意浪费 tokens ,不介意任务运行时间,可以使用这条途径。

    zxjxzj9

    45

    zxjxzj9      2 天前   ❤️ 2

    现在真的应该用 RAG 的是那种超长上下文模型的内部研究. 就目前的个人来说 RAG 确实是上不去下不来,因为 rerank 和嵌入太费劲了,对个人用户来说投入太大.如果公司的文档有个目录,还不如让 ai 直接理解目录层级的语义来 grep 搜索,比 RAG 好用多了.

    merkle2222

    46

    merkle2222      2 天前

    本来就是有这个缺陷,先做一轮 gerp + 数据清洗,效果会很大提升。

    Godykc

    47

    Godykc      2 天前

    做过跟楼主一样的事,本地 ollama 跑了个 8b 的 qwen 搞 rag
    实际是这玩意连函数调用都不支持,效果当然跟智障没啥区别
    所以得先搞定模型再谈后面的

    GPLer

    49

    GPLer      2 天前

    @Lykos 我自己有一张 3090 24g ,35b 和 27b Q4 用 Ollama 勉强能跑,但是上下文开不高,还是推荐 5090 32g 或 4090 48g ,另外 mac m5 max 64g 版本也是不错的选择,算下来整机成本大概 3w ~ 4w 左右,再往上家用就太贵了。

    本来 24g 显存显卡最合适的是用 vllm 跑 27b q4 ,但是 qwen 官方量化的 q4 有问题,权重和 fp8 一样大,只能等 qwen3.6 27b 再看看了。

    目前公司里用 A6000 48g 和 4090 48g 在用 vllm 私有化部署模型,48g 显存部署 fp8/q8 精度上下文能拉满原生 256k 上下文,非代码类任务用用还行。

    ---

    另外如果不要求长上下文的话,27b 模型 16g + gguf 极限量化应该也能跑,35b 模型内存+显存混合使用应该也能跑,不过我没试过,所以不做推荐

    ---

    丐的方案也有,比如 v100 32g x4 、2080ti 22g x2 、3090 24g x2 、m1 ultra 128g 、m2 ultra 128g/256g ,但是这些方案要么太老要么功耗太高又没质保,并且我没试过,所以就不推荐了。

    HENQIGUAI

    50

    HENQIGUAI      2 天前

    @archxm #27 你要是这么点文档数量的话根本没必要上 RAG,徒增复杂度,还不如直接拼接成一个完整的 markdown 然后直接上传给 gemini 或者 notebooklm 就完事了

    Censhuang

    51

    Censhuang      2 天前 via iPhone

    老哥的工程化能力不够,简单的还是不行。今年有个大学要求低算力资源+离线+低参数模型+知识图谱搜索。那你说说这大学怕不是来许愿的。

    xuwuruoshui

    52

    xuwuruoshui      2 天前

    就算自己实现一个 rag 都不至于这样吧,dense sparse 都有,搜索关键词,应该直接分词就能出来了。具体不准在哪里?比如你问 ssh ,他回答的什么

    cfer

    53

    cfer      2 天前

    模型固然重要,但是核心还是召回的数据完整性。

    Enivel

    55

    Enivel      2 天前

    要搭配 FTS 单纯 rag 关键词匹配都做不到

    GPLer

    59

    GPLer      2 天前

    @Enivel FTS 一开始没反应过来,查了下这不就是双路召回的其中一路吗,都 2026 年了,早就标配了。

    vishun

    61

    vishun      2 天前

    @YanSeven 这些不需要向量数据库是因为偏向代码开发,而代码是有逻辑和规范的,class 、function 这关键字足够正则匹配出来,但是文档则不同,没有明确的规则,分段一旦不合理那就是检索不到,再 rerank 也不行。

    coderJie

    63

    coderJie      2 天前

    @archxm #27 大模型能力不是这么评估的...不是看要处理的数据量大小,而是看模型参数量啊,模型参数量不够,你就算处理的数据再少,不行就是不行

    iorilu

    64

    iorilu      2 天前

    claude, codex 不是都证明了吗, 不需要 RAG

    临时用 rg 搜索下就够了

    GPLer

    65

    GPLer      2 天前 via Android

    @akadanjuan101 可以的
    gemma4 31b 没有官方量化,我还在找合适的使用方式
    qwopus 我最近在试,这个因为是非官方的我没写,确实忘了😂

    GPLer

    67

    GPLer      2 天前 via Android

    @GPLer 另外因为目前看下来还是稠密模型能力强,所以一般不推荐 AI Max+ 395 128GB 和 DGX Spark 128GB ,跑 27B 模型速度太慢没法用,苹果只是单纯力大砖飞+高性价比所以才写上去了。

    fengsi

    73

    fengsi      2 天前

    硕士就是做这方面的研究的

    rag 工程落地有着极高的要求,不建议深入这块,很多都是无用功。不说别的,先想清楚一件事,你打算如何评估效果?

    diudiuu

    74

    diudiuu      2 天前

    我现在弄了一个多维度判断这个是不是同一个学者

    就是数据量略大,自己没办法微调模型,就搞得 rag

    dyncan

    75

    dyncan      2 天前

    我最近也在搞这个, 新手不太懂,看看大家的方案学习学习.

    xyz8899

    77

    xyz8899      2 天前   ❤️ 1

    我一直在用 RAG ,主要是和法规方面有关的,砖头那么厚的资料放了 400+ 进去分成 6 个库 + 2 个全文检索工具 + 1 web search ,模型用的 Gemini 的,效果杠杠的,提示词、召回重排。。。 这些都要做好啊,你单纯一个向量化没效果的

    winnerczwx

    79

    winnerczwx      2 天前

    看你正文我就很疑惑, 特别是你说 AI 产品是"骗投资"的.

    难怪网上有些人评价 AI 的结论跟我实际体验差距很大, 都是在自身一知半解的情况下就妄下结论...