为什么公有模型和私有模型使用效果很大差异 - V2EX

编程

AI 正在淘汰小众编程语言 - V2EX 在 Codex 中可以直接调用 Claude 吗？氛围编码生成的是代码，工程生成的是系统。氛围编程不是工程，大家怎么看？ Tikrok8 新版本更新被 composer 2.5 震撼了在 AI 时代,现在的新项目大家怎么开始呢? [纯分享]怎么同时学会多个编程语言现在 rust 是不是好起来了? - V2EX 用 just 管理终端命令，使“命令即代码” - V2EX Qoder teams 版本设计反人性 - V2EX AI 写代码真香喷；以后只要产品经理就可以了 - V2EX warp 有没有什么代码补全和格式化的方案，想代替 cursor - V2EX 被 KIMI 玩弄的一天这么 lj 我是没想到的 - V2EX pyruns：把本地 Python 实验和 shell 任务真正整理起来的 Web UI - V2EX AI 写的项目要怎么维护？都是一次性代码吗？ - V2EX claude-opus-4-6 大家实际使用感觉怎么样？ - V2EX 关于加强学习效率的讨论 - V2EX 想用下智谱的 GLM 和 Minmax 的编程模型，有没有用过的分享下使用效果 - V2EX 设计后台微服务还是 mq - V2EX 请教 Hammerspoon 在获取 WIFI ssid 为 nil 问题 - V2EX 发一个更新版的 rules - V2EX Claude Opus 4.5 发布了，前端工程师的天，塌了又塌（AI 计量单位） - V2EX codex 的一些小感受 - V2EX agent 开发据说很有前途 - V2EX 有人实际遇到（或感知到）过比特翻转或数据静默损坏么？ - V2EX 没钱就只能将就着用 Trae 和免费模型吗？ - V2EX AI 编码的一个细节 - V2EX 网站 favicon 图标自动获取接口 - V2EX 求问单生产者场景使用消息队列是否过度设计？ - V2EX 能替代 cursor autocomplete 的方案有哪些？ - V2EX 一个 PHP 的博客程序，让 Claude 用 Go 重构，当前靠谱吗？ - V2EX 从零开始的 AI 导航站：现在免费提交，有必要开通支付吗？ - V2EX 在命令行使用 claude code /qwen code 和在类 cline 插件中使用有什么区别？ - V2EX 新红、矩阵通、新榜这种平台，数据到底是怎么获取到的？ - V2EX cursor 自定义 model 报错，真报错还是搞小动作？ - V2EX springboot 并发调用存储过程 - V2EX 全开源跨平台桌面 app 开发框架 soui5 成功完成 windows, Linux ,macos 三端适配 - V2EX 求英文编程社区提问新手教程 - V2EX 说真的朋友们，有被感动到 - V2EX 让 Agent 能根据 Prompt 自主选择 MCP tools，实现要怎么处理？ - V2EX 求助！使用 AI 生成低代码数据的方案 - V2EX cursor 还能用了吗？ - V2EX 从 markdown 编辑器直接复制内容到微信公众号平台保持样式不变，这是怎么做到的？ - V2EX AI 写代码比我好，一直不动脑子，不太会写代码了 - V2EX 编程真无聊啊 - V2EX 开源架构推荐 - V2EX Cursor 对比 Windsurf - V2EX Windsurf 代码补全失效 - V2EX 项目快写完才发现白写了 - V2EX 想用 ImGui 做点桌面的小工具练练手，请教一下大家有什么思路？ - V2EX 常用大模型编程项目得分排名 04-19 - V2EX 请问， AI 时代，新手入门编程开发，应该选择哪个语言？ - V2EX 无需服务器部署官方 qq 机器人这种后台接口设计是否合理 - V2EX ai 编程怎么选工具 nextjs 能把人逼疯

guoguobaba · 2025-06-10 · via 编程

我写了一段代码，解析发票，就是通过 pdfminer 将 pdf 发票里的每个字符串的位置信息一起带进来，传给 llm ，提示词类似于下面：

prompt = f"""
    你是一个擅长识别发票内容的 AI ，请从以下多个发票的 OCR 块中，提取结构化的发票信息。输出内容为 json 格式，不输出解释、思考或额外说明。
    
    每张发票以“ [文件: xxx.pdf ] ”标识其来源。请为每个文件分别返回结构化信息，输出如下 JSON 格式：
    
    {{
      "invoice001.pdf": {{
        "发票代码": "...",
        "发票号码": "...",
        "开票日期": "...",
        "购买方名称": "...",
        "销售方名称": "...",
        "价税合计": "...",
        "明细": [
          {{
            "名称": "...",
            "数量": "...",
            "单价": "...",
            "金额": "..."
          }}
        ]
      }},
      ...
    }}
    
    以下是多个文件的 OCR 文本及其坐标：
    {'\n'.join(all_text_blocks)}
        """.strip()

对接 gpt 和 deepseek 公有模型都好使，但是对接私有模型，比如 deepseek-r1-distill-qwen-32b ，deepseek-prover-v2-671b ，还有最新的 qwen3-30b-a3b ，效果都很差，基本上解析不了 json 格式。这是什么原因呢，需要怎么调试。

使用的是 langchain 框架，私有模型用的是 gpustack 在 macstudio m3ultra 上部署的。

第 1 条附言 · 2025 年 6 月 13 日

是我的问题，对接 deepseek/qwen 这类私有模型，langchain 应该用 llm.stream(messages)，然后再一个 chunk 一个 chunk 读出来就 ok 了，这样 32b 也能取得比较好的效果。用 llm.invoke 容易显示不全

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

编程