惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Recent Announcements
Recent Announcements
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
O
OpenAI News
D
Docker
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
N
Netflix TechBlog - Medium
人人都是产品经理
人人都是产品经理
Y
Y Combinator Blog
M
MIT News - Artificial intelligence
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
博客园 - 司徒正美
C
CXSECURITY Database RSS Feed - CXSecurity.com
阮一峰的网络日志
阮一峰的网络日志
K
Kaspersky official blog
Security Latest
Security Latest
T
Tailwind CSS Blog
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
V
Vulnerabilities – Threatpost
W
WeLiveSecurity
N
News and Events Feed by Topic
aimingoo的专栏
aimingoo的专栏
美团技术团队
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Google DeepMind News
Google DeepMind News
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
C
Cyber Attacks, Cyber Crime and Cyber Security
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
B
Blog
T
The Blog of Author Tim Ferriss
Google DeepMind News
Google DeepMind News
Help Net Security
Help Net Security
爱范儿
爱范儿
宝玉的分享
宝玉的分享
腾讯CDC
H
Heimdal Security Blog
Webroot Blog
Webroot Blog
AI
AI
WordPress大学
WordPress大学
Recorded Future
Recorded Future
SecWiki News
SecWiki News
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Security Archives - TechRepublic
Security Archives - TechRepublic
Google Online Security Blog
Google Online Security Blog
C
Check Point Blog
TaoSecurity Blog
TaoSecurity Blog
Cisco Talos Blog
Cisco Talos Blog
The Cloudflare Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
博客园 - Franky
云风的 BLOG
云风的 BLOG

编程

AI 正在淘汰小众编程语言 - V2EX 在 Codex 中可以直接调用 Claude 吗? 氛围编码生成的是代码,工程生成的是系统。氛围编程不是工程,大家怎么看? Tikrok8 新版本更新 被 composer 2.5 震撼了 在 AI 时代,现在的新项目大家怎么开始呢? [纯分享]怎么同时学会多个编程语言 现在 rust 是不是好起来了? - V2EX 用 just 管理终端命令,使“命令即代码” - V2EX Qoder teams 版本设计反人性 - V2EX AI 写代码真香喷;以后只要产品经理就可以了 - V2EX warp 有没有什么代码补全和格式化的方案,想代替 cursor - V2EX 被 KIMI 玩弄的一天 这么 lj 我是没想到的 - V2EX pyruns:把本地 Python 实验和 shell 任务真正整理起来的 Web UI - V2EX AI 写的项目要怎么维护?都是一次性代码吗? - V2EX claude-opus-4-6 大家实际使用感觉怎么样? - V2EX 关于加强学习效率的讨论 - V2EX 想用下智谱的 GLM 和 Minmax 的编程模型,有没有用过的分享下使用效果 - V2EX 设计后台微服务还是 mq - V2EX 请教 Hammerspoon 在获取 WIFI ssid 为 nil 问题 - V2EX 发一个更新版的 rules - V2EX Claude Opus 4.5 发布了,前端工程师的天,塌了又塌(AI 计量单位) - V2EX codex 的一些小感受 - V2EX agent 开发据说很有前途 - V2EX 有人实际遇到(或感知到)过比特翻转或数据静默损坏么? - V2EX 没钱就只能将就着用 Trae 和免费模型吗? - V2EX AI 编码的一个细节 - V2EX 网站 favicon 图标自动获取接口 - V2EX 求问单生产者场景使用消息队列是否过度设计? - V2EX 能替代 cursor autocomplete 的方案有哪些? - V2EX 一个 PHP 的博客程序,让 Claude 用 Go 重构,当前靠谱吗? - V2EX 从零开始的 AI 导航站:现在免费提交,有必要开通支付吗? - V2EX 在命令行使用 claude code /qwen code 和在类 cline 插件中使用有什么区别? - V2EX 新红、矩阵通、新榜这种平台,数据到底是怎么获取到的? - V2EX cursor 自定义 model 报错,真报错还是搞小动作? - V2EX springboot 并发调用存储过程 - V2EX 全开源跨平台桌面 app 开发框架 soui5 成功完成 windows, Linux ,macos 三端适配 - V2EX 求英文编程社区提问新手教程 - V2EX 说真的朋友们,有被感动到 - V2EX 让 Agent 能根据 Prompt 自主选择 MCP tools,实现要怎么处理? - V2EX 求助!使用 AI 生成低代码数据的方案 - V2EX cursor 还能用了吗? - V2EX 从 markdown 编辑器直接复制内容到微信公众号平台保持样式不变,这是怎么做到的? - V2EX AI 写代码比我好,一直不动脑子,不太会写代码了 - V2EX 编程真无聊啊 - V2EX 开源架构推荐 - V2EX Cursor 对比 Windsurf - V2EX Windsurf 代码补全失效 - V2EX 项目快写完才发现白写了 - V2EX 想用 ImGui 做点桌面的小工具练练手,请教一下大家有什么思路? - V2EX 常用大模型编程项目得分排名 04-19 - V2EX 请问, AI 时代,新手入门编程开发,应该选择哪个语言? - V2EX 无需服务器部署官方 qq 机器人 这种后台接口设计是否合理 - V2EX ai 编程怎么选工具 nextjs 能把人逼疯
为什么公有模型和私有模型使用效果很大差异 - V2EX
guoguobaba · 2025-06-10 · via 编程

我写了一段代码,解析发票,就是通过 pdfminer 将 pdf 发票里的每个字符串的位置信息一起带进来,传给 llm ,提示词类似于下面:

prompt = f"""
    你是一个擅长识别发票内容的 AI ,请从以下多个发票的 OCR 块中,提取结构化的发票信息。输出内容为 json 格式,不输出解释、思考或额外说明。
    
    每张发票以“ [文件: xxx.pdf ] ”标识其来源。请为每个文件分别返回结构化信息,输出如下 JSON 格式:
    
    {{
      "invoice001.pdf": {{
        "发票代码": "...",
        "发票号码": "...",
        "开票日期": "...",
        "购买方名称": "...",
        "销售方名称": "...",
        "价税合计": "...",
        "明细": [
          {{
            "名称": "...",
            "数量": "...",
            "单价": "...",
            "金额": "..."
          }}
        ]
      }},
      ...
    }}
    
    以下是多个文件的 OCR 文本及其坐标:
    {'\n'.join(all_text_blocks)}
        """.strip()

对接 gpt 和 deepseek 公有模型都好使,但是对接私有模型,比如 deepseek-r1-distill-qwen-32b ,deepseek-prover-v2-671b , 还有最新的 qwen3-30b-a3b ,效果都很差,基本上解析不了 json 格式。这是什么原因呢,需要怎么调试。

使用的是 langchain 框架,私有模型用的是 gpustack 在 macstudio m3ultra 上部署的。

第 1 条附言  ·  2025 年 6 月 13 日

是我的问题,对接 deepseek/qwen 这类私有模型,langchain 应该用 llm.stream(messages),然后再一个 chunk 一个 chunk 读出来就 ok 了,这样 32b 也能取得比较好的效果。用 llm.invoke 容易显示不全