惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

S
Security Archives - TechRepublic
C
Cyber Attacks, Cyber Crime and Cyber Security
P
Proofpoint News Feed
Cisco Talos Blog
Cisco Talos Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
CERT Recently Published Vulnerability Notes
S
Secure Thoughts
H
Hacker News: Front Page
I
Intezer
Cyberwarzone
Cyberwarzone
T
Tor Project blog
The Last Watchdog
The Last Watchdog
Google DeepMind News
Google DeepMind News
T
Threatpost
T
Tenable Blog
NISL@THU
NISL@THU
AWS News Blog
AWS News Blog
阮一峰的网络日志
阮一峰的网络日志
T
Troy Hunt's Blog
E
Exploit-DB.com RSS Feed
V
Visual Studio Blog
W
WeLiveSecurity
腾讯CDC
The GitHub Blog
The GitHub Blog
T
The Exploit Database - CXSecurity.com
Engineering at Meta
Engineering at Meta
H
Hackread – Cybersecurity News, Data Breaches, AI and More
V
V2EX - 技术
A
Arctic Wolf
N
Netflix TechBlog - Medium
S
Securelist
WordPress大学
WordPress大学
Schneier on Security
Schneier on Security
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Vercel News
Vercel News
Recent Commits to openclaw:main
Recent Commits to openclaw:main
AI
AI
N
News | PayPal Newsroom
T
The Blog of Author Tim Ferriss
B
Blog
Apple Machine Learning Research
Apple Machine Learning Research
Help Net Security
Help Net Security
Google Online Security Blog
Google Online Security Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
G
Google Developers Blog
小众软件
小众软件
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Cloudbric
Cloudbric
P
Palo Alto Networks Blog

站点状态

20260526 - 关于已经修复的 404 bug 的具体原因 [站点状态] 20260526 - 大于某个 ID 的主题全部出现 404 跳转的问题 20260203 - 基于 GPT 模型的图片生成功能 - V2EX 20260128 - 节点管理的新选项:新主题通知 20260123 - NodeBlocklist - V2EX 20260113 - 查看自己创建的节点的流量统计 / 创建更多节点 / 节点侧边栏管理 / Topic Boost - V2EX 20260111 - 节点友情链接 - V2EX 20260110 - /node/create - V2EX 20250815 - 忽略节点设置现在已经对 /recent 生效 20250722 - Solana 打赏功能更新 1 - V2EX 20250721 - Solana 原生代币 SOL 打赏 - V2EX 20250713 - Solana 登录和注册支持已经部署并开启 - V2EX 20250620 - 2FA 开启和关闭时的邮件提醒 - V2EX 20250619 - 10 分钟左右的停服维护 - V2EX 20250618 - OTP 输入有时候会失效的问题似乎是修好了 20240505 - 邀请码系统 20230514 - 关于主题分页 502 问题的进一步进展 20230509 - 关于部分用户在访问需要翻页的主题时遇到的 502 问题 20230224 - 正在修复队列系统的一个问题 20211208 - 大约持续了 3 个小时的头像上传问题 20211208 - 创建新主题时的草稿问题 20211201 - 在回复列表的用户名旁增加了楼主(OP)标注 20211003 - 修复了由于 webfont 引起的页面显示延迟 20211002 - 修复了记事本编辑框的自适应高度问题 20211001 - 新功能 - 最近访问过的主题 20200310 - 大约持续了 12 分钟的一个故障 20191019 - 关于 Light Mode 的样式问题 20190828 - 关于北京时间 8 月 28 日早上 10:30 到 10:45 大约持续了 15 分钟的服务不稳定的原因 20190715 - 关于广告代码的问题 20190706 - 关于最近基础架构方面的一些变动 20190701 - 关于 CST 时间 2019 年 7 月 1 日 / PT 时间 2019 年 6 月 30 日的服务问题 20180422 - 关于最近(2018 年 4 月初到中旬)未读提醒数字不正确的问题 20171016 - 对登录冷却系统的改进 20170930 - 重要提示 - V2EX 在 2017 年 9 月 30 日正在遭遇一个密码碰撞攻击 20170921 - 访问问题说明 20170830 - DDoS 攻击造成的间歇性超时 20170303 - 关于大约持续了 16 个小时的登录问题 20170206 - 更新了头像图片的 CDN 地址 20170110 - Anti Spam 新策略的 bug 导致刚注册的用户无法发帖 20170102 - 22:15-22:50 之间的翻页问题 20161216 - 广东电信用户及根域名访问看到 Access Denied 20161203 - captive.v2ex.co 证书过期问题 20160901 - V2EX Origin 网络问题 20160609 - 中国电信路由问题 20160318 - 邮件发送问题,已经修复 20160110 - 海外访问问题 20150615 - 联通访问问题
20241230 - vLLM + Qwen2.5-Coder-32B-Instruct 驱动的新的标签系统 - V2EX
Livid · 2024-12-30 · via 站点状态

这是一个创建于 531 天前的主题,其中的信息可能已经有所发展或是发生改变。

V2EX 除了节点之外,也会根据主题内容生成 3 个 tag 。

之前这个系统用的是 Boson NLP 提供的服务,不过他们后来停止了这个 API 服务。

然后这件事情就搁置了一段时间。

最近用 vLLM 部署了 Qwen2.5-Coder-32B-Instruct ,然后尝试用 prompt 的方式来为主题生成标签。虽然某些时候会产生无限循环,但是大部分情况下效果很不错。

目前大概 2 - 3 秒可以分析完一个主题并生成 3 个 tag 。

  • vLLM
  • 标签

    13 条回复    2025-01-02 18:40:38 +08:00

    Tubbs

    1

    Tubbs      2024 年 12 月 30 日 via Android

    vLLM 部署确实很方便,用的什么设备部署的呢?

    Donaldo

    3

    Donaldo      2024 年 12 月 30 日

    同一张卡,同一个 CUDA 版本,vllm 我实测比 ollama 快几个 token/s 。

    Livid

    4

    Livid      2024 年 12 月 30 日

    @yangyaofei 也试过 Llama 和 QwQ-32B-Preview

    Llama 会在输入是中文内容的情况,依然给出英文结果。

    QwQ 的输出结果大部分情况下太自由发挥了。

    Qwen2.5-Coder 的结果是最稳定的。

    Google 的 Gemini 2.0 效果也很好,但是免费额度和频率限制不太够用。

    Livid

    5

    Livid      2024 年 12 月 30 日

    另外一个考虑就是因为这里大部分的内容,估计和 Coder 的训练内容也是重合的。

    scys

    8

    scys      2024 年 12 月 30 日

    好想 => 好像,感觉 Prompt 可以提供例子,可能会更加准确。我现在用的 Flux Prompt 构建器,提供例子会更加准确。仅作参考,不是 Prompt 达人。

    Livid

    9

    Livid      2024 年 12 月 30 日

    @scys 是的。而且每次生成的结果是不一样的。

    我试试让那个帖子重新生成一次。

    musi

    10

    musi      2024 年 12 月 30 日 via iPhone   ❤️ 2

    除了标签之外 v2 有考虑使用 embedding 做语义化搜索帖子的功能吗

    yangyaofei

    11

    yangyaofei      2024 年 12 月 31 日   ❤️ 2

    @Livid #4 哦, qwq llama 肯定是不行的, 前者是尽量 CoT 会输出很多中间过程, llama 个代都对中文支持很不好, 我想说的是比如 qwen2.5-instruct 这种非 coder 模型. 如果显存够的话, 65B 的 4bit 量化模型性能很不错的

    生成原文没有的词挺正常的, 毕竟生成模型, 而且也不一定影响结果的正确, 想避免的话可以 prompt 加入用原文的词的设定, 想进一步控制的话, 可能性能就下降很多了(比如前面的 Guided 方式也可以实现)

    Livid

    12

    Livid      2025 年 1 月 2 日   ❤️ 1

    @musi 今天刚刚把 faiss 的 demo 跑通,这个东西太有意思了,可以做的不只是搜索,相关性推荐看起来也可以。

    如果用 384 的 dimension 参数,貌似要把 V 站目前的 110 万个主题给索引,差不多可能需要至少 1.5G 的显存?

    musi

    13

    musi      2025 年 1 月 2 日 via iPhone   ❤️ 1

    @Livid 赞,希望在不久的将来能在 v2 上看到这些功能。不过推荐的话不知道有没有用户反感推荐算法的