
























我在自己nas的群晖docker上部署了hermes,由于目前还不太懂,所以都搞的一些免费模型来尝试,看看到底是个什么东西,使用中发现一个问题:随便问什么问题,都是很简单的,回答很慢不说,还动不动就提示出错,估计是模型限流限token限并发什么的。于是我看了看调用后台,一看随便什么简单的问题输入输出token都上万啊,这可怎么玩儿,我想到那花钱养的佬友不是天价?特此有个疑问想来请教一下大家,希望大家指教,谢谢
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。