

























在AI对练项目中,大模型对客户经理的回答打分。测试的时候,客户经理可能乱输入数字,比如1,2。这是提示词没有正确识别到客户经理真正的回答,导致胡乱回答,得分还很高。
优化了好几次提示词,还是不能解决。
后面和产品讨论的时候,产品提出了一个解决方案。如果回答内容长度小于5个字,就直接给0分,解析文案回答过短,不得分。这个方案很不错,不用担心大模型,在这种情况下打分不准。
这和我们实现一个需求类似,可能技术不太好实现。我们可以尝试在业务逻辑,上做一些处理,限制。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。