


























1
难道Claude的模型真的是针对编程进行了专门的优化而其他专业知识很差吗?最近用上了君大佬公益站的4.8 opus,也是体验上了A畜家的顶级模型。但是这个模型在使用中表现的飘忽不定也是让我非常的迷惑。跟GPT5.5一样的毫无疑问的SOTA模型,无论是用来精读文献还是用来写个浏览器插件都是给人很大惊喜。但是当我用在我日常最常见的工作中的时候,它的表现却让我产生了深刻的怀疑与自我怀疑。我是搞人口学研究的,平时搞搞人口预测,生育率研究之类,用的最多的是R语言。一般都是用codex或者Claude code插件在postrion中使用的。之前用codex或者把deepseek接到Claude code中用都基本能跑的通。但是Claude opus 4.8的表现确实是给我看傻了,甚至让我一度怀疑他是不是豆包附体了。一样的项目问题和需求文件,GPT5.5,甚至deepseek v4 pro都能很好的理解意图和专业知识,也能根据项目文档自主的去查看索引文件和数据,然后搞清楚之后开始干活。但是opus4.8,一上来就是傻快傻快的开始干活,干了一阵子我感觉不对劲,质问他,结果就是豆包式认错。然后搞一圈它连数据文件都不知道在哪,我都不知道他怎么跑的。然后要像带菜鸟一样,一步步告诉他文件在哪,专业常识是什么,然后它才能干活。经常跟他磨快一个小时嘴皮子,活还没有开始干。佬们,是我使用的打开方式不对吗?还是说换opus4.6会好一点。Claude再怎么总不至于世界知识还不如deepseek的吧
Pluto_Aroen (Pluto Aroen) 2
同muyuan大佬公益站的4.8 opus,个人体感被之前能用的gpt5.5断档了,可能是渠道问题?
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。