




















AI 发展可谓日新月异,前脚 Google I/O 的发布会刚结束,后脚又发布了最新的 claude 4 大模型。这两天,DeekSeek 也升级了他们的R1模型。昨日, ChatGPT 还是“小甜甜”,今天已是“牛夫人”了。然而,无论多么强大的模型,目前都还无法做到无所不能,不同的模型有各自擅长的领域,因此在日常工作中,我常常需要根据需求选择不同的模型。这篇文章将总结一下我手头的AI“员工们”,以及我常常给他们安排的任务。
目录

我通常不需要AI帮我大段写作,更希望它能在不改变原有内容和行文风格的基础上,对文字进行润色,避免语法问题影响表达流畅性。为此,我希望AI尽量少做改动,减少自主发挥。在众多 AI 模型中,ChatGPT最符合我的需求。但当它表现不佳时,我也会尝试使用Gemini和Claude。
对于大模型来说,翻译并不难,尤其是英译中。我尝试过将同一段论文摘要交给不同的大模型翻译,发现它们的翻译效果都很不错,差异主要体现在行文风格和用词上。主观上觉得,Gemini 2.5 Pro和豆包在易读性上稍微优于其他模型。
为了更方便快捷地翻译,我通常会结合不同的AI客户端使用。此时,我常使用提供免费API的Gemini 2.0/2.5 Flash,它不仅翻译效果不错,而且速度也非常快。此外,DeepSeek V3 API 价格低廉,且有很多平台有免费额度赠送,也是一个不错的选择。
相信大家已经看到过不少使用AI编写软件的例子了。在工作和生活中,我也会利用AI编写程序、分析数据,或者制作博客插件。目前,我主要使用Gemini 2.5 Pro和Claude 4,两者各有特色。
Gemini 2.5 Pro支持长达100万token的超长上下文,因此在进行多轮对话修改程序时,它能表现得更好,出现“遗忘”的情况较少。而且,Gemini更“听话”,会更遵从指令,较少出现“自作聪明”的情况。与Gemini进行头脑风暴时,我觉得它更稳定,通常能给出更合适的代码建议。
Claude 4是最近才开始使用的,通常只有在Gemini表现不佳时,我才会启用它。虽然Claude在代码能力上确实领先其他模型,评分也远高于竞争对手,但由于Claude 3.7版本时,它曾经常自作主张,擅自修改我未要求调整的代码,因此我对它仍然心有余悸。
听说最近更新的DeepSeek R1 0528版本在代码能力上突飞猛进,我打算在未来的工作中多加尝试,看看是否能取代Gemini 2.5 Pro。
当需要生成图片时,尤其是制作博客封面图,我通常会优先使用ChatGPT,其次是豆包和 Grok。ChatGPT能够更好地理解我对图像效果的要求,并且输出稳定,只要提供合适的提示词,就能生成理想的图片。唯一的缺点是,免费用户生成图片时需要排队,速度较慢。
豆包在趣味性方面表现较强,有时会使用它来尝试一些有趣的提示词。

我并没有很强的视频需求,主要是为了娱乐。Google I/O发布的Veo3能够生成8秒的视频,并且会自动为视频配上合适的音效和背景音乐,效果非常自然,令人惊艳。另外,使用即梦生成的视频效果也不错,搭配ChatGPT或豆包生成的图片进行创作,趣味十足。
https://www.iesdouyin.com/share/video/7508290944656018742



以上是我在日常生活和工作中探索 AI 工具时的一些心得体会。这些都仅仅是我个人的主观感受和粗浅见解,毕竟每个人在各自特定的使用场景和需求下,或许都会有独一无二的AI选择和应用方式。
我非常期待能在评论区看到大家更多真知灼见和精彩分享,一起交流我们是如何驾驭AI,让它更好地为我们服务!
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。