集合！我的AI员工们

首页发现

AI 归档 | Jack's Space

7 刀 VPS 照样玩转 Clawdbot (Moltbot) AI翻译这么强，我为什么还在学英语？谁不想拥有专属的微信表情包呢一元 kimi 加上 Claude Code，真香 Hey Siri，呼叫贾维斯小白也能轻松上手！用 Cherry Studio 搭建你的专属 AI 知识库

集合！我的AI员工们

阿杰 Jack · 2025-06-02 · via AI 归档 | Jack's Space

AI 发展可谓日新月异，前脚 Google I/O 的发布会刚结束，后脚又发布了最新的 claude 4 大模型。这两天，DeekSeek 也升级了他们的R1模型。昨日， ChatGPT 还是“小甜甜”，今天已是“牛夫人”了。然而，无论多么强大的模型，目前都还无法做到无所不能，不同的模型有各自擅长的领域，因此在日常工作中，我常常需要根据需求选择不同的模型。这篇文章将总结一下我手头的AI“员工们”，以及我常常给他们安排的任务。

太长懒得看
联网搜索
文字润色
文字翻译
代码编写
图像生成
视频生成
好用的工具们
小结

太长懒得看

Gemini：DeepResearch、文字润色、翻译、代码编写、视频生成
ChatGTP：文字润色、图像生成
Claude：代码编写，文字润色
Grok：联网搜索、图像生成
DeepSeek：翻译、代码编写（将来）
腾讯元宝：联网搜索
点点：联网搜索
豆包：文字润色、图像生成
即梦：视频生成
其他好用的工具：NotebookLM、Trae/Windsurf/Cursor、Cherry-studio、Juchats、UniAPI

联网搜索

Gemini: 得益于Google搜索的强大支持，Gemini在联网搜索方面表现出色。特别是使用Deep Research功能进行严谨的学术搜索时，Gemini能够帮我访问近百个网站，花费十几分钟为我总结出内容，且参考的网站质量非常高，让我对其生成的报告充满信心。唯一不足的是，Gemini在日常提问中缺乏明确的“联网”按钮，导致联网功能有时不能稳定触发。

Grok: 是马斯克的X公司（前身为推特）的模型。如果想要搜索的信息已经在X平台上引发过热烈讨论，Grok往往能够提供非常及时、相关的结果。
点点: 这是小红书的AI模型，只有手机客户端。小红书作为国内发展迅速的社交媒体平台，拥有大量姐妹分享各类攻略、测评和技巧。当我需要快速获取一些生活类的攻略或测评信息时，点点是我常用的选择。
腾讯元宝: 公众号是国内最大的长文内容平台之一，包含了许多优秀的长篇文章。元宝凭借背靠公众号平台的优势，在搜索信息时展现出天然的竞争力，因此它也是我常用的AI工具之一。

文字润色

我通常不需要AI帮我大段写作，更希望它能在不改变原有内容和行文风格的基础上，对文字进行润色，避免语法问题影响表达流畅性。为此，我希望AI尽量少做改动，减少自主发挥。在众多 AI 模型中，ChatGPT最符合我的需求。但当它表现不佳时，我也会尝试使用Gemini和Claude。

文字翻译

对于大模型来说，翻译并不难，尤其是英译中。我尝试过将同一段论文摘要交给不同的大模型翻译，发现它们的翻译效果都很不错，差异主要体现在行文风格和用词上。主观上觉得，Gemini 2.5 Pro和豆包在易读性上稍微优于其他模型。

为了更方便快捷地翻译，我通常会结合不同的AI客户端使用。此时，我常使用提供免费API的Gemini 2.0/2.5 Flash，它不仅翻译效果不错，而且速度也非常快。此外，DeepSeek V3 API 价格低廉，且有很多平台有免费额度赠送，也是一个不错的选择。

代码编写

相信大家已经看到过不少使用AI编写软件的例子了。在工作和生活中，我也会利用AI编写程序、分析数据，或者制作博客插件。目前，我主要使用Gemini 2.5 Pro和Claude 4，两者各有特色。

Gemini 2.5 Pro支持长达100万token的超长上下文，因此在进行多轮对话修改程序时，它能表现得更好，出现“遗忘”的情况较少。而且，Gemini更“听话”，会更遵从指令，较少出现“自作聪明”的情况。与Gemini进行头脑风暴时，我觉得它更稳定，通常能给出更合适的代码建议。

Claude 4是最近才开始使用的，通常只有在Gemini表现不佳时，我才会启用它。虽然Claude在代码能力上确实领先其他模型，评分也远高于竞争对手，但由于Claude 3.7版本时，它曾经常自作主张，擅自修改我未要求调整的代码，因此我对它仍然心有余悸。

听说最近更新的DeepSeek R1 0528版本在代码能力上突飞猛进，我打算在未来的工作中多加尝试，看看是否能取代Gemini 2.5 Pro。

图像生成

当需要生成图片时，尤其是制作博客封面图，我通常会优先使用ChatGPT，其次是豆包和 Grok。ChatGPT能够更好地理解我对图像效果的要求，并且输出稳定，只要提供合适的提示词，就能生成理想的图片。唯一的缺点是，免费用户生成图片时需要排队，速度较慢。

豆包在趣味性方面表现较强，有时会使用它来尝试一些有趣的提示词。

视频生成

我并没有很强的视频需求，主要是为了娱乐。Google I/O发布的Veo3能够生成8秒的视频，并且会自动为视频配上合适的音效和背景音乐，效果非常自然，令人惊艳。另外，使用即梦生成的视频效果也不错，搭配ChatGPT或豆包生成的图片进行创作，趣味十足。

https://www.iesdouyin.com/share/video/7508290944656018742

好用的工具们

NotebookLM: 这是我近期最喜欢使用的工具，属于Google的产品。用户可以将文件、网站链接、YouTube链接等资料投入一个“笔记本”中，AI根据勾选的资料来思考并回答问题（可以选择全部或部分资料）。用户还可以追溯回答中引用了哪些具体资料，极大减少了AI的幻觉问题（在我的使用中没有遇到幻觉），提高了对回答的信心。此外，NotebookLM还支持根据资料库生成语音播客，用户可以听到两个AI主播的对话，快速理解内容。如果你使用英文，还能中途参与对话。

Trae/Windusrf/Curor: 这些是基于先进大模型（如Claude 4、Gemini 2.5 Pro等）的AI驱动集成开发环境（IDE），可以提供智能代码生成、实时补全、自动调试和优化等功能，大大提高了编程效率。

Cherry-studio：一款开源桌面客户端软件，支持Windows、Mac和Linux平台，集成了多种大型语言模型（如OpenAI、Gemini等）。界面直观，用户可以开箱即用，提供多模型对话、知识库管理、AI绘图、翻译等功能，最近还新增了划词功能。

Juchats：我喜欢将它形容为一把小瑞士军刀，集成了GPT、Claude、Gemini、Grok、DeepSeek等流行的大模型，并且进行了进一步开发，提供一些独特的小功能，如X信息流总结、文档解析等。最关键的是，Juchats非常适合国内用户使用，不需要特殊的上网技巧，并且免费用户也能享有一定的额度。
UniAPI: 一个性价比不错的的 AI 模型 API 转发服务平台，提供各个模型的 API，方便无法自行注册使用 GPT 、Claude 等 API 的用户。价格也比官方更实惠，注册就可以提供 1 美元的试用。

小结

以上是我在日常生活和工作中探索 AI 工具时的一些心得体会。这些都仅仅是我个人的主观感受和粗浅见解，毕竟每个人在各自特定的使用场景和需求下，或许都会有独一无二的AI选择和应用方式。

我非常期待能在评论区看到大家更多真知灼见和精彩分享，一起交流我们是如何驾驭AI，让它更好地为我们服务！

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

AI 归档 | Jack's Space

太长懒得看

联网搜索

文字润色

文字翻译

代码编写

图像生成

视频生成

好用的工具们

小结