集合!我的AI员工们

AI 发展可谓日新月异,前脚 Google I/O 的发布会刚结束,后脚又发布了最新的 claude 4 大模型。这两天,DeekSeek 也升级了他们的R1模型。昨日, ChatGPT 还是“小甜甜”,今天已是“牛夫人”了。然而,无论多么强大的模型,目前都还无法做到无所不能,不同的模型有各自擅长的领域,因此在日常工作中,我常常需要根据需求选择不同的模型。这篇文章将总结一下我手头的AI“员工们”,以及我常常给他们安排的任务。
太长懒得看
- Gemini:DeepResearch、文字润色、翻译、代码编写、视频生成
- ChatGTP:文字润色、图像生成
- Claude:代码编写,文字润色
- Grok:联网搜索、图像生成
- DeepSeek:翻译、代码编写(将来)
- 腾讯元宝:联网搜索
- 点点:联网搜索
- 豆包:文字润色、图像生成
- 即梦:视频生成
- 其他好用的工具:NotebookLM、Trae/Windsurf/Cursor、Cherry-studio、Juchats、UniAPI
联网搜索
- Gemini: 得益于Google搜索的强大支持,Gemini在联网搜索方面表现出色。特别是使用Deep Research功能进行严谨的学术搜索时,Gemini能够帮我访问近百个网站,花费十几分钟为我总结出内容,且参考的网站质量非常高,让我对其生成的报告充满信心。唯一不足的是,Gemini在日常提问中缺乏明确的“联网”按钮,导致联网功能有时不能稳定触发。

- Grok: 是马斯克的X公司(前身为推特)的模型。如果想要搜索的信息已经在X平台上引发过热烈讨论,Grok往往能够提供非常及时、相关的结果。
- 点点: 这是小红书的AI模型,只有手机客户端。小红书作为国内发展迅速的社交媒体平台,拥有大量姐妹分享各类攻略、测评和技巧。当我需要快速获取一些生活类的攻略或测评信息时,点点是我常用的选择。
- 腾讯元宝: 公众号是国内最大的长文内容平台之一,包含了许多优秀的长篇文章。元宝凭借背靠公众号平台的优势,在搜索信息时展现出天然的竞争力,因此它也是我常用的AI工具之一。
文字润色
我通常不需要AI帮我大段写作,更希望它能在不改变原有内容和行文风格的基础上,对文字进行润色,避免语法问题影响表达流畅性。为此,我希望AI尽量少做改动,减少自主发挥。在众多 AI 模型中,ChatGPT最符合我的需求。但当它表现不佳时,我也会尝试使用Gemini和Claude。
文字翻译
对于大模型来说,翻译并不难,尤其是英译中。我尝试过将同一段论文摘要交给不同的大模型翻译,发现它们的翻译效果都很不错,差异主要体现在行文风格和用词上。主观上觉得,Gemini 2.5 Pro和豆包在易读性上稍微优于其他模型。
为了更方便快捷地翻译,我通常会结合不同的AI客户端使用。此时,我常使用提供免费API的Gemini 2.0/2.5 Flash,它不仅翻译效果不错,而且速度也非常快。此外,DeepSeek V3 API 价格低廉,且有很多平台有免费额度赠送,也是一个不错的选择。
代码编写
相信大家已经看到过不少使用AI编写软件的例子了。在工作和生活中,我也会利用AI编写程序、分析数据,或者制作博客插件。目前,我主要使用Gemini 2.5 Pro和Claude 4,两者各有特色。
Gemini 2.5 Pro支持长达100万token的超长上下文,因此在进行多轮对话修改程序时,它能表现得更好,出现“遗忘”的情况较少。而且,Gemini更“听话”,会更遵从指令,较少出现“自作聪明”的情况。与Gemini进行头脑风暴时,我觉得它更稳定,通常能给出更合适的代码建议。
Claude 4是最近才开始使用的,通常只有在Gemini表现不佳时,我才会启用它。虽然Claude在代码能力上确实领先其他模型,评分也远高于竞争对手,但由于Claude 3.7版本时,它曾经常自作主张,擅自修改我未要求调整的代码,因此我对它仍然心有余悸。
听说最近更新的DeepSeek R1 0528版本在代码能力上突飞猛进,我打算在未来的工作中多加尝试,看看是否能取代Gemini 2.5 Pro。
图像生成
当需要生成图片时,尤其是制作博客封面图,我通常会优先使用ChatGPT,其次是豆包和 Grok。ChatGPT能够更好地理解我对图像效果的要求,并且输出稳定,只要提供合适的提示词,就能生成理想的图片。唯一的缺点是,免费用户生成图片时需要排队,速度较慢。
豆包在趣味性方面表现较强,有时会使用它来尝试一些有趣的提示词。

视频生成
我并没有很强的视频需求,主要是为了娱乐。Google I/O发布的Veo3能够生成8秒的视频,并且会自动为视频配上合适的音效和背景音乐,效果非常自然,令人惊艳。另外,使用即梦生成的视频效果也不错,搭配ChatGPT或豆包生成的图片进行创作,趣味十足。
https://www.iesdouyin.com/share/video/7508290944656018742
好用的工具们
- NotebookLM: 这是我近期最喜欢使用的工具,属于Google的产品。用户可以将文件、网站链接、YouTube链接等资料投入一个“笔记本”中,AI根据勾选的资料来思考并回答问题(可以选择全部或部分资料)。用户还可以追溯回答中引用了哪些具体资料,极大减少了AI的幻觉问题(在我的使用中没有遇到幻觉),提高了对回答的信心。此外,NotebookLM还支持根据资料库生成语音播客,用户可以听到两个AI主播的对话,快速理解内容。如果你使用英文,还能中途参与对话。

- Trae/Windusrf/Curor: 这些是基于先进大模型(如Claude 4、Gemini 2.5 Pro等)的AI驱动集成开发环境(IDE),可以提供智能代码生成、实时补全、自动调试和优化等功能,大大提高了编程效率。

- Cherry-studio:一款开源桌面客户端软件,支持Windows、Mac和Linux平台,集成了多种大型语言模型(如OpenAI、Gemini等)。界面直观,用户可以开箱即用,提供多模型对话、知识库管理、AI绘图、翻译等功能,最近还新增了划词功能。

- Juchats:我喜欢将它形容为一把小瑞士军刀,集成了GPT、Claude、Gemini、Grok、DeepSeek等流行的大模型,并且进行了进一步开发,提供一些独特的小功能,如X信息流总结、文档解析等。最关键的是,Juchats非常适合国内用户使用,不需要特殊的上网技巧,并且免费用户也能享有一定的额度。
- UniAPI: 一个性价比不错的的 AI 模型 API 转发服务平台,提供各个模型的 API,方便无法自行注册使用 GPT 、Claude 等 API 的用户。价格也比官方更实惠,注册就可以提供 1 美元的试用。
小结
以上是我在日常生活和工作中探索 AI 工具时的一些心得体会。这些都仅仅是我个人的主观感受和粗浅见解,毕竟每个人在各自特定的使用场景和需求下,或许都会有独一无二的AI选择和应用方式。
我非常期待能在评论区看到大家更多真知灼见和精彩分享,一起交流我们是如何驾驭AI,让它更好地为我们服务!
集合!我的AI员工们最先出现在Jack's Space。