





















codex 是 openai 的产品,他们其实一直走的路线,就是想让自己的 AI 模型,深入渗透到每个人生活中的点点滴滴。就像我们的 豆包 一样。
因此,codex 其实看起来是 一个编程工具,但是你看最近它们又搞出了官方 APP 版本,其实这个工具也是一个能力很强的全能型选手,不仅在编程上是很强的智能体,我们在电脑上干的事,都能被赋能。
光 写代码,太亏了。一个月少说也是一年半的视频会员。

我今天在推特上,看到人家的官方团队成员,分享的 codex 使用报告,可以帮我们更深入的使用 codex ,毕竟能用的,都是付费 plus 用户吧?我说的不错吧?既然掏钱了,就得享受更多的服务。
中文译文在这里:
我把我读的时候的笔记在下面整理了一下,建议大家读读原文。
简而言之,就是置顶几个对话。
作者建议,把那些需要长久会用到的,可能要用很久的对话,置顶一下。
确实,我今天才发现,codex 的对话是有置顶功能的哈哈。
现在的 agent 是很先进的,现在的对话框,肯定是不会出现以前 deepseek 那样,说着说着就达到对话长度限制了,现在的 agent 内部会做很多处理。
一个对话,理论上,你跟它对话一辈子,都能一直再聊。
一个对话,就像一个人,它会记得你的过去、爱好、进展等等,,, 可以可以!
置顶快捷键让这个操作变得极为实用。只要按下Command-1到Command-9,你就能瞬间穿越回这些保存好的专属对话流里继续工作。
很实用。你可以一个对话当你的保姆、一个对话当你的 军师、一个做你的秘书、一个陪你聊心里话....
这个没什么好说的。我们用豆包很久了,都习惯了。chatgpt 毕竟是大模型,它呢个听懂很多模模糊糊、寥寥草草的口述。
作者说是 运行中的任务 + 语音输入。
一个任务在运行时,可以直接拿鼠标在关键地方指指点点,然后开口直接跟 codex 指导,说这个小一点,那个太丑了,这个写错了。。。
哈哈,有点意思,我还没试过。有种 人机合一 的感觉。
大家可以试一下。我大部分时间是 cli 工具在编程,UI 界面用的少。
可以使用这些东西,来指代 一些概念,比如 $browser :

添加图片注释,不超过 140 字(可选)
$browser 在侧边栏中运行的应用内浏览器,Codex 可以在这里审查网页并在上面做标记。
以及一些插件:
@chrome 可以获取你浏览器的登录状态,用来处理那些基于 Chrome 的工作流。
@computer 专治那些只能通过桌面图形界面 (GUI) 来完成的任务。
$browser 适合在侧边栏做网页审查;@chrome 适合那些需要你账号登录状态的浏览器内工作;而 @computer 则用来搞定那些只能在电脑桌面上点来点去的任务。
看起来 Chrome 挺好用的,就是得用插件。
加上 computer ,直接整个电脑都打包送给 openai 了哈哈 ~
尤其是 computer ,它是直接接替了鼠标!!! 你可以让它干几乎所有需要鼠标能做的事!!!
加上 MCP 和 SKILL ,就能对这个电脑为所欲为了!
不知道大家有没有用过这个功能。
它可以直接定时去做一些事。这个比电脑自带的各种自动化工具好多了。
把对话流置顶固然好用,但它毕竟还得等你主动回去找它。而“对话流自动化”则可以每隔几分钟或几小时自己去查岗,一直跑到满足某个条件为止,甚至还能根据情况自己调整查岗的频率。 比如,你的“幕僚长”对话流可以每 30 分钟跑一次: 每 30 分钟,去查一下我的 Slack 和 Gmail 里有没有需要处理但还没回的消息。 帮我排个优先级。 如果有人向我提问,尽可能深入地去查资料,然后帮我起草一份回复,但不要直接发送。 当你回到电脑前时,那些最耗时耗力的“收集背景资料”的工作往往已经做完了。作为人类,你只需要做最后拍板发出去的决定。
很可惜,我只是把一直把它当成一个 rss 订阅器使用。就是有点昂贵....
原谅我的想象力,我知道自动化是超级强大的功能,这基本上是把饭给喂到嘴边了。
不过,随着我们公司的业务,我觉得未来用它的次数还是会很多的。
文章里面还【目标设定 (Goals)】,就是写个目标,codex 持续给你一直自动开发,直到开发出来。
还有 【侧边栏 (The side panel)】让你生成的工作成果始终和你们的聊天窗口并排在一起。

还有【共享记忆 (Shared memory)】,当那些长时间运行的对话流能够打破单次聊天的界限,把记忆共享出去时,它们的作用将发生质的飞跃。
大家感兴趣,可以读读原文。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。