AB

遥控 AI - 2026H1 回顾

2026年 07月 03日



今天听到一个部分认同的观点:“模糊的正确好于正确的延迟”,顺便也想写一下对过去一段时间的反思。最近半年经常有点空闲,工作摸鱼的时候,时常花很多时间去刷社交媒体,看无用的资讯和信息,缺少时间自省,也缺少产出的动力。我还是向往去尝试一些没有走过的路径,无论是尝试炒股投资,还是尝试学习不了解的知识,接触没遇到过的领域。

今年上半年,五月之前的主线是办婚礼和买车。我花了比较长的时间做 2026 年的财务规划,做买车的调研,做婚礼的方案。这些生活事务占用了我工作内外一大半的空闲时间,不过确实都算是大事,最终也都圆满结束了。至少我对最终的结果还是比较满意的。

但这种满意不会持续很久,人总是在不满足的痛苦与满足的无聊之间徘徊。在生活上耗费了过多的精力,重新投入工作之后,发现前段时间在工作上确实投入过少。近半年整个世界都发生了显著的变化,而更大的变化就在眼前,但似乎我并没有什么值得一提的产出,也没有什么内容可以追溯,这就让人很焦虑。

时间回转,这半年虽然重心不在工作上,我倒也不是什么都没做,主要的努力集中在,积极尝试让 AI 融入甚至接管我的工作流程上。近两个月,自然语言编程 + SOTA Agent 基本已经能够完成我 95% 的日常需求工作量。回看半年以前,我还无法做到这一点。我的工作流和半年前相比,有什么差别呢?

遥控 AI 的工作流

我的工作流的核心变化是从之前的 SDD,Spec Driven 方式,转变为了 Grill Driven 的方式。这里 Grill 的意思是说,我尽量提出一个信息量足够的输入,然后让 Agent 提问来补完剩下的部分。在 SDD 的各种方案中,OpenSpec 生成的方案过于草率了,无法给最终完成工作的 Agent 提供充分的指引;Superpowers 要好很多,提供了足够完整的工具集,拆分的步骤也相对更合理,但是在 Brainstorm 的阶段,给人的反馈又过少了,这一阶段实际需要人的深度参与,但一次性阅读大量 AI 生成内容,会给人带来很高的心智负担,所以对责任心要求就过高了。相比做一个最终的执行者,目前的 AI 其实更擅长 Review 并给出建议。

提问本身并不是很新颖的思路,最早 Roo Code 就提出了这个范式,让 Agent 主动提问来约束方向。后来,各种 Coding Agent 的 Tools 里面都加入了提问这个能力,可以提供选项,也会要求人明确地给出文本答案。但 Grill Skill 通过更加鲜明,更加直接的方式来实践这种策略,带来的结果和以前完全不一样。

/grill-me 很好地解决了 Brainstorm 对人的责任心要求过高的问题,把 Brainstorm 中 Agent 的各种决策拆解成了一个个小的问题让人来确认,通过制造摩擦的方式来把 Agent 和人对这件事的认知拉到同一水平。/grill-with-docs 作为进阶版本,把关键信息差和决策放进一份持久化的上下文,使得整个流程更适合多 Agent 或者多会话协作。通过 Grill 的方式最大化 Brainstorm,使得 Plan 阶段前可以尽可能输入足够充分的信息,对于不太复杂的需求来说,做到这样的程度,可以让 Agent 完成 95% 的工作内容。对于更复杂的需求,比如历史债务庞大,对较大的代码仓库做侵入核心逻辑的改动,还是需要人来做细致的 Review。

然而 Grill 之后就是无尽的对话和等待,带来长久的注意力涣散。

也许记录是注意力涣散的解法

去年来说,我一直有记录的习惯,记录了大量平时阅读的材料、工作的内容和细节。但今年,虽然也写了很多笔记,有在持续记录生活和学习的乱七八糟内容,但是因为 Agent 对日常工作和生活的侵入,这个记录的习惯变得时断时续,比如日常依赖 Hermes 对家里的设备进行运维、管理提效的脚本,再比如会将大量的问题转交给 Agent 解决,比如一些简单的需求(这个简单的标准在慢慢提升当中),比如信息的提取和检索。

今天看到一篇关于职场中日常记录自己的 Post,过去我对此类文章都持有不置可否的态度。第二大脑确实是重要的东西,但维护他需要的心智负担也不容小觑,如果希望记录下言之有物的内容,并不是“每天十分钟记录,每周半小时总结”这么简单的。

可能是因为最近空闲时间很多,我花了太多的时间在吸取无用的信息上导致注意力涣散,于是意识到把这个时间花费在记录上可能更有意义。空耗时间可能是缺乏输出的精力,或者缺乏输出的方向,记录也许可以是解决这两个问题的途径。没有精力的时候,做一点微小的简单的日记来短暂地逃离工作本身,缺乏方向的时候,可以从过往的记录当中寻找一些灵感,在注意力涣散的节奏当中让关键事务更能延续下去。

下一个问题应该是记录什么。之前的记录模式也许在现在看已经不太合适了。我之前更倾向于记录今天做了什么,还需要做什么,遇到了哪些问题。现在高度依赖 Agent 之后,交付压力明显比过去要小很多。实际交付所需时间不会减少太多,而在等待 Agent 工作的间隙,会多出很多碎片时间,可以容许我做一些记录。

我倾向于在日记模板当中指定几个关键问题,并给出答案。这些问题不一定要指向工作或者生活或者项目之中的某一个,就是个人的日常记录。也许可以做成一个 Skill,每天反思,但我有点讨厌每日提醒的模式,总觉得像在做任务……总之先写起来,对自己诚实的同时,满足一下时不时出现但无处安放的表达欲。目前准备的问题是这几个:

  1. One thing I learnt today is ...
  2. What I actually did today is ...
  3. One thing I need to prioritise tomorrow is ...
  4. Today I consumed ... or Something more I want to say is ...

不过记录只是一种形式,目的还是持续产出对自我来说有意义的内容。

AI 遥控的焦虑

最后一部分,还是要记录一下最近感受到的焦虑氛围。我司最近的裁员计划搞得团队内外人心浮动。前年我觉得工作岗位没什么前景,找机会换了个组,这次我的前部门被一锅端走。公司内没有被端走的部门基本上都在一窝蜂地搞全栈,搞一人 STL。赚钱的亏钱的业务都还在,大家似乎确实不需要专门的前端了,大约这个时代,前端早就死了,只是现在才埋。

我觉得后端其实也并没有值得称道的壁垒,不过壁垒即使降低,事情还是需要专业的人去做。无论是质量角度还是效率角度,让产品去 try everything 都不会是最优解。换个角度看,让产品去跨职能做别的事,可能就意味着产品这个职能也不太被需要了。

这些乱七八糟的焦虑,也有一部分源于个人成长和核心能力的重新定义。Agent 打破职能壁垒,人的精力和认知局限依然限制着人的发展,不同职能的人都会有同一个困惑,就是未来自己应该具备什么样的能力,需要承担多少职责才能维持自己的竞争力。听我这边中上层 TL 们的说法总有点玄虚,比如他们说 AI 时代应该精通工程能力和架构能力,同时有业务落地能力;还有最好还能拓展财务、合规和法务能力。重点还要看能不能在没有其他角色和职能参与的情况下,能够独自推动某个项目落地。

绕来绕去,大概就是需要从交付代码转向交付业务价值。这也算是第一性原理,只要你能交付业务价值,那么你当然就是有价值的。业务感知力的重要性看起来超越了技术能力,不过对于一个 RD 或者说执行层来说,我们对业务的输出是根植于技术产出上的,所以还是回落到需要扎实的技术基础上。

所以其实评价体系没有剧变,只是下沉。业务问题总是有模糊度的问题,对人的要求也是模糊度由低到高,只是现在大家要处理的模糊度都是跨职能并且直面业务的了,比以前困难很多。如果你原本就拥有这个能力,或者以此作为自己的目标,那其实就不需要有什么焦虑。