泥潭日报 uscardforum · 每日精选

just get off from vibe oncall,ai写bug ai修

内容摘要

AI写bug AI修,oncall变成AI对AI,人成瓶颈,且无集成测试。

1. 关键信息

  • #1 描述P0事件:大客户因最近deployment无法使用service,两个组的manager和oncall engineer sit on call hours。
  • 上游组(#1所在组)service没问题,但需等另一个legacy service组confirm才能走。
  • 另一个组oncall engineer对codebase完全陌生("never touch any of these in my life"),所有人依赖Claude,连deployment都由manager亲自指挥。
  • 几小时revert无果后,#1组clone对方repo,将双方error message喂给Claude,分析发给对方,对方再喂给Claude,最终修好。
  • 根因:env引用了不存在的variable,写代码的人用AI且未检查引用,甚至未检查是否deploy,三个月前引入的bug今天才deploy。
  • #2 调侃:以后让AI on call。
  • #3 自称已成为“prompt + push + copy + paste型选手”,老板催活时直接说“你用AI一会不就写完了”,把PM文档扔给AI,写完push,等AI review完再喂给IDE,因IDE和GitHub用不同AI,还能看俩AI左右脑互搏。
  • #4 组里不少review也是AI review,“你的ai检查我的ai”。
  • #5 描述agent to agent infinite loop:把对方组error message喂Claude,自己组error message喂Claude,analysis发给对方,对方把analysis发给Claude,然后修好。
  • #6 修bug = 把error喂给Claude,一次没修好继续copy & paste。
  • #7 未来page AI接口做好后,系统出问题直接AI修正deploy,全套自动化。
  • #8 这个loop里人是瓶颈。
  • #9 把自己摘出loop是这几个月努力做的事情,越努力越感觉模型有新突破前AI驯兽师的活还能干着。
  • #10 三个月前引入的bug今天才deploy,没有AI的情况下大概率好几周都修不掉。
  • #11 指出:也有可能没有AI就没有这个bug;质疑bug如何通过层层测试。
  • #12 @pix0: 答案是没有integration test。

2. 羊毛/优惠信息

3. 最新动态

  • AI(Claude)已深度介入oncall全流程:写代码、debug、review、修复,出现AI写bug、AI修bug、AI review AI的闭环。
  • 开发者角色转变为“prompt + push + copy + paste型选手”,甚至利用不同AI(IDE vs GitHub)互搏来加速流程。
  • 未来趋势:系统出问题直接AI修正并自动deploy,人试图把自己摘出loop,但当前仍是瓶颈(AI驯兽师)。
  • 三个月前引入的bug因AI未检查引用和未验证deploy而延迟暴露,但若无AI可能几周都修不掉,形成矛盾。
  • 新增信息:该bug之所以能通过测试,是因为根本没有集成测试(#12),直接解释了#11的质疑。

4. 争议或不同意见

  • 无直接争议,但隐含风险:AI写bug且未检查引用/未验证deploy,导致延迟暴露;同时AI修bug效率高,可能掩盖了传统oncall技能(熟悉codebase、手动debug)的退化。
  • #9 指出在模型有新突破前,人只能做“AI驯兽师”,暗示当前AI能力有限,仍需人类介入。
  • #11 提出根本性质疑:没有AI可能就没有这个bug,且测试流程失效,暗示AI引入的新风险被低估。
  • #12 补充了测试缺失的具体原因(无集成测试),进一步强化了流程漏洞的讨论。

5. 行动建议

原始内容
--- 第 1 楼来自 pix0 的回复 (2026-05-01 21:54:16 PDT) ---

周五下午快下班被老板page,因为老板被另一个组的老板page。一个大客户的service因为最近的deployment用不了被escalate P0,两个老板sit on the call for hours。 我组的service没出问题,但因为是上游service必须得等另一个组confirm了才能走。只能说已经见到了未来oncall的雏形 : 另一个组的service是legacy service,oncall engineer对codebase的了解程度用原话来说:“never touch any of these in my life”,除了另一个组的manager很意外对service本当上手之外,所有人都是claude say this claude say that,连deployment的事情都是manager亲自指挥。几个小时revert无果之后,我组clone了对方组的repo,把对方组error message喂了一遍claude,我组的error message喂了一遍claude,analysis发给对方,对方把analysis发给claude,然后修好了…… 原因是env reference了不存在的variable,写这个的人用ai的时候且完全没检查引用,甚至没有检查有没有deploy,因为三个月前引入的bug今天才deploy 真是难忘的体验

--- 第 2 楼来自 richardfatman 的回复 (2026-05-01 22:00:26 PDT) ---

以后让ai on call

--- 第 3 楼来自 eicy 的回复 (2026-05-01 22:05:31 PDT) ---

反正我已经变成了忠诚的prompt + push + copy + paste型选手 老板安排的活催着要,直接来一句你用AI一会不就写完了 秒懂那就直接把PM写的文档扔进去,AI写完以后就push,等AI review完再喂给IDE。因为IDE和Github用的还是不同的AI,还能欣赏一会儿俩AI左右脑互搏

--- 第 4 楼来自 pix0 的回复 (2026-05-01 22:07:20 PDT) ---

我要笑死了,组里的service现在不少review也是ai review,你的ai检查我的ai

--- 第 5 楼来自 weiweiwieweieiw2192 的回复 (2026-05-01 22:13:01 PDT) ---

把对方组error message喂了一遍claude,我组的error message喂了一遍claude,analysis发给对方,对方把analysis发给claude,然后修好了 agent to agent infi loop

--- 第 6 楼来自 莫逆uuuuu 的回复 (2026-05-01 22:13:57 PDT) ---

是这样的,修bug = 把error喂给claude,一次没修好继续copy & paste

--- 第 7 楼来自 老娘舅 的回复 (2026-05-01 23:06:55 PDT) ---

以后page AI的接口做好后,就是系统出问题直接AI修正 deploy,全套自动化

--- 第 8 楼来自 richardfatman 的回复 (2026-05-01 23:16:46 PDT) ---

这个loop里人是瓶颈

--- 第 9 楼来自 收束观测者 的回复 (2026-05-01 23:18:40 PDT) ---

是的 把自己摘出loop是我这几个月努力做的事情 越努力越感觉模型有新突破之前AI驯兽师的活还能干着

--- 第 10 楼来自 黑卡会员 的回复 (2026-05-01 23:48:17 PDT) ---

pix0: 三个月前引入的bug今天才deploy 这个东西没AI的情况下大概率会好几周都修不掉

--- 第 11 楼来自 catkinkk 的回复 (2026-05-02 09:57:36 PDT) ---

也有可能没有AI就没有这个bug。 话说这个是怎么通过层层的测试的?

--- 第 12 楼来自 pix0 的回复 (2026-05-02 11:02:28 PDT) ---

答案是没有integration test