just get off from vibe oncall,ai写bug ai修
AI写bug AI修,oncall变成AI对AI,人成瓶颈,且无集成测试。
1. 关键信息
- #1 描述P0事件:大客户因最近deployment无法使用service,两个组的manager和oncall engineer sit on call hours。
- 上游组(#1所在组)service没问题,但需等另一个legacy service组confirm才能走。
- 另一个组oncall engineer对codebase完全陌生("never touch any of these in my life"),所有人依赖Claude,连deployment都由manager亲自指挥。
- 几小时revert无果后,#1组clone对方repo,将双方error message喂给Claude,分析发给对方,对方再喂给Claude,最终修好。
- 根因:env引用了不存在的variable,写代码的人用AI且未检查引用,甚至未检查是否deploy,三个月前引入的bug今天才deploy。
- #2 调侃:以后让AI on call。
- #3 自称已成为“prompt + push + copy + paste型选手”,老板催活时直接说“你用AI一会不就写完了”,把PM文档扔给AI,写完push,等AI review完再喂给IDE,因IDE和GitHub用不同AI,还能看俩AI左右脑互搏。
- #4 组里不少review也是AI review,“你的ai检查我的ai”。
- #5 描述agent to agent infinite loop:把对方组error message喂Claude,自己组error message喂Claude,analysis发给对方,对方把analysis发给Claude,然后修好。
- #6 修bug = 把error喂给Claude,一次没修好继续copy & paste。
- #7 未来page AI接口做好后,系统出问题直接AI修正deploy,全套自动化。
- #8 这个loop里人是瓶颈。
- #9 把自己摘出loop是这几个月努力做的事情,越努力越感觉模型有新突破前AI驯兽师的活还能干着。
- #10 三个月前引入的bug今天才deploy,没有AI的情况下大概率好几周都修不掉。
- #11 指出:也有可能没有AI就没有这个bug;质疑bug如何通过层层测试。
- #12 @pix0: 答案是没有integration test。
2. 羊毛/优惠信息
无
3. 最新动态
- AI(Claude)已深度介入oncall全流程:写代码、debug、review、修复,出现AI写bug、AI修bug、AI review AI的闭环。
- 开发者角色转变为“prompt + push + copy + paste型选手”,甚至利用不同AI(IDE vs GitHub)互搏来加速流程。
- 未来趋势:系统出问题直接AI修正并自动deploy,人试图把自己摘出loop,但当前仍是瓶颈(AI驯兽师)。
- 三个月前引入的bug因AI未检查引用和未验证deploy而延迟暴露,但若无AI可能几周都修不掉,形成矛盾。
- 新增信息:该bug之所以能通过测试,是因为根本没有集成测试(#12),直接解释了#11的质疑。
4. 争议或不同意见
- 无直接争议,但隐含风险:AI写bug且未检查引用/未验证deploy,导致延迟暴露;同时AI修bug效率高,可能掩盖了传统oncall技能(熟悉codebase、手动debug)的退化。
- #9 指出在模型有新突破前,人只能做“AI驯兽师”,暗示当前AI能力有限,仍需人类介入。
- #11 提出根本性质疑:没有AI可能就没有这个bug,且测试流程失效,暗示AI引入的新风险被低估。
- #12 补充了测试缺失的具体原因(无集成测试),进一步强化了流程漏洞的讨论。
5. 行动建议
无
周五下午快下班被老板page,因为老板被另一个组的老板page。一个大客户的service因为最近的deployment用不了被escalate P0,两个老板sit on the call for hours。 我组的service没出问题,但因为是上游service必须得等另一个组confirm了才能走。只能说已经见到了未来oncall的雏形 : 另一个组的service是legacy service,oncall engineer对codebase的了解程度用原话来说:“never touch any of these in my life”,除了另一个组的manager很意外对service本当上手之外,所有人都是claude say this claude say that,连deployment的事情都是manager亲自指挥。几个小时revert无果之后,我组clone了对方组的repo,把对方组error message喂了一遍claude,我组的error message喂了一遍claude,analysis发给对方,对方把analysis发给claude,然后修好了…… 原因是env reference了不存在的variable,写这个的人用ai的时候且完全没检查引用,甚至没有检查有没有deploy,因为三个月前引入的bug今天才deploy 真是难忘的体验
以后让ai on call
反正我已经变成了忠诚的prompt + push + copy + paste型选手 老板安排的活催着要,直接来一句你用AI一会不就写完了 秒懂那就直接把PM写的文档扔进去,AI写完以后就push,等AI review完再喂给IDE。因为IDE和Github用的还是不同的AI,还能欣赏一会儿俩AI左右脑互搏
我要笑死了,组里的service现在不少review也是ai review,你的ai检查我的ai
把对方组error message喂了一遍claude,我组的error message喂了一遍claude,analysis发给对方,对方把analysis发给claude,然后修好了 agent to agent infi loop
是这样的,修bug = 把error喂给claude,一次没修好继续copy & paste
以后page AI的接口做好后,就是系统出问题直接AI修正 deploy,全套自动化
这个loop里人是瓶颈
是的 把自己摘出loop是我这几个月努力做的事情 越努力越感觉模型有新突破之前AI驯兽师的活还能干着
pix0: 三个月前引入的bug今天才deploy 这个东西没AI的情况下大概率会好几周都修不掉
也有可能没有AI就没有这个bug。 话说这个是怎么通过层层的测试的?
答案是没有integration test