现在的各种AI tool能拯救历史级屎山代码吗?
现在的AI工具能否拯救历史级“屎山代码”的讨论揭示了技术界对AI代码生成能力的深刻怀疑与期待。核心观点集中在AI重构的可靠性、上下文窗口的限制、以及“屎山”的复杂性。
第一行必须是简洁的主题概述 AI工具重构600万行“屎山代码”的可能性极低,主要瓶颈在于缺乏完善的测试覆盖、AI生成代码的质量(被认为是“屎”的放大器),以及系统复杂性超出了当前AI的理解和安全验证能力。
1. 关键信息
- 重构难度极高: 帖子认为重构比规划更难,尤其缺乏完整的测试套件(Test Suite)来覆盖所有边缘情况,AI重构极易引入难以察觉的Bug。
- AI生成质量的担忧: 多人指出AI(如GPT/Claude)本身可能在生成新的“屎山”,即“trained on shit code, write shit code”的担忧,或只是“巨型抄答案机器”。
- 上下文限制: 600万行代码的规模远超现有模型的上下文窗口,需要复杂的多级Agent分片架构来实现,增加了实现难度和成本。
- “能跑就行”哲学: 许多人认同对于遗留系统,只要不坏就不修(If it ain’t broke, don’t fix it),重构可能带来的风险和成本高于收益。
- AI的实际价值: AI在代码解释理解(而非大规模重写)和Debug方面被认为更可行。
2. 羊毛/优惠信息
无
3. 最新动态
- 有用户提到AI发展迅速,未来可能通过快速重写(而非重构)来替代旧系统,并分享了AI Agent自主开发浏览器(含渲染器、JS VM)的案例。
- 有用户反馈,现在使用AI写代码的模式已从复杂的提示词(Prompt)转向让AI Agent自主运行数小时解决任务,但Code Review和集成测试的必要性依然存在。
4. 争议或不同意见
- 重写 vs. 重构: 有人认为直接重写成本可能更低,但多数人强调没有测试保障的重写同样不靠谱。
- AI的地位: 有人将AI视为“大号编译器”,也有人认为其能力仅相当于“Fresh Grad”水平,难以驾驭复杂遗留系统。
5. 行动建议
- 对于关键系统,在AI重构的代码投入生产环境前,必须有极高的端到端(E2E)测试覆盖率来验证一致性。
- 当前AI更适合用于代码的理解、解释和辅助调试,而不是大规模、高风险的自动化重构。
比如这个600万行C++屎山项目,
假如用gpt或者claude昼夜不停的refactor
还能救吗?
算不算个商机啊?
本末倒置了,ai coding就是创造屎山的
refactor是最难的,planning做不好,你具体有什么任务执行是很靠谱的
你看看甲骨文有没有哪个人敢去改一下 能跑不就行了吗。
为什么要改,改好了不需要人维护,你养程序员吗
【引用自 CCCKing】:
甲骨文
有多烂?
【引用自 tomandjerry】:
改好了不需要人维护,你养程序员
改好了把码农都开了,多好 省钱
trained on shit code, write shit code
现在 AI 生成的各种短视频和音乐已经都把 QQ 音乐抖音的屎翻倍了
他们的数据库,不多也就2500W行吧
【引用自 gin_m】:
trained on shit code, write shit code
不是在这屎山上训练的啊,别的地方训练好的拿过来用
哪来那么大context window,你给钱吗
以前的程序员拉屎,屎上雕花。现在vibe coding是用卡车装屎,工业时代很神奇吧
其实很难 除非你有full test suite 来cover all edge case 不然不可能自动化的 改一次就是各种bug
有没有可能90%的程序员写的都是各种屎
而你这个600万行的屎山,包含了几百个程序员以不同姿势,不同角度,不同时间段,吃了不同的东西拉的不同成分的屎
ai coding由于创造出来的屎山太屎了,导致现在的屎山显得不那么屎,因此可以取而代之
哪个公司敢那么搞立马做空就好了
【引用自 Rosmontis】:
哪来那么大context window
可以多级agent分片,下级agent给上级只反馈自己context里提取出来的必要信息
至少理论上要做的话是这个构架……
看张哥批判一下
按照现在ai发展的速度,以后应该可以一两个月内不停写代码直接重写一个出来,现在的话稍微有点困难。
最近的大新闻就是ai自己连续跑了几百个小时撸了一个bug很多的浏览器出来,中间完全不需要人干预,其中包括一个排版渲染器,css解析器,还有一个js vm,目前来说完成度算是不错了。
鲁迅说过,
if it ain’t broke, don’t fix it
ai修完你敢release to prod吗?屎山的一大特点是不可测试bug feature难以区分,动了一处难说清影响到底有多少
要说让ai解释屎山帮助理解还更可行一点,但是对于critical的系统,你敢不敢信ai的解释又是另一码事了
我的感觉是这里还是得加上程序分析乃止formal verification在里头,才会真有保证(你真的敢把AI给你改出来的代码in prod)
【引用自 gin_m】:
trained on shit code, write shit code
trained on shit code, write shittier code.
感觉AI也就是照抄开源代码而已,不给它喂答案自己是搞不出来的。AI就是个巨型抄答案机器。
希望信用卡公司多多使用AI,以后撸点肯定越来越多
我自己看我5年前写的solo repo我也觉得是坨屎,不知道当时怎么想的架构
本老对AI的认知和linus一样:是个大号编译器。
但是AI用来debug还是挺厉害的。
毕竟有stackoverflow可以抄答案
写代码和写论文差不多
好文章都是改出来的
但是因为程序员流动性太高导致他们的的代码多数都是一次性用品
【引用自 咕的鹦鹉宁】:
好文章都是改出来的
看公司文化了,有的公司背锅总是最后一个修改的人
30年前的legacy code才是真糞坑…
直接重写一个就好了,cost比refactor更低
@用Rust重写
反正现在我是不做refactor这种事了
爱咋咋地
难啊,我读博的时候心血来潮给nasa打杂了一个暑研项目,卫星在天上,只有256kb的内存,用了223k了,要加一个新算法,就少那么几k的内存。我refactor了整整一个暑假才把这几k内存挤出来,总不能把卫星拿下来换个大内存再放上去吧。
只要硬件不死,那些古老硬件上的屎代码就死不了
你是说 cursor? 那个浏览器连编译都过不了
不是已经跑起来了吗
不太行,我现在的大代码库中的6k行无单元测试,只有集成测试组件都没法改,基本修改都是错的
[quote=“noRainNoShine, post:34, topic:475355, full:true”]
直接重写一个就好了,cost比refactor更低
[/quote]
没有详细测试保障输出一致的重构都不靠谱
现在ai基本就是fresh grad水平,如果new grad看这些代码抓狂ai也是
现在的AI,放手让它干,就是在造屎山。
我们今天的主产品出现重大regression,一查是Product Designer全程AI放进了一段code。
【引用自 itworks】:
一查是Product Designer全程AI
没人code review?
攻城狮也是用的AI做code review 系统复杂到了一定程度,没法靠code review的。又没有good e2e coverage
我靠你们公司路子这么野吗?
本末倒置了,all code is trash,viral distribution is the goal
今天用AI写了 shit code 被 reviewer 骂了 求安慰
感觉代码库这玩意就跟住宅一样,缝缝补补用个几十年,最后实在忍不了了拆掉重建最好
reviewer 屁都不懂。
你的观察很对。人类目前根本驾驭不了复杂问题。
不是应该更加容易喂屎吗
说的太对了。我们team的小年轻每天vibe coding几十个CL,根本受不了。
根本不可能,现在的coding agent只能按套路出牌
套路出牌也幻觉严重,天天编一些不存在的api
IMG_1474445×805 93.6 KB
就我现在用ai的情况看这些东西已经过时了,最近一个月只有5%的情况需要用到这种类似的提示词
毕竟这个图是去年的了
现在最流行的是什么?
不知道哦,我现在就是早上打开电脑给开三五个session,每个session给个task让他自己想办法解决,然后就刷刷短视频和泥潭,隔一會再看他做得怎么样,大部分时候不需要我干预就做好了,有时候不符合我的心意我就跟他多讨论几轮然后让他继续做,我继续刷泥潭,来回讨论个几轮一天就结束了。
太假了 能跑就行了 谁仔细读