泥潭日报 uscardforum · 每日精选

现在的各种AI tool能拯救历史级屎山代码吗?

内容摘要

现在的AI工具能否拯救历史级“屎山代码”的讨论揭示了技术界对AI代码生成能力的深刻怀疑与期待。核心观点集中在AI重构的可靠性、上下文窗口的限制、以及“屎山”的复杂性。

第一行必须是简洁的主题概述 AI工具重构600万行“屎山代码”的可能性极低,主要瓶颈在于缺乏完善的测试覆盖、AI生成代码的质量(被认为是“屎”的放大器),以及系统复杂性超出了当前AI的理解和安全验证能力。

1. 关键信息

  • 重构难度极高: 帖子认为重构比规划更难,尤其缺乏完整的测试套件(Test Suite)来覆盖所有边缘情况,AI重构极易引入难以察觉的Bug。
  • AI生成质量的担忧: 多人指出AI(如GPT/Claude)本身可能在生成新的“屎山”,即“trained on shit code, write shit code”的担忧,或只是“巨型抄答案机器”。
  • 上下文限制: 600万行代码的规模远超现有模型的上下文窗口,需要复杂的多级Agent分片架构来实现,增加了实现难度和成本。
  • “能跑就行”哲学: 许多人认同对于遗留系统,只要不坏就不修(If it ain’t broke, don’t fix it),重构可能带来的风险和成本高于收益。
  • AI的实际价值: AI在代码解释理解(而非大规模重写)和Debug方面被认为更可行。

2. 羊毛/优惠信息

3. 最新动态

  • 有用户提到AI发展迅速,未来可能通过快速重写(而非重构)来替代旧系统,并分享了AI Agent自主开发浏览器(含渲染器、JS VM)的案例。
  • 有用户反馈,现在使用AI写代码的模式已从复杂的提示词(Prompt)转向让AI Agent自主运行数小时解决任务,但Code Review和集成测试的必要性依然存在。

4. 争议或不同意见

  • 重写 vs. 重构: 有人认为直接重写成本可能更低,但多数人强调没有测试保障的重写同样不靠谱。
  • AI的地位: 有人将AI视为“大号编译器”,也有人认为其能力仅相当于“Fresh Grad”水平,难以驾驭复杂遗留系统。

5. 行动建议

  • 对于关键系统,在AI重构的代码投入生产环境前,必须有极高的端到端(E2E)测试覆盖率来验证一致性。
  • 当前AI更适合用于代码的理解、解释和辅助调试,而不是大规模、高风险的自动化重构。
原始内容
--- 第 1 楼来自 YouTube 的回复 (2026-01-15 19:09:24 PST) ---

比如这个600万行C++屎山项目,

假如用gpt或者claude昼夜不停的refactor

还能救吗?

算不算个商机啊?

--- 第 2 楼来自 creamboy 的回复 (2026-01-15 19:11:01 PST) ---

本末倒置了,ai coding就是创造屎山的

--- 第 3 楼来自 cnxcnx 的回复 (2026-01-15 19:11:40 PST) ---

refactor是最难的,planning做不好,你具体有什么任务执行是很靠谱的

--- 第 4 楼来自 CCCKing 的回复 (2026-01-15 19:11:43 PST) ---

你看看甲骨文有没有哪个人敢去改一下 能跑不就行了吗。

--- 第 5 楼来自 tomandjerry 的回复 (2026-01-15 19:15:37 PST) ---

为什么要改,改好了不需要人维护,你养程序员吗

--- 第 6 楼来自 otonoco 的回复 (2026-01-15 19:19:21 PST) ---

【引用自 CCCKing】:
甲骨文
有多烂?

--- 第 7 楼来自 YouTube 的回复 (2026-01-15 19:22:16 PST) ---

【引用自 tomandjerry】:
改好了不需要人维护,你养程序员
改好了把码农都开了,多好 省钱

--- 第 8 楼来自 gin_m 的回复 (2026-01-15 19:23:04 PST) ---

trained on shit code, write shit code

--- 第 9 楼来自 rrrrz 的回复 (2026-01-15 19:24:20 PST) ---

现在 AI 生成的各种短视频和音乐已经都把 QQ 音乐抖音的屎翻倍了

--- 第 10 楼来自 CCCKing 的回复 (2026-01-15 19:32:26 PST) ---

他们的数据库,不多也就2500W行吧

--- 第 11 楼来自 YouTube 的回复 (2026-01-15 19:33:13 PST) ---

【引用自 gin_m】:
trained on shit code, write shit code
不是在这屎山上训练的啊,别的地方训练好的拿过来用

--- 第 12 楼来自 Rosmontis 的回复 (2026-01-15 19:33:29 PST) ---

哪来那么大context window,你给钱吗

以前的程序员拉屎,屎上雕花。现在vibe coding是用卡车装屎,工业时代很神奇吧

--- 第 13 楼来自 gin_m 的回复 (2026-01-15 19:35:28 PST) ---

其实很难 除非你有full test suite 来cover all edge case 不然不可能自动化的 改一次就是各种bug

--- 第 14 楼来自 Rosmontis 的回复 (2026-01-15 19:39:31 PST) ---

有没有可能90%的程序员写的都是各种屎

而你这个600万行的屎山,包含了几百个程序员以不同姿势,不同角度,不同时间段,吃了不同的东西拉的不同成分的屎

--- 第 15 楼来自 002 的回复 (2026-01-15 19:46:10 PST) ---

ai coding由于创造出来的屎山太屎了,导致现在的屎山显得不那么屎,因此可以取而代之

--- 第 16 楼来自 0xEthan 的回复 (2026-01-15 19:47:37 PST) ---

哪个公司敢那么搞立马做空就好了

--- 第 17 楼来自 收束观测者 的回复 (2026-01-15 20:38:54 PST) ---

【引用自 Rosmontis】:
哪来那么大context window
可以多级agent分片,下级agent给上级只反馈自己context里提取出来的必要信息

至少理论上要做的话是这个构架……

--- 第 18 楼来自 Drag0nSlayer 的回复 (2026-01-15 20:48:58 PST) ---

看张哥批判一下

--- 第 20 楼来自 ctzsm 的回复 (2026-01-15 21:19:04 PST) ---

按照现在ai发展的速度,以后应该可以一两个月内不停写代码直接重写一个出来,现在的话稍微有点困难。

最近的大新闻就是ai自己连续跑了几百个小时撸了一个bug很多的浏览器出来,中间完全不需要人干预,其中包括一个排版渲染器,css解析器,还有一个js vm,目前来说完成度算是不错了。

--- 第 21 楼来自 Ryan2027 的回复 (2026-01-15 21:20:18 PST) ---

鲁迅说过,

if it ain’t broke, don’t fix it

--- 第 22 楼来自 msft 的回复 (2026-01-15 21:24:20 PST) ---

ai修完你敢release to prod吗?屎山的一大特点是不可测试bug feature难以区分,动了一处难说清影响到底有多少

要说让ai解释屎山帮助理解还更可行一点,但是对于critical的系统,你敢不敢信ai的解释又是另一码事了

--- 第 23 楼来自 库斯尼兹 的回复 (2026-01-15 21:48:38 PST) ---

我的感觉是这里还是得加上程序分析乃止formal verification在里头,才会真有保证(你真的敢把AI给你改出来的代码in prod)

--- 第 24 楼来自 css 的回复 (2026-01-15 21:50:21 PST) ---

【引用自 gin_m】:
trained on shit code, write shit code
trained on shit code, write shittier code.

--- 第 25 楼来自 002 的回复 (2026-01-15 21:52:25 PST) ---

感觉AI也就是照抄开源代码而已,不给它喂答案自己是搞不出来的。AI就是个巨型抄答案机器。

--- 第 26 楼来自 002 的回复 (2026-01-15 21:53:15 PST) ---

希望信用卡公司多多使用AI,以后撸点肯定越来越多

--- 第 27 楼来自 illusionwing 的回复 (2026-01-15 21:56:41 PST) ---

我自己看我5年前写的solo repo我也觉得是坨屎,不知道当时怎么想的架构

--- 第 28 楼来自 争取多活两年 的回复 (2026-01-15 22:02:39 PST) ---

本老对AI的认知和linus一样:是个大号编译器。

--- 第 29 楼来自 css 的回复 (2026-01-15 22:32:35 PST) ---

但是AI用来debug还是挺厉害的。

--- 第 30 楼来自 002 的回复 (2026-01-15 23:20:48 PST) ---

毕竟有stackoverflow可以抄答案

--- 第 31 楼来自 咕的鹦鹉宁 的回复 (2026-01-16 00:12:20 PST) ---

写代码和写论文差不多

好文章都是改出来的

但是因为程序员流动性太高导致他们的的代码多数都是一次性用品

--- 第 32 楼来自 msft 的回复 (2026-01-16 07:24:53 PST) ---

【引用自 咕的鹦鹉宁】:
好文章都是改出来的
看公司文化了,有的公司背锅总是最后一个修改的人

--- 第 33 楼来自 Yen-Hsiang 的回复 (2026-01-16 07:30:30 PST) ---

30年前的legacy code才是真糞坑…

--- 第 34 楼来自 noRainNoShine 的回复 (2026-01-16 07:40:41 PST) ---

直接重写一个就好了,cost比refactor更低

--- 第 35 楼来自 otonoco 的回复 (2026-01-16 07:44:27 PST) ---

@用Rust重写

--- 第 36 楼来自 misc 的回复 (2026-01-16 18:27:05 PST) ---

反正现在我是不做refactor这种事了

爱咋咋地

--- 第 37 楼来自 飞天红猪 的回复 (2026-01-17 08:32:08 PST) ---

难啊,我读博的时候心血来潮给nasa打杂了一个暑研项目,卫星在天上,只有256kb的内存,用了223k了,要加一个新算法,就少那么几k的内存。我refactor了整整一个暑假才把这几k内存挤出来,总不能把卫星拿下来换个大内存再放上去吧。

只要硬件不死,那些古老硬件上的屎代码就死不了

--- 第 38 楼来自 rrrrz 的回复 (2026-01-17 08:37:56 PST) ---

你是说 cursor? 那个浏览器连编译都过不了

--- 第 39 楼来自 ctzsm 的回复 (2026-01-17 08:49:37 PST) ---

不是已经跑起来了吗

--- 第 41 楼来自 Thickness4968 的回复 (2026-01-17 09:10:50 PST) ---

不太行,我现在的大代码库中的6k行无单元测试,只有集成测试组件都没法改,基本修改都是错的

[quote=“noRainNoShine, post:34, topic:475355, full:true”]

直接重写一个就好了,cost比refactor更低

[/quote]

没有详细测试保障输出一致的重构都不靠谱

现在ai基本就是fresh grad水平,如果new grad看这些代码抓狂ai也是

--- 第 42 楼来自 itworks 的回复 (2026-01-28 21:28:56 PST) ---

现在的AI,放手让它干,就是在造屎山。

我们今天的主产品出现重大regression,一查是Product Designer全程AI放进了一段code。

--- 第 43 楼来自 YouTube 的回复 (2026-01-28 21:37:15 PST) ---

【引用自 itworks】:
一查是Product Designer全程AI
没人code review?

--- 第 44 楼来自 itworks 的回复 (2026-01-28 21:51:32 PST) ---

攻城狮也是用的AI做code review 系统复杂到了一定程度,没法靠code review的。又没有good e2e coverage

--- 第 45 楼来自 争取多活两年 的回复 (2026-01-29 14:46:23 PST) ---

我靠你们公司路子这么野吗?

--- 第 46 楼来自 jzcracker 的回复 (2026-02-01 17:20:58 PST) ---

本末倒置了,all code is trash,viral distribution is the goal

--- 第 47 楼来自 gin_m 的回复 (2026-02-04 10:52:47 PST) ---

今天用AI写了 shit code 被 reviewer 骂了 求安慰

--- 第 48 楼来自 xxxyyy 的回复 (2026-02-04 11:37:41 PST) ---

感觉代码库这玩意就跟住宅一样,缝缝补补用个几十年,最后实在忍不了了拆掉重建最好

--- 第 49 楼来自 争取多活两年 的回复 (2026-02-04 11:38:15 PST) ---

reviewer 屁都不懂。

--- 第 50 楼来自 争取多活两年 的回复 (2026-02-04 11:38:39 PST) ---

你的观察很对。人类目前根本驾驭不了复杂问题。

--- 第 51 楼来自 KingGrimlock 的回复 (2026-02-04 11:43:01 PST) ---

不是应该更加容易喂屎吗

--- 第 52 楼来自 争取多活两年 的回复 (2026-02-04 11:44:01 PST) ---

说的太对了。我们team的小年轻每天vibe coding几十个CL,根本受不了。

--- 第 53 楼来自 Edward40 的回复 (2026-02-04 11:44:08 PST) ---

根本不可能,现在的coding agent只能按套路出牌

--- 第 54 楼来自 xxxyyy 的回复 (2026-02-04 12:05:46 PST) ---

套路出牌也幻觉严重,天天编一些不存在的api

--- 第 55 楼来自 otonoco 的回复 (2026-02-06 14:36:33 PST) ---

IMG_1474445×805 93.6 KB

--- 第 56 楼来自 ctzsm 的回复 (2026-02-06 15:49:26 PST) ---

就我现在用ai的情况看这些东西已经过时了,最近一个月只有5%的情况需要用到这种类似的提示词

--- 第 57 楼来自 xxxyyy 的回复 (2026-02-06 16:58:03 PST) ---

毕竟这个图是去年的了

--- 第 58 楼来自 otonoco 的回复 (2026-02-06 19:14:10 PST) ---

现在最流行的是什么?

--- 第 59 楼来自 ctzsm 的回复 (2026-02-06 22:11:53 PST) ---

不知道哦,我现在就是早上打开电脑给开三五个session,每个session给个task让他自己想办法解决,然后就刷刷短视频和泥潭,隔一會再看他做得怎么样,大部分时候不需要我干预就做好了,有时候不符合我的心意我就跟他多讨论几轮然后让他继续做,我继续刷泥潭,来回讨论个几轮一天就结束了。

--- 第 60 楼来自 gin_m 的回复 (2026-02-06 22:13:18 PST) ---

太假了 能跑就行了 谁仔细读