现在的各种AI tool能拯救历史级屎山代码吗？

📈 搬砖作者 YouTube 2026-01-15 19:09 PST 原帖 #475355 ↗

内容摘要

现在的AI工具能否拯救历史级“屎山代码”的讨论揭示了技术界对AI代码生成能力的深刻怀疑与期待。核心观点集中在AI重构的可靠性、上下文窗口的限制、以及“屎山”的复杂性。

第一行必须是简洁的主题概述 AI工具重构600万行“屎山代码”的可能性极低，主要瓶颈在于缺乏完善的测试覆盖、AI生成代码的质量（被认为是“屎”的放大器），以及系统复杂性超出了当前AI的理解和安全验证能力。

1. 关键信息

重构难度极高： 帖子认为重构比规划更难，尤其缺乏完整的测试套件（Test Suite）来覆盖所有边缘情况，AI重构极易引入难以察觉的Bug。
AI生成质量的担忧： 多人指出AI（如GPT/Claude）本身可能在生成新的“屎山”，即“trained on shit code, write shit code”的担忧，或只是“巨型抄答案机器”。
上下文限制： 600万行代码的规模远超现有模型的上下文窗口，需要复杂的多级Agent分片架构来实现，增加了实现难度和成本。
“能跑就行”哲学： 许多人认同对于遗留系统，只要不坏就不修（If it ain’t broke, don’t fix it），重构可能带来的风险和成本高于收益。
AI的实际价值： AI在代码解释理解（而非大规模重写）和Debug方面被认为更可行。

2. 羊毛/优惠信息

无

3. 最新动态

有用户提到AI发展迅速，未来可能通过快速重写（而非重构）来替代旧系统，并分享了AI Agent自主开发浏览器（含渲染器、JS VM）的案例。
有用户反馈，现在使用AI写代码的模式已从复杂的提示词（Prompt）转向让AI Agent自主运行数小时解决任务，但Code Review和集成测试的必要性依然存在。

4. 争议或不同意见

重写 vs. 重构： 有人认为直接重写成本可能更低，但多数人强调没有测试保障的重写同样不靠谱。
AI的地位： 有人将AI视为“大号编译器”，也有人认为其能力仅相当于“Fresh Grad”水平，难以驾驭复杂遗留系统。

5. 行动建议

对于关键系统，在AI重构的代码投入生产环境前，必须有极高的端到端（E2E）测试覆盖率来验证一致性。
当前AI更适合用于代码的理解、解释和辅助调试，而不是大规模、高风险的自动化重构。

原始内容

--- 第 1 楼来自 YouTube 的回复 (2026-01-15 19:09:24 PST) ---

比如这个600万行C++屎山项目，

假如用gpt或者claude昼夜不停的refactor

还能救吗？

算不算个商机啊？

--- 第 2 楼来自 creamboy 的回复 (2026-01-15 19:11:01 PST) ---

本末倒置了，ai coding就是创造屎山的

--- 第 3 楼来自 cnxcnx 的回复 (2026-01-15 19:11:40 PST) ---

refactor是最难的，planning做不好，你具体有什么任务执行是很靠谱的

--- 第 4 楼来自 CCCKing 的回复 (2026-01-15 19:11:43 PST) ---

你看看甲骨文有没有哪个人敢去改一下能跑不就行了吗。

--- 第 5 楼来自 tomandjerry 的回复 (2026-01-15 19:15:37 PST) ---

为什么要改，改好了不需要人维护，你养程序员吗

--- 第 6 楼来自 otonoco 的回复 (2026-01-15 19:19:21 PST) ---

【引用自 CCCKing】:
甲骨文
有多烂？

--- 第 7 楼来自 YouTube 的回复 (2026-01-15 19:22:16 PST) ---

【引用自 tomandjerry】:
改好了不需要人维护，你养程序员
改好了把码农都开了，多好省钱

--- 第 8 楼来自 gin_m 的回复 (2026-01-15 19:23:04 PST) ---

trained on shit code, write shit code

--- 第 9 楼来自 rrrrz 的回复 (2026-01-15 19:24:20 PST) ---

现在 AI 生成的各种短视频和音乐已经都把 QQ 音乐抖音的屎翻倍了

--- 第 10 楼来自 CCCKing 的回复 (2026-01-15 19:32:26 PST) ---

他们的数据库，不多也就2500W行吧

--- 第 11 楼来自 YouTube 的回复 (2026-01-15 19:33:13 PST) ---

【引用自 gin_m】:
trained on shit code, write shit code
不是在这屎山上训练的啊，别的地方训练好的拿过来用

--- 第 12 楼来自 Rosmontis 的回复 (2026-01-15 19:33:29 PST) ---

哪来那么大context window，你给钱吗

以前的程序员拉屎，屎上雕花。现在vibe coding是用卡车装屎，工业时代很神奇吧

--- 第 13 楼来自 gin_m 的回复 (2026-01-15 19:35:28 PST) ---

其实很难除非你有full test suite 来cover all edge case 不然不可能自动化的改一次就是各种bug

--- 第 14 楼来自 Rosmontis 的回复 (2026-01-15 19:39:31 PST) ---

有没有可能90%的程序员写的都是各种屎

而你这个600万行的屎山，包含了几百个程序员以不同姿势，不同角度，不同时间段，吃了不同的东西拉的不同成分的屎

--- 第 15 楼来自 002 的回复 (2026-01-15 19:46:10 PST) ---

ai coding由于创造出来的屎山太屎了，导致现在的屎山显得不那么屎，因此可以取而代之

--- 第 16 楼来自 0xEthan 的回复 (2026-01-15 19:47:37 PST) ---

哪个公司敢那么搞立马做空就好了

--- 第 17 楼来自收束观测者的回复 (2026-01-15 20:38:54 PST) ---

【引用自 Rosmontis】:
哪来那么大context window
可以多级agent分片，下级agent给上级只反馈自己context里提取出来的必要信息

至少理论上要做的话是这个构架……

--- 第 18 楼来自 Drag0nSlayer 的回复 (2026-01-15 20:48:58 PST) ---

看张哥批判一下

--- 第 20 楼来自 ctzsm 的回复 (2026-01-15 21:19:04 PST) ---

按照现在ai发展的速度，以后应该可以一两个月内不停写代码直接重写一个出来，现在的话稍微有点困难。

最近的大新闻就是ai自己连续跑了几百个小时撸了一个bug很多的浏览器出来，中间完全不需要人干预，其中包括一个排版渲染器，css解析器，还有一个js vm，目前来说完成度算是不错了。

--- 第 21 楼来自 Ryan2027 的回复 (2026-01-15 21:20:18 PST) ---

鲁迅说过，

if it ain’t broke, don’t fix it

--- 第 22 楼来自 msft 的回复 (2026-01-15 21:24:20 PST) ---

ai修完你敢release to prod吗？屎山的一大特点是不可测试bug feature难以区分，动了一处难说清影响到底有多少

要说让ai解释屎山帮助理解还更可行一点，但是对于critical的系统，你敢不敢信ai的解释又是另一码事了

--- 第 23 楼来自库斯尼兹的回复 (2026-01-15 21:48:38 PST) ---

我的感觉是这里还是得加上程序分析乃止formal verification在里头，才会真有保证（你真的敢把AI给你改出来的代码in prod）

--- 第 24 楼来自 css 的回复 (2026-01-15 21:50:21 PST) ---

【引用自 gin_m】:
trained on shit code, write shit code
trained on shit code, write shittier code.

--- 第 25 楼来自 002 的回复 (2026-01-15 21:52:25 PST) ---

感觉AI也就是照抄开源代码而已，不给它喂答案自己是搞不出来的。AI就是个巨型抄答案机器。

--- 第 26 楼来自 002 的回复 (2026-01-15 21:53:15 PST) ---

希望信用卡公司多多使用AI，以后撸点肯定越来越多

--- 第 27 楼来自 illusionwing 的回复 (2026-01-15 21:56:41 PST) ---

我自己看我5年前写的solo repo我也觉得是坨屎，不知道当时怎么想的架构

--- 第 28 楼来自争取多活两年的回复 (2026-01-15 22:02:39 PST) ---

本老对AI的认知和linus一样：是个大号编译器。

--- 第 29 楼来自 css 的回复 (2026-01-15 22:32:35 PST) ---

但是AI用来debug还是挺厉害的。

--- 第 30 楼来自 002 的回复 (2026-01-15 23:20:48 PST) ---

毕竟有stackoverflow可以抄答案

--- 第 31 楼来自咕的鹦鹉宁的回复 (2026-01-16 00:12:20 PST) ---

写代码和写论文差不多

好文章都是改出来的

但是因为程序员流动性太高导致他们的的代码多数都是一次性用品

--- 第 32 楼来自 msft 的回复 (2026-01-16 07:24:53 PST) ---

【引用自咕的鹦鹉宁】:
好文章都是改出来的
看公司文化了，有的公司背锅总是最后一个修改的人

--- 第 33 楼来自 Yen-Hsiang 的回复 (2026-01-16 07:30:30 PST) ---

30年前的legacy code才是真糞坑…

--- 第 34 楼来自 noRainNoShine 的回复 (2026-01-16 07:40:41 PST) ---

直接重写一个就好了，cost比refactor更低

--- 第 35 楼来自 otonoco 的回复 (2026-01-16 07:44:27 PST) ---

@用Rust重写

--- 第 36 楼来自 misc 的回复 (2026-01-16 18:27:05 PST) ---

反正现在我是不做refactor这种事了

爱咋咋地

--- 第 37 楼来自飞天红猪的回复 (2026-01-17 08:32:08 PST) ---

难啊，我读博的时候心血来潮给nasa打杂了一个暑研项目，卫星在天上，只有256kb的内存，用了223k了，要加一个新算法，就少那么几k的内存。我refactor了整整一个暑假才把这几k内存挤出来，总不能把卫星拿下来换个大内存再放上去吧。

只要硬件不死，那些古老硬件上的屎代码就死不了

--- 第 38 楼来自 rrrrz 的回复 (2026-01-17 08:37:56 PST) ---

你是说 cursor? 那个浏览器连编译都过不了

--- 第 39 楼来自 ctzsm 的回复 (2026-01-17 08:49:37 PST) ---

不是已经跑起来了吗

--- 第 41 楼来自 Thickness4968 的回复 (2026-01-17 09:10:50 PST) ---

不太行，我现在的大代码库中的6k行无单元测试，只有集成测试组件都没法改，基本修改都是错的

[quote=“noRainNoShine, post:34, topic:475355, full:true”]

直接重写一个就好了，cost比refactor更低

[/quote]

没有详细测试保障输出一致的重构都不靠谱

现在ai基本就是fresh grad水平，如果new grad看这些代码抓狂ai也是

--- 第 42 楼来自 itworks 的回复 (2026-01-28 21:28:56 PST) ---

现在的AI，放手让它干，就是在造屎山。

我们今天的主产品出现重大regression，一查是Product Designer全程AI放进了一段code。

--- 第 43 楼来自 YouTube 的回复 (2026-01-28 21:37:15 PST) ---

【引用自 itworks】:
一查是Product Designer全程AI
没人code review?

--- 第 44 楼来自 itworks 的回复 (2026-01-28 21:51:32 PST) ---

攻城狮也是用的AI做code review 系统复杂到了一定程度，没法靠code review的。又没有good e2e coverage

--- 第 45 楼来自争取多活两年的回复 (2026-01-29 14:46:23 PST) ---

我靠你们公司路子这么野吗？

--- 第 46 楼来自 jzcracker 的回复 (2026-02-01 17:20:58 PST) ---

本末倒置了，all code is trash，viral distribution is the goal

--- 第 47 楼来自 gin_m 的回复 (2026-02-04 10:52:47 PST) ---

今天用AI写了 shit code 被 reviewer 骂了求安慰

--- 第 48 楼来自 xxxyyy 的回复 (2026-02-04 11:37:41 PST) ---

感觉代码库这玩意就跟住宅一样，缝缝补补用个几十年，最后实在忍不了了拆掉重建最好

--- 第 49 楼来自争取多活两年的回复 (2026-02-04 11:38:15 PST) ---

reviewer 屁都不懂。

--- 第 50 楼来自争取多活两年的回复 (2026-02-04 11:38:39 PST) ---

你的观察很对。人类目前根本驾驭不了复杂问题。

--- 第 51 楼来自 KingGrimlock 的回复 (2026-02-04 11:43:01 PST) ---

不是应该更加容易喂屎吗

--- 第 52 楼来自争取多活两年的回复 (2026-02-04 11:44:01 PST) ---

说的太对了。我们team的小年轻每天vibe coding几十个CL，根本受不了。

--- 第 53 楼来自 Edward40 的回复 (2026-02-04 11:44:08 PST) ---

根本不可能，现在的coding agent只能按套路出牌

--- 第 54 楼来自 xxxyyy 的回复 (2026-02-04 12:05:46 PST) ---

套路出牌也幻觉严重，天天编一些不存在的api

--- 第 55 楼来自 otonoco 的回复 (2026-02-06 14:36:33 PST) ---

IMG_1474445×805 93.6 KB

--- 第 56 楼来自 ctzsm 的回复 (2026-02-06 15:49:26 PST) ---

就我现在用ai的情况看这些东西已经过时了，最近一个月只有5%的情况需要用到这种类似的提示词

--- 第 57 楼来自 xxxyyy 的回复 (2026-02-06 16:58:03 PST) ---

毕竟这个图是去年的了

--- 第 58 楼来自 otonoco 的回复 (2026-02-06 19:14:10 PST) ---

现在最流行的是什么？

--- 第 59 楼来自 ctzsm 的回复 (2026-02-06 22:11:53 PST) ---

不知道哦，我现在就是早上打开电脑给开三五个session，每个session给个task让他自己想办法解决，然后就刷刷短视频和泥潭，隔一會再看他做得怎么样，大部分时候不需要我干预就做好了，有时候不符合我的心意我就跟他多讨论几轮然后让他继续做，我继续刷泥潭，来回讨论个几轮一天就结束了。

--- 第 60 楼来自 gin_m 的回复 (2026-02-06 22:13:18 PST) ---

太假了能跑就行了谁仔细读

📈 搬砖 · 其他高楼

【摸鱼第十四季完结】你也要变成和我一样的大人了呢 💬 9991
好的，我将根据您提供的文本内容，尝试总结并回答您的问题。
【摸鱼第十六季】偶然走入了最甜蜜事件里！ 💬 9920
帖子标题
【摸鱼第十五季】二月啦，都不摸鱼只开嗑了吗？ 💬 9896
摸鱼楼持续热议“求富”话题，聚焦报税、里程、远程工作，并围绕“删帖”行为展开集体调侃。
【摸鱼第十七季】记得绿罗裙，处处怜芳草 💬 9223
摸鱼楼讨论投资、求职、AI工具、信用卡优惠，氛围轻松。
Meta又来？ 💬 661
Meta内部大规模裁员与AI成本压力引发连锁反应。
我弟要申请大学了，求推荐好的CS Undergrad 💬 635
关于CS本科申请的讨论与选择
【水】做题家每天做题碎碎念 💬 500
LeetCode刷题与技术交流的持续记录，用户分享算法心得与生活点滴
年底将至，赠送潭友 LinkedIn Premium 💬 477
年底赠送 LinkedIn Premium 助求职者与毕业生

← 返回 📈 搬砖