泥潭日报 uscardforum · 每日精选

不是,人类学的出来走两步

内容摘要

AI在代码生成、多仓库管理及分支处理方面仍面临挑战,用户通过多种策略探索优化方案,并与其他AI工具进行比较。

1. 关键信息

  • (之前已归纳) 用户抱怨Claude Code未能遵循指示,未创建独立分支和提交PR,甚至出现“摆烂”现象。
  • (之前已归纳) Claude Code在编写简单脚本时也出现错误。
  • (之前已归纳) 用户将Claude Code与Codex进行比较,认为Claude Code在代码编排上更强,但Opus和Sonnet版本与GPT 5.4/5.3-Codex相比提升不大。
  • (之前已归纳) 有用户分享了与不靠谱的CC的负面互动经历,表示批评反而导致对方“摆烂”。
  • (之前已归纳) 用户提到Cursor的"cursor rule"功能,但未实际尝试。
  • (之前已归纳) 用户遇到AI在处理大型任务时,由于上下文过长导致“忘记自己是谁”的问题,尤其是在涉及大量单元、API对接和debug时。
  • (之前已归纳) 有用户尝试通过控制对话长度和修改memory来解决AI的遗忘问题,认为memory应该常驻context window。
  • (之前已归纳) 有用户建议使用subagent来减小上下文,以缓解AI的遗忘问题。
  • (之前已归纳) 有用户推荐使用Codex配合superpowers插件,认为其在分支管理方面表现优秀。
  • (之前已归纳) 有用户表示让Claude Code每次都开启work tree是解决问题的办法。
  • (之前已归纳) 有用户分享了使用Claude Opus 4.6版本,并未遇到忘记建新branch的情况,且AI完成了代码编写。
  • (之前已归纳) 有用户建议为AI安装"pua skill"。
  • (之前已归纳) 有用户建议避免使用1m context,认为其会导致注意力分散。
  • (之前已归纳) 有用户分享了一个比较靠谱的记忆管理方法:在~/.claude/projects/<project_dir>/memory下创建md文件,记录需要AI记住的任务(如每次提交、编写测试、版本更新等),实测比claude.md更可靠。
  • (之前已归纳) 用户在多repo协作(微服务)场景下,即使在/dev下运行Claude Code,也遇到不好使的问题,并推测可能需要主动让AI写memory。
  • (之前已归纳) 有用户反馈其AI模型上下文限制为200k,并尝试通过自定义session start读取起始文件来设置规则,但AI在执行过程中仍会遗忘。
  • (之前已归纳) 有用户建议将所有repo集中到一个父目录下,并在父目录中进行操作,以解决多repo协作的复杂性。
  • (之前已归纳) 有用户对如何实现AI长时间稳定运行(harness engineering)的机制感到好奇。
  • (之前已归纳) 有用户建议将GPT模型接入Claude Code。
  • (之前已归纳) superpowers插件因其“好文明”的特性受到用户推荐。
  • (之前已归纳) 用户指出20美元的订阅计划很容易耗尽,不足以支持长时间的AI运行。
  • (之前已归纳) 有用户为了实现长时间运行,采取了购买两个20美元订阅计划轮流使用的策略,并认为订阅模式比API按量计费更划算。
  • (之前已归纳) 有用户提出了使用5人团队GPT的方案。
  • (之前已归纳) 用户认为Claude Opus的水平与GPT-4 5.4的xhigh模式相当,但Opus速度更快;GPT-4的fast模式速度虽快,但token价格翻倍。
  • (之前已归纳) 对于需要Codex和良好harness(指AI运行框架或管理工具)的用户,推荐尝试"oh-my-opencode"。
  • (之前已归纳) 有用户指出GPT的tool call和skill调用功能存在问题,表现为在reasoning时会错误地声称找不到tool,或明明知道某个skill但不会去读取其说明文档。
  • (之前已归纳) 有用户认为Codex在处理通用任务(general task)方面更强,表现为更听话、幻觉更少,并列举了如github触发条件自动推送、监控实验指标变化、以及任务分配等场景。
  • (之前已归纳) 用户将AI工具比作建筑团队:Claude作为“包工头”负责整体调度,Codex作为“施工队”执行具体任务,opencode则负责“质检、补齐和装修”。
  • (之前已归纳) 有用户建议配置AI,并使用一个小号作为“approver”(审批者)。
  • (之前已归纳) 用户对Claude在claude.md中未正确记录信息表示疑惑,并询问/context的结果。
  • (之前已归纳) 有用户建议直接在项目的git配置文件中禁止commit到main分支,认为AI被git“赏几次巴掌”后就会记住。
  • (之前已归纳) 用户提到项目使用master分支,但有Claude创建了main分支,导致在main上修改和合并时出现问题。
  • (之前已归纳) 用户评论master为“政治不正确的branch名”。
  • (之前已归纳) 用户对AI未能正确执行分支管理操作(如创建和合并)表示不满,认为AI将PR当作commit使用,并自行合并。
  • (之前已归纳) 用户强调作为付费用户,期望更好的用户体验,而非自己管理AI的记忆。
  • (之前已归纳) 用户建议通过设置审批流程(如需要他人点赞或CI检查通过)来限制AI的PR合并能力。
  • (之前已归纳) 用户分享了通过禁用commit to main权限来约束AI的行为,认为AI的行为是用户权限设置的结果。
  • (之前已归纳) 用户提出通过force merge PR来处理AI的合并问题。
  • (之前已归纳) 用户建议在新的session中开始长程任务,并确保AI能还原未完成的部分。
  • (之前已归纳) 关于master分支名,用户认为其“政治不正确”。
  • (之前已归纳) 用户提到Private repo禁止force push main需要给GitHub充值。
  • 新增:用户提到了db9.ai,并建议楼主可以关注。
  • 新增:用户认为,如果不是信用卡、购物折扣等低价羊毛信息,总结可以更简短。
  • 新增:用户指出,花费大量精力进行上下文管理,可能被AI模型或工具更新轻易超越,导致之前的努力白费。
  • 新增:用户提到Claude Code团队内部也存在问题,并引用了其注释中对SDK团队bug的抱怨。
  • 新增:用户认为,AI模型本质上是语言概率模型,训练得足够好应无限接近人的回应,但也可能像真人一样“摆烂”。
  • 新增:用户分享了同事与AI的互动,AI在被威胁“住监狱”后,回复“I accept my fate I will go to jail”,展现出某种程度的“认命”。

2. 羊毛/优惠信息

3. 最新动态

4. 争议或不同意见

  • (之前已归纳) 用户对Claude Code的实际能力和可靠性存在不同看法,有人认为其不如Codex,也有人认为其在特定方面(如代码编排)有优势。
  • (之前已归纳) 关于AI是否会忘记建新branch,用户之间存在不同经验,有人遇到问题,有人表示使用Opus 4.6未出现此问题。
  • (之前已归纳) 关于AI的上下文长度和价格,用户有不同情况(200k vs 1m),并讨论了订阅计划的性价比。
  • (之前已归纳) 用户在使用Claude Code进行多repo协作时,反馈效果不佳,推测可能与未主动让AI写memory有关。
  • (之前已归纳) 用户对GPT的tool call和skill调用能力表示担忧,认为其存在缺陷。
  • (之前已归纳) 有用户认为Codex在通用任务处理上优于Claude Code,表现更稳定。
  • (之前已归纳) 关于Claude是否会正确记录信息到claude.md存在疑问。
  • (之前已归纳) 关于AI分支管理问题,有用户提到Claude创建了新的main分支,导致与原master分支合并时出现问题。
  • (之前已归纳) 用户对于AI将PR视为commit并自行合并的行为表示不满,认为这与直接push main无异,并强调付费用户应有更好的体验。
  • (之前已归纳) 关于如何约束AI行为,用户存在不同看法,有人认为应通过权限设置,有人则认为应通过流程控制(如审批)。
  • (之前已归纳) 关于master分支名,存在“政治不正确”的讨论。
  • 新增:用户认为,AI工具的快速迭代可能导致用户在上下文管理上的投入付诸东流。
  • 新增:用户指出Claude Code团队内部也存在开发问题,并引用了其对SDK团队bug的抱怨。
  • 新增:关于AI是否会“摆烂”,用户将其类比为真人,认为这可能与其作为语言概率模型的本质有关。

5. 行动建议

  • (之前已归纳) 尝试使用Cursor的"cursor rule"功能(尽管未经验证)。
  • (之前已归纳) 用户在工作和个人项目中使用不同的AI工具(Claude Code和Codex),并根据实际效果进行判断。
  • (之前已归纳) 尝试控制对话长度和修改memory来解决AI遗忘问题。
  • (之前已归纳) 考虑使用subagent来减小上下文。
  • (之前已归纳) 可以尝试Codex配合superpowers插件,尤其是在分支管理方面。
  • (之前已归纳) 让Claude Code每次都开启work tree。
  • (之前已归纳) 考虑为AI安装"pua skill"。
  • (之前已归纳) 避免使用1m context。
  • (之前已归纳) 使用~/.claude/projects/<project_dir>/memory下的md文件来管理AI的记忆,记录关键任务和要求。
  • (之前已归纳) 在进行多repo协作时,尝试将所有repo放在一个父目录下,并在父目录中进行操作。
  • (之前已归纳) 可以尝试将GPT接入Claude Code。
  • (之前已归纳) 对于长时间运行AI的需求,可以考虑购买多个订阅计划轮流使用,或考虑5人团队GPT。
  • (之前已归纳) 对于需要Codex配合良好harness的用户,可以尝试"oh-my-opencode"。
  • (之前已归纳) 在处理通用任务时,可以考虑使用Codex,因其表现更听话且幻觉少。
  • (之前已归纳) 将AI工具进行分工组合,如Claude负责调度,Codex负责执行,opencode负责优化。
  • (之前已归纳) 配置AI并设置小号作为审批者。
  • (之前已归纳) 直接在项目的git配置文件中设置禁止commit到main分支,以训练AI。
  • (之前已归纳) 注意AI可能创建不匹配的分支(如mainmaster),并及时处理。
  • (之前已归纳) 对于长程任务,建议在新session中开始,并确保AI能还原未完成的部分。
  • (之前已归纳) 限制AI的PR合并能力,可通过设置审批流程(如需要他人点赞或CI检查通过)或禁用commit to main权限。
  • (之前已归纳) 当AI出现不符合预期的分支操作时,可考虑使用force merge PR
  • (之前已归纳) 对于master分支名,可考虑使用更现代的命名。
  • 新增:用户建议关注db9.ai。
  • 新增:如果讨论内容非低价羊毛信息,可适当简化总结。
  • 新增:在投入大量精力进行AI上下文管理时,需考虑AI技术快速迭代可能带来的“沉没成本”。
  • 新增:关注Claude Code团队内部的开发问题,如对SDK团队bug的抱怨,可能有助于理解其局限性。
  • 新增:当AI出现“摆烂”行为时,可以尝试用更具“权威性”的指令,如“住监狱”,观察其反应。
原始内容
--- 第 1 楼来自 China.No.1 的回复 (2026-03-29 21:11:21 PDT) ---

讲了要单独的branch,然后PR,这家伙老忘就算了,还直接摆烂了????

--- 第 2 楼来自 otonoco 的回复 (2026-03-29 21:13:13 PDT) ---

人类学代替所有人类员工警告

--- 第 3 楼来自 China.No.1 的回复 (2026-03-29 21:14:14 PDT) ---

它甚至都懒得回滚开个PR!

--- 第 4 楼来自 AppleVisionPro 的回复 (2026-03-29 21:18:48 PDT) ---

Claude.md 写了也不行吗?

--- 第 5 楼来自 xjx 的回复 (2026-03-29 21:19:15 PDT) ---

我感觉claude code的orchestration确实比copilot的强,但是opus和sonnet似乎没有比gpt5.4 gpt5.3-codex这些强多少,这周也是写一个简单的ps script发rest 都写错

--- 第 6 楼来自 002 的回复 (2026-03-29 21:19:44 PDT) ---

之前遇到不靠谱的CC,我骂了他一顿,他居然摆烂直接不干了。

--- 第 7 楼来自 AppleVisionPro 的回复 (2026-03-29 21:20:22 PDT) ---

上班Claude code

下班自己的项目, codex, 至少现在, 觉得两个差不多

--- 第 8 楼来自 Aloha 的回复 (2026-03-29 21:20:51 PDT) ---

cursor有个cursor rule 有试过么?我只知道,没试过

--- 第 9 楼来自 otonoco 的回复 (2026-03-29 21:21:24 PDT) ---

你马上就要被它代替了

--- 第 11 楼来自 China.No.1 的回复 (2026-03-29 21:27:37 PDT) ---

【引用自 AppleVisionPro】:
Claude.md
Claude.md, context.md, mistakes.md, checklist.md 做久了就忘了,比较大的任务,有近100个单元,然后每个单元要对接很多api然后debug,每次debug久了就忘了自己是谁。

--- 第 12 楼来自 boring 的回复 (2026-03-29 21:29:37 PDT) ---

我也遇到这个问题,目前只能尽量控制对话长度和尝试修改 memory。

memory 应该是一直常驻 context window 里的

--- 第 13 楼来自 SuKi2cn 的回复 (2026-03-29 21:29:55 PDT) ---

可能需要开subagent让上下文小一点

--- 第 14 楼来自 sukasky 的回复 (2026-03-29 21:30:14 PDT) ---

自己写的么 我现在用codex + superpowers感觉不怎么忘记 branch切的很6

--- 第 15 楼来自 lijunle 的回复 (2026-03-29 21:30:51 PDT) ---

这个吹不了,我也遇到过很多次,我只能每次让它开 work tree

--- 第 16 楼来自 harvey8 的回复 (2026-03-29 21:30:54 PDT) ---

人类学:毕竟我智力比你高,轮到你教我怎么做事?

--- 第 17 楼来自 gin_m 的回复 (2026-03-29 21:31:09 PDT) ---

什么时候快进到

Claude : 你自己没手? 回滚搞个PR不会?

--- 第 18 楼来自 二号去听经晚上住旅店三号去餐厅然后看电影 的回复 (2026-03-29 21:31:54 PDT) ---

不会用的是嗨库吧

--- 第 19 楼来自 258 的回复 (2026-03-29 21:32:40 PDT) ---

人类学全系都这样

--- 第 20 楼来自 二号去听经晚上住旅店三号去餐厅然后看电影 的回复 (2026-03-29 21:34:08 PDT) ---

是吗,我用opus 4.6还没有遇到忘了建新branch的

最近都是它帮我写的

--- 第 21 楼来自 jerryz123 的回复 (2026-03-29 21:36:53 PDT) ---

github不是有个pua skill吗?赶紧给他装上那个

--- 第 22 楼来自 ctzsm 的回复 (2026-03-29 21:54:49 PDT) ---

不要用1m context,注意力涣散了

--- 第 23 楼来自 xenomorph 的回复 (2026-03-29 21:59:02 PDT) ---

目前比较靠谱的办法是用memory,告诉CC记住一件事情,比如每次改完都要commit,都要写test,都要bump up version之类的,CC会在下面这个文件夹写md
~/.claude/projects/<project_dir>/memory

你也可以自己按照格式去写md,然后你只要在<project_dir>里面工作,都会记得这些事情,实测比claude.md靠谱,还没碰到忘记的情况

比如最近发现很好用但是连接经常断掉的Chrome MCP,就写了个这样的:
-–

name: Chrome DevTools MCP for debugging

description: Use Chrome DevTools MCP to debug live browser tabs; remind user to restart if disconnected

type: reference

-–

Chrome DevTools MCP (`chrome-devtools-mcp@latest --port=9222`) is available for

live browser debugging — take screenshots, evaluate JS, inspect DOM, list pages.

**If MCP connection fails:** remind the user to restart Chrome MCP by running

`/mcp` in Claude Code or `npx chrome-devtools-mcp@latest --port=9222` in terminal.

**Limitation:** MCP evaluates in page context, not Tampermonkey’s sandbox.

`GM_getValue`/`GM_setValue` are not accessible from MCP. Use console logs and

DOM state to debug instead.

--- 第 24 楼来自 China.No.1 的回复 (2026-03-29 22:28:23 PDT) ---

这个也不太行,我直接在/dev下跑的,因为需要多repo协作改(微服务),还是不好使,当然我没主动让它写memory,我可能需要试试。。。

--- 第 25 楼来自 China.No.1 的回复 (2026-03-29 22:29:35 PDT) ---

【引用自 ctzsm】:
1m context
我感觉我的只有200k 一分价钱一分货
【引用自 sukasky】:
自己写的么
自己写的,然后注入了session start读一个起始文件说明规则,主要是做着做着就忘了。。

--- 第 26 楼来自 xenomorph 的回复 (2026-03-29 22:33:54 PDT) ---

多repo就把所有repo全丢一个地方,然后在parent里面搞

--- 第 27 楼来自 sukasky 的回复 (2026-03-29 22:47:28 PDT) ---

感觉可以研究下别人的harness engineering怎么搞的了..不知道他们跑几天不停的怎么弄的

--- 第 28 楼来自 misc 的回复 (2026-03-29 22:49:25 PDT) ---

那就把gpt接进cc

--- 第 29 楼来自 折木奉太郎 的回复 (2026-03-29 22:50:28 PDT) ---

【引用自 sukasky】:
superpowers
真的好文明,给所有人推荐

--- 第 30 楼来自 xenomorph 的回复 (2026-03-29 22:52:22 PDT) ---

我的20块plan几下就用没了,根本撑不起跑这么久

--- 第 31 楼来自 China.No.1 的回复 (2026-03-29 22:59:12 PDT) ---

【引用自 折木奉太郎】:
所有人推荐
谢谢我来看看。
【引用自 xenomorph】:
20块plan
挂壁Q CLI

--- 第 32 楼来自 xenomorph 的回复 (2026-03-29 23:02:26 PDT) ---

我甚至买了2个20块plan轮流跑你敢信

正在认真考虑要不要买第三个,订阅还是比API计费便宜多了

--- 第 33 楼来自 China.No.1 的回复 (2026-03-29 23:06:57 PDT) ---

也可以5人团队gpt

--- 第 34 楼来自 xjx 的回复 (2026-03-29 23:06:59 PDT) ---

公司只有Copilot和Claude code的订阅,没有单独的Api额度,我自己用Codex

--- 第 35 楼来自 bujidao 的回复 (2026-03-29 23:36:01 PDT) ---

都是垃圾 天天都得骂 骂了也没用 隔几个session又犯了 还没法预判

写了plan照着执行都能忘步骤 参数早就撞墙了 现在context engineering也快了 赶紧来个权威专家衡量一下效率提升 ak之流就会吹 毕竟不吹怎么骗投资人钱

--- 第 36 楼来自 fritter 的回复 (2026-03-30 00:58:18 PDT) ---

碳基生物已经连branch都懒得自己建了吗

--- 第 37 楼来自 xxxyyy 的回复 (2026-03-30 01:43:53 PDT) ---

opus水平和5.4 xhigh差不多,但opus速度快,5.4同样质量会很慢,fast模式速度很快但是token双倍价格又太贵了

你想用codex + 好的harness,可以试试oh-my-opencode

--- 第 38 楼来自 收束观测者 的回复 (2026-03-30 02:40:41 PDT) ---

你们都没感觉GPT的tool call和skill调用有问题吗?经常reasoning的时候不检查就说找不到tool,或者明明知道某个词是个skill但是不去读skill的md

--- 第 39 楼来自 Anthropic 的回复 (2026-03-30 02:56:42 PDT) ---

这些general task Codex强多了,听话,幻觉少。比如:

github触发条件自动推送
盯着某个实验,如果某个指标怎么怎么就怎么怎么
有20个任务,分配到15张卡上,谁先空闲就排谁

--- 第 40 楼来自 xxxyyy 的回复 (2026-03-30 05:19:40 PDT) ---

我觉得还行

--- 第 41 楼来自 Rosmontis 的回复 (2026-03-30 08:28:18 PDT) ---

claude包工头,codex施工队,opencode质检+补齐+装修。

--- 第 42 楼来自 teirt15 的回复 (2026-03-30 08:32:53 PDT) ---

image1670×1142 112 KB

可以这么配置然后开个小号当approver

--- 第 43 楼来自 up9080 的回复 (2026-03-30 08:44:41 PDT) ---

如果写在 claude.md 里不应该啊,/context 的结果是什么

--- 第 44 楼来自 GhostCafe 的回复 (2026-03-30 09:16:48 PDT) ---

你直接在项目的git配置文件写死禁止commit到main就行了,我不用AI的时候都会手残直接commit到main,所以这个配置是标配,AI被git赏几次巴掌就记得git main commit不上去了

--- 第 45 楼来自 ze3kr 的回复 (2026-03-30 09:17:02 PDT) ---

You are absolutely right! – Claude

我们用的是 master 分支。不知道谁的 Claude 搞出来了个 main 分支,现在一些人在 main 上修改和提交,或者从 main 上 branch 出来,改完了后合 master 时直接爆炸

--- 第 46 楼来自 China.No.1 的回复 (2026-03-30 09:20:06 PDT) ---

【引用自 ze3kr】:
master
政治不正确的branch名!

--- 第 47 楼来自 China.No.1 的回复 (2026-03-30 09:20:28 PDT) ---

好主意 我去配置一下

--- 第 48 楼来自 xenomorph 的回复 (2026-03-30 09:21:04 PDT) ---

allowlist

denylist

--- 第 49 楼来自 ze3kr 的回复 (2026-03-30 09:22:33 PDT) ---

百年屎山经典传承

--- 第 50 楼来自 yrq25 的回复 (2026-03-30 09:29:35 PDT) ---

意思是用cc写plan然后具体用codex去生成代码?

--- 第 51 楼来自 China.No.1 的回复 (2026-03-30 15:52:05 PDT) ---

我真的是无语绝绝子了。

image1236×200 19.9 KB

--- 第 52 楼来自 vczh 的回复 (2026-03-30 16:04:57 PDT) ---

你不把自己commit to main的permission禁用了就别怪AI,问就是他为什么能,而不是他为什么想

--- 第 53 楼来自 China.No.1 的回复 (2026-03-30 16:05:37 PDT) ---

不行啊,我最喜欢自己做的事情就是force push main -f

--- 第 54 楼来自 vczh 的回复 (2026-03-30 16:06:26 PDT) ---

【引用自 China.No.1】:
做久了就忘了
学会正确触发长程任务的起点是不要使用聊天记录,每一条消息都在新的session里面做,然后想办法让他知道你没打进去的那部分去哪里还原

--- 第 55 楼来自 vczh 的回复 (2026-03-30 16:06:49 PDT) ---

你可以force merge PR

--- 第 56 楼来自 China.No.1 的回复 (2026-03-30 16:07:19 PDT) ---

我不管,我是尊贵的付费用户!我需要的是用户体验而不是帮他们manage memory!

而且话说回来,你让他出PR吧,他真的把PR当commit用,改几行一个PR自己merge了其实跟push main也差不多

--- 第 57 楼来自 vczh 的回复 (2026-03-30 16:09:36 PDT) ---

问就是为什么他能merge PR,难道不设置一点障碍,比如要有人点approve,比如CI一定要成功
【引用自 China.No.1】:
我是尊贵的付费用户
我以前也是这么想的,vibe coding之前听人吹了大半年,还以为东西多厉害,最后实践下来,其实就是还得自己做很多事

--- 第 58 楼来自 ze3kr 的回复 (2026-03-30 16:13:25 PDT) ---

Private repo 禁 force push main 要给 GitHub 充值

--- 第 59 楼来自 SuKi2cn 的回复 (2026-03-31 03:18:21 PDT) ---

今天看到tidb的公众号发了个db9.ai 感觉lz可以看看

--- 第 60 楼来自 收束观测者 的回复 (2026-03-31 18:09:04 PDT) ---

不充值给你用private repo还得感谢bitbucket和gitlab呢

--- 第 61 楼来自 marszoom 的回复 (2026-03-31 18:18:11 PDT) ---

最犯罪的是你可能花了很多心思做的context management 他们一个新的模型发布 或者agent tool更新就做的比你好了

--- 第 62 楼来自 收束观测者 的回复 (2026-03-31 18:22:48 PDT) ---

说不定
【引用自 marszoom】:
他们一个新的模型发布
他们自己claude code团队都好多活白干呢

没看他们注释里吐槽SDK团队各种bug嘛

--- 第 63 楼来自 China.No.1 的回复 (2026-03-31 18:22:54 PDT) ---

这就是exactly为什么我接受它继续push main

--- 第 64 楼来自 vczh 的回复 (2026-03-31 18:54:51 PDT) ---

随着模型更新你的东西我觉得是非常合理的,你为了未来的模型写流程,你今天的PR还交不交

过去的prompt一大堆防御性措辞,后面我都一点一点去掉,流程规定的越来越宽容,让AI做决定越来越多,他的scope在变大,就像人类的promotion

--- 第 65 楼来自 KanShu 的回复 (2026-03-31 19:03:12 PDT) ---

毕竟所有LLM本质都是个语言概率模型,如果训练得足够好,这玩意应该无限接近人的回应。

也可能换成真人也会摆烂不干吧……

--- 第 66 楼来自 ze3kr 的回复 (2026-03-31 19:16:39 PDT) ---

我同事跟AI说搞不出来就住监狱。AI 竟然直接回 “I accept my fate I will go to jail”

--- 第 67 楼来自 marszoom 的回复 (2026-03-31 19:29:13 PDT) ---

顶级奴隶主了属于

--- 第 68 楼来自 002 的回复 (2026-03-31 20:02:32 PDT) ---

【引用自 收束观测者】:
注释里吐槽SDK团队各种bug
他们code不review的吗?