泥潭日报 uscardforum · 每日精选

大家感觉配合GPT 5.4的Codex能力超过Claude Code了吗

内容摘要

GPT 5.4 Codex与Claude Code使用偏好与性能对比讨论。

1. 关键信息

  • GPT 5.4拥有1M context window,理论上较Claude Code(200k)的长记忆与多任务处理有优势(#1、#4、#5)。
  • Claude Code在逻辑严密性、Vibe Alignment及Cursor/MCP协议支持上表现更稳,Debug成功率略高(#5、#17)。
  • 当前多数用户仍倾向Claude Code,生态与技能指令体系构成一定壁垒(#1、#9、#13)。
  • GPT 5.4 Codex模型已与Chat融合,不再分立,agentic能力增强但单一用途模型被弱化(#15)。
  • 部分用户认为Claude配额不足,促使任务转向Codex(#14)。

2. 羊毛/优惠信息

3. 最新动态

4. 争议或不同意见

  • 1M窗口是否Claude Code也具备存在信息误差(#6、#7、#8)。
  • 编码类任务Codex已反超Claude Code(#9)。
  • 生态与迁移成本影响选择(#11、#13)。
  • 工具调用与长流程任务表现待验证(#12)。
  • 成本与综合能力权衡:GPT在价格与多模态/Computer Use上占优,Claude在代码质量与稳定性上更受认可(#16)。

5. 行动建议

根据项目类型与预算权衡选择:复杂遗留代码与长上下文优先GPT 5.4 Codex,严谨调试与快速迭代优先Claude Code;关注配额与生态迁移成本。

原始内容
--- 第 1 楼来自 PPO 的回复 (2026-03-08 04:49:09 PDT) ---

如题,GPT 5.4的1M context window相比于Opus 4.6的200k应该有明显的性能提升,不过目前身边用claude code的还是居压倒性多数,即使claude的费用远高于GPT

用claude code多,觉得claude code好
用claude code多,觉得codex好
用codex多,觉得codex好
用codex多,觉得claude code好
用gemini cli/其他

0
投票人

--- 第 2 楼来自 mgnt.adv 的回复 (2026-03-08 05:24:47 PDT) ---

问就是一起开

claude在数学和idea上的horizen差了gpt 5.4不少。辅助做研究还是有点勉强。

--- 第 3 楼来自 cougarhukomiwa 的回复 (2026-03-08 05:45:55 PDT) ---

5.4好像没有出CODEX,目前用的还是5.3-CODEX

--- 第 4 楼来自 PPO 的回复 (2026-03-08 05:51:57 PDT) ---

codex可以选择5.4作为model吧,看coding benchmark的话5.4是强于5.3-codex的

--- 第 5 楼来自 harvey8 的回复 (2026-03-08 10:45:00 PDT) ---

虽然 GPT 5.4 的 1M 窗口听起来是碾压级的,但在 开发环境下,量大 不代表 活好:

GPT 5.4 Codex 适合 全仓重仓。当你接手一个极其混乱的 Legacy Codebase,或者需要同时参考 50 个微服务的 API 文档时,GPT 的长记忆确实能减少 幻觉。但在处理 Pixel Perfect UI 时,它的细节捕捉依然偶尔会由于过载而走神。

Claude Code 的优势在于 逻辑严密性 和 Vibe Alignment。即便窗口小,但它对 Cursor / MCP 的协议支持极其丝滑。我猜主楼多数人选它,就是因为它的 Debug 成功率 依然略高

--- 第 6 楼来自 xeraz 的回复 (2026-03-08 11:02:35 PDT) ---

Claude Code不是也1M吗?

--- 第 7 楼来自 harvey8 的回复 (2026-03-08 11:03:40 PDT) ---

主楼说的
【引用自 PPO】:
Opus 4.6的200k

--- 第 8 楼来自 harvey8 的回复 (2026-03-08 11:05:54 PDT) ---

确实已经 1M 了。看来主楼信息有误

--- 第 9 楼来自 serelee 的回复 (2026-03-08 11:16:46 PDT) ---

Coding类的超过了。 至少5.3就超过了。

CC主要是全能型选手,写文档,画图,多学科,都可以。 加上目前生态有一定moat

--- 第 10 楼来自 insane-nexus 的回复 (2026-03-08 11:36:14 PDT) ---

【引用自 serelee】:
生态
cc的生态是啥,mcp协议不是通用的吗

--- 第 11 楼来自 serelee 的回复 (2026-03-08 12:50:25 PDT) ---

Skill prompt 还有各种/ 命令

迁移,调试还是有一点成本的

--- 第 12 楼来自 收束观测者 的回复 (2026-03-08 21:06:05 PDT) ---

用了两天感觉tool calling明显赶上来了

长流程任务怎么样还有待观察

--- 第 13 楼来自 zzyyxx 的回复 (2026-03-08 21:10:23 PDT) ---

看投票claude code还是一枝独秀,请问用open code能行吗,还是要花钱上claude code更好

--- 第 14 楼来自 kilofoxtrot 的回复 (2026-03-08 21:12:17 PDT) ---

主要問題是claude的quota太少了,所以會放更多task到codex上

--- 第 15 楼来自 deviplasma 的回复 (2026-03-08 21:16:40 PDT) ---

5.4模型上就像claude一样,全部融到一个里面了,不再分单独的codex模型。感觉主要是agentic用途,单一chat和写码模型都不够了,得各方面都强——包括多模态理解和computer use

--- 第 16 楼来自 deviplasma 的回复 (2026-03-08 21:19:22 PDT) ---

个人感觉,在做开发上,opus还是容易写有bug的,然后gpt更容易找到claude写的bug。综合考虑到成本(包括codex和在openclaw里用),GPT $20完胜claude

--- 第 17 楼来自 xiaoli 的回复 (2026-03-08 22:07:56 PDT) ---

从 gpt-5 开始没有觉得CC比Codex好用过。只是Claude比较好聊而且比较快,但是5.4也解决了这个问题。