大家感觉配合GPT 5.4的Codex能力超过Claude Code了吗
GPT 5.4 Codex与Claude Code使用偏好与性能对比讨论。
1. 关键信息
- GPT 5.4拥有1M context window,理论上较Claude Code(200k)的长记忆与多任务处理有优势(#1、#4、#5)。
- Claude Code在逻辑严密性、Vibe Alignment及Cursor/MCP协议支持上表现更稳,Debug成功率略高(#5、#17)。
- 当前多数用户仍倾向Claude Code,生态与技能指令体系构成一定壁垒(#1、#9、#13)。
- GPT 5.4 Codex模型已与Chat融合,不再分立,agentic能力增强但单一用途模型被弱化(#15)。
- 部分用户认为Claude配额不足,促使任务转向Codex(#14)。
2. 羊毛/优惠信息
无
3. 最新动态
无
4. 争议或不同意见
- 1M窗口是否Claude Code也具备存在信息误差(#6、#7、#8)。
- 编码类任务Codex已反超Claude Code(#9)。
- 生态与迁移成本影响选择(#11、#13)。
- 工具调用与长流程任务表现待验证(#12)。
- 成本与综合能力权衡:GPT在价格与多模态/Computer Use上占优,Claude在代码质量与稳定性上更受认可(#16)。
5. 行动建议
根据项目类型与预算权衡选择:复杂遗留代码与长上下文优先GPT 5.4 Codex,严谨调试与快速迭代优先Claude Code;关注配额与生态迁移成本。
如题,GPT 5.4的1M context window相比于Opus 4.6的200k应该有明显的性能提升,不过目前身边用claude code的还是居压倒性多数,即使claude的费用远高于GPT
用claude code多,觉得claude code好
用claude code多,觉得codex好
用codex多,觉得codex好
用codex多,觉得claude code好
用gemini cli/其他
0
投票人
问就是一起开
claude在数学和idea上的horizen差了gpt 5.4不少。辅助做研究还是有点勉强。
5.4好像没有出CODEX,目前用的还是5.3-CODEX
codex可以选择5.4作为model吧,看coding benchmark的话5.4是强于5.3-codex的
虽然 GPT 5.4 的 1M 窗口听起来是碾压级的,但在 开发环境下,量大 不代表 活好:
GPT 5.4 Codex 适合 全仓重仓。当你接手一个极其混乱的 Legacy Codebase,或者需要同时参考 50 个微服务的 API 文档时,GPT 的长记忆确实能减少 幻觉。但在处理 Pixel Perfect UI 时,它的细节捕捉依然偶尔会由于过载而走神。
Claude Code 的优势在于 逻辑严密性 和 Vibe Alignment。即便窗口小,但它对 Cursor / MCP 的协议支持极其丝滑。我猜主楼多数人选它,就是因为它的 Debug 成功率 依然略高
Claude Code不是也1M吗?
主楼说的
【引用自 PPO】:
Opus 4.6的200k
确实已经 1M 了。看来主楼信息有误
Coding类的超过了。 至少5.3就超过了。
CC主要是全能型选手,写文档,画图,多学科,都可以。 加上目前生态有一定moat
【引用自 serelee】:
生态
cc的生态是啥,mcp协议不是通用的吗
Skill prompt 还有各种/ 命令
迁移,调试还是有一点成本的
用了两天感觉tool calling明显赶上来了
长流程任务怎么样还有待观察
看投票claude code还是一枝独秀,请问用open code能行吗,还是要花钱上claude code更好
主要問題是claude的quota太少了,所以會放更多task到codex上
5.4模型上就像claude一样,全部融到一个里面了,不再分单独的codex模型。感觉主要是agentic用途,单一chat和写码模型都不够了,得各方面都强——包括多模态理解和computer use
个人感觉,在做开发上,opus还是容易写有bug的,然后gpt更容易找到claude写的bug。综合考虑到成本(包括codex和在openclaw里用),GPT $20完胜claude
从 gpt-5 开始没有觉得CC比Codex好用过。只是Claude比较好聊而且比较快,但是5.4也解决了这个问题。