泥潭日报 uscardforum · 内容汇总

Opus 4.6 真的比 4.8 好用吗

内容摘要

Opus 4.6 凭速度与听话度胜出,GPT 5.5 在代码审计上表现优异。

关键信息

  • 版本对比:用户 @Divinealex 和 @zacksz 指出 Opus 4.6 (1M context) 比 4.8 快且更“听话” [7, 10];@skyblu 给出排序 5.5 > 4.6 > 4.8 >> 4.7 [18]
  • GPT 5.5 表现:被评价为代码审计能力强于 Opus,能发现 Opus 忽略的 bug,但直接写代码效率低且慢 [13, 15, 17]。
  • 替代方案:@Divinealex 仍认为 Fable 5 体验差(“纯纯shit”)[17];@xenomorph 建议尝试 /effort ultra 模式但需注意 Token 消耗 [25]

争议或不同意见

  • 4.8 的缺陷:多位用户批评 4.8 “偷懒”、过于自信、考虑不周,甚至不如 4.6 [13, 22];@niger 认为 4.6 之后的版本是“自吹自擂” [7]
  • 4.7 的口碑:普遍被贬低为“纯垃圾”或“÷”,@Divinealex 直接以符号回应为何跳过该版本 [13, 28]。
  • 榜单质疑:用户认为当前榜单(如 DeepSWE)存在偏差,疑似水军操控,且 4.7 排名高于 4.6 令人困惑 [24]

经验与数据点

  • Google Antigravity IDE:仅支持 Opus 4.6,侧面反映其在特定开发环境中的稳定性或兼容性优势 [11]
  • 使用策略:@LeoQ8 采用“4.8 初写 + GPT 5.5 审核”的组合拳;@Divinealex 将 GPT 用于量化分析而非编程 [17, 21]。
  • 上下文限制:Opus Pro 版默认 200k,1M 需付费;免费版 Sonnet 可用但 Opus 不可用 [9]

闲聊脉络

  • 怀旧情绪:用户怀念早期模型“断崖式提升”的惊艳感,认为新版本毛病增多,澄清无用 [12]
  • 术语解释:@illusionwing 询问“÷”含义,@skyblu 和 @折木奉太郎 解释为“畜”的谐音或贬义符号 [23, 28]。
  • 账号资源:讨论中提及通过多账号(如18个)获取 Pro 订阅以获取更多 Token 额度 [24]
原始内容
--- 第 1 楼来自 Divinealex 的回复 (2026-06-13 21:53:13 PDT) ---

如题,真的Opus 4.8这么垃圾吗?我自己两个模型都试着用,感觉区别不大啊 而且在claude code 里这俩都是available的 /uploads/short-url/hs0z0wtjt4Wvff5ZVWbVsWKjLEA.png?dl=1

--- 第 2 楼来自 Divinealex 的回复 (2026-06-13 21:54:43 PDT) ---

不过anyway Fable 5确实明显好用点,前两天爽了一周的token

--- 第 3 楼来自 jnnksn 的回复 (2026-06-13 21:54:58 PDT) ---

真的zs

--- 第 4 楼来自 Divinealex 的回复 (2026-06-13 21:56:41 PDT) ---

怎么体会出来的,虽然我看一些榜单上也这么写

--- 第 5 楼来自 Vic 的回复 (2026-06-13 22:03:24 PDT) ---

为啥跳过4.7?

--- 第 6 楼来自 Divinealex 的回复 (2026-06-13 22:08:09 PDT) ---

4.7,÷

--- 第 7 楼来自 niger 的回复 (2026-06-13 22:08:25 PDT) ---

4.6 1 million context 是巅峰,之后几个版本感觉都像自吹自擂,说单口相声

--- 第 8 楼来自 Divinealex 的回复 (2026-06-13 22:08:48 PDT) ---

白色的 /u/niger ?

--- 第 9 楼来自 niger 的回复 (2026-06-13 22:15:05 PDT) ---

max版缺省使用,是橙色标签,pro版默认200k上下文,1M上下文按用量付费,免费版只能用sonnet用不了opus

--- 第 10 楼来自 zacksz 的回复 (2026-06-13 22:21:46 PDT) ---

Opus 4.6 1m 是我更喜欢的,主要是比 4.8 快很多

--- 第 11 楼来自 Carring 的回复 (2026-06-13 22:23:10 PDT) ---

https://antigravity.google https://antigravity.google Google Antigravity - Build the new way google是这么认为的,他家ide只支持opus4.6

--- 第 12 楼来自 xenomorph 的回复 (2026-06-13 22:29:32 PDT) ---

大家怀念的是刚出来时断崖式提升的那种惊艳感,用久了自然毛病越来越多,谁来澄清都没用

--- 第 13 楼来自 ztam 的回复 (2026-06-13 22:36:36 PDT) ---

使用下来感觉4.6更像是一个听话的牛马,虽然有的时候会做错事情。4.8 有的时候会“偷懒”+过于自信,但是确实让gpt audit他写的代码的时候比4.6 bug少很多。4.7那就不说了,纯垃圾。

--- 第 14 楼来自 let 的回复 (2026-06-13 22:39:17 PDT) ---

那问题来了,相当于gpt 5.几 水平

--- 第 15 楼来自 ztam 的回复 (2026-06-13 22:42:39 PDT) ---

感觉各有长处。直接写代码可能gpt 5.5也就sonnet的水平,而且慢得不想用。但是让他审核代码他能找出很多opus发现不了的问题。

--- 第 16 楼来自 jnnksn 的回复 (2026-06-13 22:54:31 PDT) ---

后面新模型没进步,有时候答案错的更离谱

--- 第 17 楼来自 LeoQ8 的回复 (2026-06-13 23:42:20 PDT) ---

我一般让4.8先写,找不出问题会让gpt 5.5看看。但是fable 5纯纯shit

--- 第 18 楼来自 skyblu 的回复 (2026-06-14 00:13:52 PDT) ---

5.5>4.6>4.8>>4.7

--- 第 19 楼来自 harrywy 的回复 (2026-06-14 00:18:31 PDT) ---

真的吗 我用4.7 4.8 auto mode 了一个月 换回GPT5.5 有点不太适应了… 感觉GPT 一直想改opus 的design 有点让我绷不住

--- 第 20 楼来自 skyblu 的回复 (2026-06-14 00:20:33 PDT) ---

gpt唯一的缺点就是不开1m context给codex 你的首要任务是赶紧切回4.6试试 感觉和具体项目也有关系 说不定你干的事情4.8真的比4.6强呢

--- 第 21 楼来自 Divinealex 的回复 (2026-06-14 00:22:24 PDT) ---

我是感觉4.8创意比较强,但是是个÷ 4.6比较听话 GPT主要是我没订阅pro,套餐量太少了,而且我全拿去当我的量化模型 新闻分析师了 lol

--- 第 22 楼来自 Pericles 的回复 (2026-06-14 00:28:17 PDT) ---

完全正确。4.8和4.7让我想骂娘,呆呆的木木的,比4.6考虑的事情少了很多。

--- 第 23 楼来自 illusionwing 的回复 (2026-06-14 00:33:57 PDT) ---

Divinealex: ÷ 这到底是啥意思,这两天看到好多了

--- 第 24 楼来自 skyblu 的回复 (2026-06-14 00:40:15 PDT) ---

没订阅pro也太搞了 我隔壁薅的18个账号都不够用 我现在看到任何榜单把4.7放在4.6上面就直接呵呵了 不过目前好像除了deepSWE就没了 不过那玩意儿真的很像gpt的水军

--- 第 25 楼来自 xenomorph 的回复 (2026-06-14 00:44:01 PDT) ---

4.8之后可以试试 /effort ultra,注意token消耗

--- 第 26 楼来自 折木奉太郎 的回复 (2026-06-14 00:58:41 PDT) ---

畜的谐音吧