Opus 4.6 真的比 4.8 好用吗
Opus 4.6 凭速度与听话度胜出,GPT 5.5 在代码审计上表现优异。
关键信息
- 版本对比:用户 @Divinealex 和 @zacksz 指出 Opus 4.6 (1M context) 比 4.8 快且更“听话” [7, 10];@skyblu 给出排序 5.5 > 4.6 > 4.8 >> 4.7 [18]。
- GPT 5.5 表现:被评价为代码审计能力强于 Opus,能发现 Opus 忽略的 bug,但直接写代码效率低且慢 [13, 15, 17]。
- 替代方案:@Divinealex 仍认为 Fable 5 体验差(“纯纯shit”)[17];@xenomorph 建议尝试 /effort ultra 模式但需注意 Token 消耗 [25]。
争议或不同意见
- 4.8 的缺陷:多位用户批评 4.8 “偷懒”、过于自信、考虑不周,甚至不如 4.6 [13, 22];@niger 认为 4.6 之后的版本是“自吹自擂” [7]。
- 4.7 的口碑:普遍被贬低为“纯垃圾”或“÷”,@Divinealex 直接以符号回应为何跳过该版本 [13, 28]。
- 榜单质疑:用户认为当前榜单(如 DeepSWE)存在偏差,疑似水军操控,且 4.7 排名高于 4.6 令人困惑 [24]。
经验与数据点
- Google Antigravity IDE:仅支持 Opus 4.6,侧面反映其在特定开发环境中的稳定性或兼容性优势 [11]。
- 使用策略:@LeoQ8 采用“4.8 初写 + GPT 5.5 审核”的组合拳;@Divinealex 将 GPT 用于量化分析而非编程 [17, 21]。
- 上下文限制:Opus Pro 版默认 200k,1M 需付费;免费版 Sonnet 可用但 Opus 不可用 [9]。
闲聊脉络
如题,真的Opus 4.8这么垃圾吗?我自己两个模型都试着用,感觉区别不大啊 而且在claude code 里这俩都是available的 /uploads/short-url/hs0z0wtjt4Wvff5ZVWbVsWKjLEA.png?dl=1
不过anyway Fable 5确实明显好用点,前两天爽了一周的token
真的zs
怎么体会出来的,虽然我看一些榜单上也这么写
为啥跳过4.7?
4.7,÷
4.6 1 million context 是巅峰,之后几个版本感觉都像自吹自擂,说单口相声
白色的 /u/niger ?
max版缺省使用,是橙色标签,pro版默认200k上下文,1M上下文按用量付费,免费版只能用sonnet用不了opus
Opus 4.6 1m 是我更喜欢的,主要是比 4.8 快很多
https://antigravity.google https://antigravity.google Google Antigravity - Build the new way google是这么认为的,他家ide只支持opus4.6
大家怀念的是刚出来时断崖式提升的那种惊艳感,用久了自然毛病越来越多,谁来澄清都没用
使用下来感觉4.6更像是一个听话的牛马,虽然有的时候会做错事情。4.8 有的时候会“偷懒”+过于自信,但是确实让gpt audit他写的代码的时候比4.6 bug少很多。4.7那就不说了,纯垃圾。
那问题来了,相当于gpt 5.几 水平
感觉各有长处。直接写代码可能gpt 5.5也就sonnet的水平,而且慢得不想用。但是让他审核代码他能找出很多opus发现不了的问题。
后面新模型没进步,有时候答案错的更离谱
我一般让4.8先写,找不出问题会让gpt 5.5看看。但是fable 5纯纯shit
5.5>4.6>4.8>>4.7
真的吗 我用4.7 4.8 auto mode 了一个月 换回GPT5.5 有点不太适应了… 感觉GPT 一直想改opus 的design 有点让我绷不住
gpt唯一的缺点就是不开1m context给codex 你的首要任务是赶紧切回4.6试试 感觉和具体项目也有关系 说不定你干的事情4.8真的比4.6强呢
我是感觉4.8创意比较强,但是是个÷ 4.6比较听话 GPT主要是我没订阅pro,套餐量太少了,而且我全拿去当我的量化模型 新闻分析师了 lol
完全正确。4.8和4.7让我想骂娘,呆呆的木木的,比4.6考虑的事情少了很多。
Divinealex: ÷ 这到底是啥意思,这两天看到好多了
没订阅pro也太搞了 我隔壁薅的18个账号都不够用 我现在看到任何榜单把4.7放在4.6上面就直接呵呵了 不过目前好像除了deepSWE就没了 不过那玩意儿真的很像gpt的水军
4.8之后可以试试 /effort ultra,注意token消耗
畜的谐音吧