泥潭日报 uscardforum · 每日精选

GPT 6 arriving?

内容摘要

用户误将GPT-6帖子当作GTA6发布,引发集体失望。

1. 关键信息

帖子ID 496936 讨论GPT-6发布预期;用户普遍误读为GTA6(#3, #14, #25, #26);模型性能质疑,benchmark水分与overfitting争议(#8, #23);AGI进展与LLM堆料争议(#18, #19);自动驾驶话题延伸(#20)。

2. 羊毛/优惠信息

3. 最新动态

4. 争议或不同意见

性能虚标:#2 指出发布时跑分必胜、实战常输;#8 质疑40% benchmark评测方式;#23 认为o1后进步边际递减,5.4不如o3。

5. 行动建议

原始内容
--- 第 1 楼来自 derek3 的回复 (2026-04-05 21:02:32 PDT) ---

AGI 又要来了 /uploads/short-url/a9DrR5hxYvtLngiVn2ng5Zf9Yor.png?dl=1

--- 第 2 楼来自 klaxien 的回复 (2026-04-05 21:05:09 PDT) ---

等出来再说吧,5.4都什么玩意,纸面数据现在都会吹了。现在这些大模型,推出的时候跑分没输过,实战没赢过的多了去了。 搞不好不如gta 6 arriving对人类社会影响力大。

--- 第 3 楼来自 非交换几何 的回复 (2026-04-05 21:06:23 PDT) ---

看标题以为gta6,白开心了

--- 第 4 楼来自 CubeOvO 的回复 (2026-04-05 21:07:22 PDT) ---

outperform gpt 5.4 is not a high bar

--- 第 5 楼来自 争取多活两年 的回复 (2026-04-05 21:08:57 PDT) ---

好消息。支持OAI干死人类学。 现在就看最伟大公司的了。

--- 第 6 楼来自 Justinian 的回复 (2026-04-05 21:10:47 PDT) ---

好像不允许拉群 但是我真的好想和谭友一起抢银行

--- 第 7 楼来自 258 的回复 (2026-04-05 21:19:10 PDT) ---

我开暴君II

--- 第 8 楼来自 Zig 的回复 (2026-04-05 21:24:53 PDT) ---

我一直不知道这个40%的 benchmark 是怎么 measure 的。 当年 model 成天说 overfitting 的问题,这年头不知道为什么没人提了。

--- 第 9 楼来自 venusgun 的回复 (2026-04-05 21:32:01 PDT) ---

走上马大炮的老路了,FSD都吹了多少年了

--- 第 10 楼来自 ttshutian 的回复 (2026-04-05 21:49:16 PDT) ---

我也….

--- 第 11 楼来自 dancingbro 的回复 (2026-04-05 21:58:26 PDT) ---

2026年被渗透成筛子可太不吉利了,搞不好过两天要被斩首换CEO。

--- 第 12 楼来自 ByteSlack 的回复 (2026-04-05 22:00:31 PDT) ---

/uploads/short-url/2V11NIivJmxQQUQ54TKh0L7CKdy.png?dl=1 经典重温一下

--- 第 13 楼来自 otonoco 的回复 (2026-04-05 22:20:53 PDT) ---

“花了那么多钱就搞出来这个垃圾?” 也算一种惊吓吧

--- 第 14 楼来自 lil203 的回复 (2026-04-06 11:57:26 PDT) ---

我怎么看成了gta6

--- 第 15 楼来自 jdaon 的回复 (2026-04-06 12:01:42 PDT) ---

什么时候ds v4出

--- 第 16 楼来自 H2TG 的回复 (2026-04-06 12:02:36 PDT) ---

大版本号通胀的这股风潮是从什么时候开始的

--- 第 17 楼来自 pandaq 的回复 (2026-04-06 12:03:31 PDT) ---

很想玩这类游戏 但是赛车操作有点难 任务总是完成不了

--- 第 18 楼来自 长安乱 的回复 (2026-04-06 12:06:12 PDT) ---

LLM继续堆料能搞出AGI这套理论似乎争议很大啊

--- 第 19 楼来自 咸鱼orz 的回复 (2026-04-06 12:20:18 PDT) ---

就像自动驾驶等级:L3-L3.5-L3.9-L3.9999999……-almost L4

--- 第 20 楼来自 derek3 的回复 (2026-04-06 12:21:10 PDT) ---

话说自动驾驶到底咋样了。之前坐飞机有老头跟我讲他自己现在全部自动驾驶

--- 第 21 楼来自 咸鱼orz 的回复 (2026-04-06 12:22:31 PDT) ---

啥时候撞了公司能担责再说吧

--- 第 22 楼来自 catnipball 的回复 (2026-04-06 12:23:59 PDT) ---

GTA5每个任务失败三次都能跳过

--- 第 23 楼来自 rongday 的回复 (2026-04-06 12:24:22 PDT) ---

感觉llm进步确实变慢了 o1之后感觉都很marginal 5.4感觉还不如o3

--- 第 24 楼来自 otonoco 的回复 (2026-04-06 12:24:39 PDT) ---

拼多多申请出战

--- 第 25 楼来自 lavAzza 的回复 (2026-04-06 16:34:53 PDT) ---

看成gta6才點開的

--- 第 26 楼来自 Edward40 的回复 (2026-04-06 16:44:22 PDT) ---

骗咱,咱还以为是GTA6

--- 第 27 楼来自 Car 的回复 (2026-04-06 16:54:17 PDT) ---

和他马自己的GPT5.4比有什么意义吗,为什么不和Opus比比?是不想吗?