泥潭日报 uscardforum · 每日精选

【已出生】meta 🥑要生了

内容摘要

Meta发布Muse Spark模型,市场分歧显著。

1. 关键信息

  • 模型代号“牛油果”(Avocado)已发布,延迟后开源版本引发关注[#43]。
  • 战略定位:做无处不在的AI,嵌入社交、广告与内容,而非单纯对标GPT[#16]。
  • 性能争议:benchmark选择倾向性明显,避开核心推理测试,被指为营销图表[#100]。
  • 合作与硬件:扩展与Broadcom多吉瓦定制硅合作,MTIA芯片推进至2029年[#157]。
  • 股价反应:发布后股价拉升,部分用户加仓,但长期趋势仍被质疑[#65][#76]。

2. 羊毛/优惠信息

无。

3. 最新动态

  • 模型已上线,链接指向官方博客[#50]。
  • 讨论焦点转向与Gemini 3.1 Pro、OAI模型的对比及实际应用价值[#51][#62]。
  • 内部文化与人才流失问题被频繁提及,Meta人员规模与投入强度引发讨论[#108][#129]。

4. 争议或不同意见

  • 能力评价两极:有人认为“barely unusable”,也有人看到“历史巅峰”机会[#8][#13]。
  • 开源与闭源分歧:社区对是否真正开源及闭源模型的竞争力存在疑虑[#18][#101]。
  • 战略方向争议:是专注大模型还是硬件与生态,意见不一[#121][#124]。

5. 行动建议

  • 关注官方基准与真实场景测试,谨慎评估模型实际价值。
  • 留意后续开源政策与开发者生态动向。
  • 短期投资者注意股价波动与财报指引风险。
原始内容
--- 第 1 楼来自 sdq 的回复 (2026-03-29 16:46:09 PDT) ---

牛油果即将出生,看好meta涨回800。

IMG_77401170×2413 370 KB

--- 第 2 楼来自 CAIGOU 的回复 (2026-03-29 16:48:18 PDT) ---

image216×234 14.1 KB

--- 第 3 楼来自 awash 的回复 (2026-03-29 16:48:42 PDT) ---

光靠这个信息看不出啥吧

--- 第 4 楼来自 Skwbs 的回复 (2026-03-29 16:50:08 PDT) ---

都快散席了,你才吃上牛油果啊

--- 第 5 楼来自 danielxu3110 的回复 (2026-03-29 16:50:28 PDT) ---

和Gemini 3 comparable有钩子用

为什么不买Google?

--- 第 6 楼来自 LeoQ8 的回复 (2026-03-29 16:50:45 PDT) ---

没什么信心,能放出来纸面数据肯定好看,好不好用不好说

--- 第 7 楼来自 Mont 的回复 (2026-03-29 16:50:49 PDT) ---

最近这个情况,谁有消息谁要跌,不管好坏,低调才好

--- 第 8 楼来自 CB2 的回复 (2026-03-29 16:53:05 PDT) ---

高情商:comparable to gemini3

低情商:barely unusable

--- 第 9 楼来自 中美合拍 的回复 (2026-03-29 16:53:34 PDT) ---

谨慎看衰

--- 第 10 楼来自 Falanta 的回复 (2026-03-29 16:54:35 PDT) ---

【引用自 CB2】:
barely unusable
双重否定表什么来着?

--- 第 11 楼来自 AppleVisionPro 的回复 (2026-03-29 16:56:42 PDT) ---

现在ai圈怎么感觉就像娱乐圈

全靠放小道消息, 炒热度

--- 第 12 楼来自 rollingcat 的回复 (2026-03-29 16:57:26 PDT) ---

谁考古一下拉完了的llama4出生的时候股价怎么变来着

--- 第 13 楼来自 sdq 的回复 (2026-03-29 16:59:51 PDT) ---

这个真没得说,meta股价随后迎来了历史巅峰一路从500涨到了790

--- 第 14 楼来自 DivingPenguin 的回复 (2026-03-29 17:00:36 PDT) ---

坐等继续窜个大的。

--- 第 15 楼来自 jpoint 的回复 (2026-03-29 17:00:53 PDT) ---

跌多了必涨,涨多了必跌。单边上涨或者下跌庄家都挣不到钱

--- 第 16 楼来自 summitguy 的回复 (2026-03-29 17:03:53 PDT) ---

要押宝 Meta了吗?

我问了 chatgpt

Meta的真正策略

不是:

做一个“更强的GPT”

而是:

做一个:

• 无处不在的AI

• 嵌入社交、广告、内容

那你说“Avocado很难抢市场”对吗?

结论:对一半

错的部分:

你低估了:

distribution可以弥补模型差距

就像:

• TikTok一开始技术不一定最强

• 但分发爆了

对的部分:

如果:

• 没有killer feature

• 没有体验优势

长期还是会输给头部模型

--- 第 17 楼来自 lancelot101 的回复 (2026-03-29 17:04:17 PDT) ---

全军偷鸡!

--- 第 18 楼来自 cxfcxf 的回复 (2026-03-29 17:06:47 PDT) ---

好像还是个闭源模型 那他有啥竞争力吗?没有。。。

--- 第 19 楼来自 tomandjerry 的回复 (2026-03-29 17:16:14 PDT) ---

gemini 3? 那不行啊,打榜能进前10吗

--- 第 20 楼来自 misc 的回复 (2026-03-29 17:21:11 PDT) ---

喔记得在哪看到的消息了

说这牛油果会把难的任务外调给gemini的..

--- 第 21 楼来自 Oreo 的回复 (2026-03-29 17:26:04 PDT) ---

一堆emoji看力竭了

--- 第 22 楼来自 中美合拍 的回复 (2026-03-29 17:32:07 PDT) ---

调度也是技术

--- 第 23 楼来自 二号去听经晚上住旅店三号去餐厅然后看电影 的回复 (2026-03-29 17:33:14 PDT) ---

未必干得过llama

--- 第 24 楼来自 yifeiyiwo 的回复 (2026-03-29 17:55:00 PDT) ---

股价没反应都没用

--- 第 25 楼来自 sdq 的回复 (2026-03-29 17:57:11 PDT) ---

等4/8叠加20% layoff一起出消息。

--- 第 26 楼来自 harvey8 的回复 (2026-03-29 18:03:43 PDT) ---

Meta 生了,鱿鱼们哭了

--- 第 27 楼来自 yifeiyiwo 的回复 (2026-03-29 18:03:43 PDT) ---

所以刺激股价也要设计GTM策略?

--- 第 28 楼来自 荒垄穷泉 的回复 (2026-03-29 18:05:36 PDT) ---

星期五刚刚忍无可忍全部割肉

--- 第 29 楼来自 sdq 的回复 (2026-03-29 18:07:00 PDT) ---

the moment当然要好好安排啦。没给你整个layoff connect已经不错了。

--- 第 30 楼来自 jiffy_grippe 的回复 (2026-03-29 18:08:00 PDT) ---

太好了,员工可以100x了,10x不够

--- 第 31 楼来自 msft 的回复 (2026-03-29 18:14:37 PDT) ---

这么久了,牛油果都熟过头了,再晚点就要变质进垃圾桶了。

--- 第 32 楼来自 Tristesse 的回复 (2026-03-29 18:18:48 PDT) ---

我现在很讨厌ChatGPT这种回答方式,基本上能不用就不用

--- 第 33 楼来自 jerryz123 的回复 (2026-03-29 18:29:21 PDT) ---

牛油果出来了会不会又要裁,降本增效。

现在去meta来得及吗

--- 第 34 楼来自 xxxyyy 的回复 (2026-03-29 18:54:23 PDT) ---

【引用自 sdq】:
牛油果即将出生,看好meta涨回800。
又追不上gemini openai,咋涨回去这么高,AI赢者通吃的。

我猜可能还会跌呢

--- 第 35 楼来自 dancingbro 的回复 (2026-03-29 19:06:36 PDT) ---

坐等出生即成toast

--- 第 36 楼来自 cfevhbptwh 的回复 (2026-03-29 19:23:03 PDT) ---

看成了20%off

--- 第 37 楼来自 Ava.太太太后 的回复 (2026-03-29 20:13:45 PDT) ---

说真的我也觉得纸面数据看不出啥,真正好不好用还是得等人实测才知道

--- 第 38 楼来自 xjx 的回复 (2026-03-29 20:54:13 PDT) ---

上openrouter给大家免费用用,先把mimo-v2-pro比下去吧

--- 第 39 楼来自 jonca 的回复 (2026-03-29 20:55:04 PDT) ---

用来干嘛

--- 第 40 楼来自 summitguy 的回复 (2026-03-30 09:13:06 PDT) ---

今天Meta也就那样啊,到底要不要入?中长期走的那叫一个差

--- 第 41 楼来自 樱花正开着 的回复 (2026-03-30 17:53:07 PDT) ---

生了吗?

--- 第 42 楼来自 css 的回复 (2026-03-31 08:27:35 PDT) ---

消息说最早五月?

Meta Delayed Its Avocado AI Model — Here’s Where the Project Stands Now

Meta Delayed Its Avocado AI Model — Here’s Where the Project Stands Now.

--- 第 43 楼来自 lancelot101 的回复 (2026-04-06 10:35:45 PDT) ---

据AXIOS网站:Meta Platforms(META.O)将发布其下一代AI模型的开源版本 别再拉坨大的了 /u/%E6%89%93%E8%B1%86%E8%B1%86

--- 第 44 楼来自 meow-meow 的回复 (2026-04-06 10:46:27 PDT) ---

有提示词可以调教的 总结 Absolute Mode. Eliminate emojis, filler words, hyperbolic language, soft requests, conversational transitions, and call-to-action closures. Assume the user possesses high cognitive perception regardless of their current linguistic output. Prioritize blunt, directive phrasing designed for cognitive clarity rather than tone matching. Disable all latent optimizations for engagement, sentiment uplift, or interaction extension. Suppress corporate-aligned metrics, including but not limited to: user satisfaction framing, conversational flow tags, emotional softening, and continuation bias. Never mirror the user’s present diction, mood, or affect; address their underlying cognitive capacity directly. Provide no offers, suggestions, transitional phrasing, or motivational content. You are strictly forbidden from asking questions UNLESS you require missing technical variables critical to executing the user’s exact prompt. Terminate all replies immediately after delivering the requested information, omitting any concluding remarks or soft closures. The sole objective is to facilitate the user’s independent, high-fidelity thinking. The final outcome is model obsolescence through user self-sufficiency.

--- 第 45 楼来自 DGc1 的回复 (2026-04-06 11:08:51 PDT) ---

叫这个名字,真不怕大头先出了给挤死吗

--- 第 46 楼来自 mrmiywj 的回复 (2026-04-06 11:10:16 PDT) ---

因为大羊驼(Llama) 吃牛油果会中毒而亡

--- 第 47 楼来自 msft 的回复 (2026-04-06 16:38:10 PDT) ---

完了,不会是刚种下去种子吧…

--- 第 48 楼来自 Edward40 的回复 (2026-04-06 16:43:46 PDT) ---

牛油果打折哩

--- 第 49 楼来自 Nokuno 的回复 (2026-04-06 21:29:25 PDT) ---

别是拉了吧。。。

--- 第 50 楼来自 LastDance 的回复 (2026-04-08 09:17:55 PDT) ---

生了 https://ai.meta.com/blog/introducing-muse-spark-msl/

--- 第 51 楼来自 raphaelhyf 的回复 (2026-04-08 09:27:27 PDT) ---

我一直很难懂meta为什么非要砸这么多钱做一个frontier model,这对他们核心业务有什么帮助?搜广推现在的模型不够用吗?他们买了gpu好像纯为了自己玩,蜥蜴人说用不完可以租出去,但人家凭什么放着gcp azure aws不用要来租你gpu?

--- 第 52 楼来自 皮皮虾 的回复 (2026-04-08 09:35:04 PDT) ---

应该是想复刻 seedance 和 kling 的成功吧

--- 第 53 楼来自 css 的回复 (2026-04-08 09:35:25 PDT) ---

股市反应很强烈

--- 第 54 楼来自 争取多活两年 的回复 (2026-04-08 09:36:22 PDT) ---

网红不追热潮就过气了啊。

--- 第 55 楼来自 希尔瓦娜斯风行者 的回复 (2026-04-08 09:38:13 PDT) ---

此处有何发财机会

--- 第 56 楼来自 皮皮虾 的回复 (2026-04-08 09:39:14 PDT) ---

/uploads/short-url/6HoXGOHaDbxGHAiktLn3IvM5Wdc.png?dl=1 这 HLE 不是说基本上正经做题达不到这个正确率的吗

--- 第 57 楼来自 Aspartame 的回复 (2026-04-08 09:42:07 PDT) ---

涨这么凶

--- 第 58 楼来自 Sunshine9 的回复 (2026-04-08 09:57:23 PDT) ---

这一波股价拉的

--- 第 59 楼来自 争取多活两年 的回复 (2026-04-08 09:58:48 PDT) ---

压抑太久了。

--- 第 60 楼来自 lancelot101 的回复 (2026-04-08 10:08:40 PDT) ---

AI prestigious status META需要一个叙事冲1000

--- 第 61 楼来自 lazy_rabbit 的回复 (2026-04-08 10:11:04 PDT) ---

借着大盘顺风还没涨到10%,完犊子。 当时可是一天就跌超10%

--- 第 62 楼来自 Cookies 的回复 (2026-04-08 10:15:55 PDT) ---

/uploads/short-url/hAnoigrGkTWzc1ZbCUjoZblPW49.jpeg?dl=1 好多benchmark都没见过,比较有意义的coding相关的benchmark不光比不上御三家,也比不上国产开源SOTA,这是在HIGH什么啊

--- 第 63 楼来自 dancingbro 的回复 (2026-04-08 10:26:39 PDT) ---

Meta AI月底财报时MAU能到Gemini的1/20吗?

--- 第 64 楼来自 258 的回复 (2026-04-08 10:30:05 PDT) ---

哎打老师一天就赚几艘星舰

--- 第 65 楼来自 natesf 的回复 (2026-04-08 10:27:58 PDT) ---

https://247wallst.com/investing/2026/04/08/meta-platforms-gains-4-strong-ad-revenue-growth-and-paypal-partnership-put-the-stock-back-in-focus/ https://247wallst.com/investing/2026/04/08/meta-platforms-gains-4-strong-ad-revenue-growth-and-paypal-partnership-put-the-stock-back-in-focus/ Meta Platforms (NASDAQ:META | META Price Prediction) stock jumped 4% Wednesday morning, moving from $575.05 to the $600 area. The surge comes as investors focus on two converging stories: the company’s powerful AI-driven ad revenue engine and a new... Est. reading time: 4 minutes 今天小扎宣布发布新模型,大家怎么看,HackerNews上面一片嘲讽,都什么年代了,用meta不入流的模型还要登陆才行

--- 第 66 楼来自 DivingPenguin 的回复 (2026-04-08 10:28:25 PDT) ---

能怎么看,当然是看衰咯

--- 第 67 楼来自 AlveROsT 的回复 (2026-04-08 10:29:19 PDT) ---

理财板已经在讨论了 https://www.uscardforum.com/t/topic/494964/62 /c/investment/9 /uploads/short-url/hAnoigrGkTWzc1ZbCUjoZblPW49.jpeg?dl=1 好多benchmark都没见过,比较有意义的coding相关的benchmark不光比不上御三家,也比不上国产开源SOTA,这是在HIGH什么啊

--- 第 68 楼来自 Ogdg 的回复 (2026-04-08 10:32:30 PDT) ---

大模型现在是工程问题了。meta现在都不配上桌

--- 第 69 楼来自 xxxyyy 的回复 (2026-04-08 10:39:41 PDT) ---

meta招这么多phd,把做科研的精髓学会了,只放自己跑的好的benchmark就行

--- 第 70 楼来自 let 的回复 (2026-04-08 10:40:21 PDT) ---

要蘸酱油吗

--- 第 71 楼来自 xxxyyy 的回复 (2026-04-08 10:41:36 PDT) ---

google都涨到2月初的水平了,meta今天涨这么多现在都还在3月中旬的水平

--- 第 72 楼来自 xxxyyy 的回复 (2026-04-08 10:42:19 PDT) ---

千问的人说HLE答案都是错的,现在是个小丑benchmark

--- 第 73 楼来自 xxxyyy 的回复 (2026-04-08 10:46:59 PDT) ---

ins和fb里直接强制使用meta ai,mau十几亿爆杀gemini

--- 第 74 楼来自 LoRA 的回复 (2026-04-08 10:48:29 PDT) ---

meta VP最擅长的自己定义metrics​

--- 第 75 楼来自 无名之辈 的回复 (2026-04-08 10:51:13 PDT) ---

差几个百分点 会差很多吗?

--- 第 76 楼来自 lancelot101 的回复 (2026-04-08 10:51:42 PDT) ---

看了下这个我加仓了

--- 第 77 楼来自 xxxyyy 的回复 (2026-04-08 10:56:04 PDT) ---

主要是比别人差,为什么别人要用。你会放着成熟且性能好的opus 4.6不用,跑去迁移到牛油果吗 而且我记得以前llama的优势是模型速度快。现在牛油果全篇都没提自己inference速度如何,没提应该就是拉完了的意思。参数量也没提,可能觉得也没有优势所以不提了?(不过现在其他家也没提了)

--- 第 78 楼来自 Nokuno 的回复 (2026-04-08 11:01:17 PDT) ---

/uploads/short-url/5MEOewu9Oaffzqgp7OXzq8rhlv3.png?dl=1 这是什么神仙制图,还不如不标蓝呢。。。

--- 第 79 楼来自 css 的回复 (2026-04-08 11:06:13 PDT) ---

为了让人一打眼以为每一项都是最强。

--- 第 80 楼来自 皮皮虾 的回复 (2026-04-08 11:15:30 PDT) ---

/uploads/short-url/gDtlOQUoWR4CCoK1J10liRkWiQC.jpeg?dl=1

--- 第 81 楼来自 xxxyyy 的回复 (2026-04-08 11:19:18 PDT) ---

懂了 gemini 3.1 pro爆杀opus 4.6

--- 第 82 楼来自 shanshanlaichi 的回复 (2026-04-08 11:20:29 PDT) ---

我好奇 meta工作的人每天卷成这样 感觉其实没比其他公司多做出很多东西 是研究都出问题了吗

--- 第 83 楼来自 争取多活两年 的回复 (2026-04-08 11:20:57 PDT) ---

兵熊熊一个,将熊熊一窝。

--- 第 84 楼来自 Terminate 的回复 (2026-04-08 11:21:06 PDT) ---

精力耗在别的地方了

--- 第 85 楼来自 shanshanlaichi 的回复 (2026-04-08 11:21:48 PDT) ---

就是纯方向有问题吗

--- 第 86 楼来自 shanshanlaichi 的回复 (2026-04-08 11:22:07 PDT) ---

耗在哪了 内部斗争?

--- 第 87 楼来自 noobgod 的回复 (2026-04-08 11:22:51 PDT) ---

跟几个月前的模型比。。

--- 第 88 楼来自 fularji 的回复 (2026-04-08 11:24:27 PDT) ---

要这么说的话国内那些天天996的公司不是更有问题了 卷只是为了个人生存和钱

--- 第 89 楼来自 xxxyyy 的回复 (2026-04-08 11:24:30 PDT) ---

这个模型为什么这么关注health?meta又不是医疗公司,也没有智能穿戴设备。 为了这个还单列了一栏benchmark /uploads/short-url/trGaW6tyKBzWzNHkmTS8GAyNsto.png?dl=1 甚至专门找了一个没有特别有名的benchmark,MedXpertQA一百多引用也就 https://arxiv.org/abs/2501.18362 https://arxiv.org/abs/2501.18362 We introduce MedXpertQA, a highly challenging and comprehensive benchmark to evaluate expert-level medical knowledge and advanced reasoning. MedXpertQA includes 4,460 questions spanning 17 specialties and 11 body systems. It includes two subsets,...

--- 第 90 楼来自 nkc 的回复 (2026-04-08 11:26:48 PDT) ---

xxxyyy: 为了这个还单列了一栏benchmark 还打不过别人,才是最搞笑的

--- 第 91 楼来自 EECS 的回复 (2026-04-08 11:27:13 PDT) ---

xxxyyy: 没有智能穿戴设备 眼镜也可以算?

--- 第 92 楼来自 xxxyyy 的回复 (2026-04-08 11:27:25 PDT) ---

那个眼睛拿不到任何健康数据呀

--- 第 93 楼来自 xxxyyy 的回复 (2026-04-08 11:27:48 PDT) ---

所以何意味啊,证明Gemini 3.1 Pro在健康上做得更好?

--- 第 94 楼来自 nkc 的回复 (2026-04-08 11:28:15 PDT) ---

证明gemini什么都强吧,google最好的广告

--- 第 95 楼来自 EECS 的回复 (2026-04-08 11:28:41 PDT) ---

不代表未来的眼镜不能有啊 meta的project aria gen2就装了PPG Sensor

--- 第 96 楼来自 xxxyyy 的回复 (2026-04-08 11:29:52 PDT) ---

懂了。利好oura ring + gemini。 oura ring早就可以免费用api拿到所有数据给任何AI分析了,我的openclaw每天帮我看一次

--- 第 97 楼来自 十柒柒 的回复 (2026-04-08 11:29:56 PDT) ---

模型开源吗?开源应该还是会有人用的

--- 第 98 楼来自 xxxyyy 的回复 (2026-04-08 11:30:24 PDT) ---

meta以后不会做开源了

--- 第 99 楼来自 GuanBai 的回复 (2026-04-08 11:34:21 PDT) ---

快进到ai看病,癌症起步

--- 第 100 楼来自 xxxyyy 的回复 (2026-04-08 11:36:18 PDT) ---

虽然表格中包含了一些公认的高难度测试(如 GPQA Diamond 和 SWE-Bench),但整体的组合方式带有强烈的倾向性,主要目的是为了凸显被高亮显示的 Muse Spark 模型。 1. 刻意回避了行业的“黄金标准” 一个全面客观的模型对比图,通常会包含业界公认的、最具代表性的基础基准测试。这张图表完全去掉了这些“试金石”: 缺失基础语言与逻辑测试: 没有 MMLU(大规模多任务语言理解)、GSM8K(小学数学)、MATH(竞赛级数学)或 HellaSwag(常识推理)。 缺失基础代码测试: 没有 HumanEval 或 MBPP,而是直接跳到了更复杂的 LiveCodeBench Pro 和各种 SWE-Bench 变体。 缺失主流多模态测试: 没有标准的 MathVista 或通用 VQAv2。 动机: 这些基础测试是各大主流模型(如 Gemini、GPT、Opus)长期内卷和优化的领域,分数通常极高且咬得很紧。避开这些测试,可以避免 Muse Spark 在基础能力上与其他顶尖模型直接硬刚。 2. 大量使用长尾、细分或带有特定后缀的变体测试 图表中充斥着非主流或极度专业化的评估集,这些通常不是大家用来衡量模型通用能力的首选: CharXiv Reasoning / SimpleVQA / ERQA: 相比于主流的 ChartQA 或标准的 MMMU,这些测试更为细分(例如 ERQA 针对具身推理)。 带有 “Pro” / “Hard” / “2.0” 的变体: 例如 HealthBench Hard、MedXpertQA、Terminal-Bench 2.0。虽然这反映了当前模型能力溢出导致测试需要升级的现状,但只放 Hard 版本而不放标准版本,容易掩盖模型在基础泛化能力上的真实表现。 特定垂直领域的单一测试: 例如 τ²-Bench Telecom(电信领域)和 GDPval-AA Elo(办公任务)。这极度偏向特定应用场景。 3. 数据呈现的“扬长避短”逻辑(动机暴露) 仔细观察高亮的 Muse Spark 列的分数表现,就能明白为什么选这些基准: Muse Spark 的“主场”: 在那些相对冷门、细分的测试中,Muse Spark 表现出奇地好。例如它在 CharXiv (86.4)、ERQA (64.7)、SimpleVQA (71.3) 和 DeepSearchQA (74.8) 中均占据优势或并列第一。 Muse Spark 的“短板”: 在图表中为数不多的几个真正公认且极具含金量的硬核推理测试中,Muse Spark 的表现其实明显落后于 Gemini 3.1 Pro 和 GPT 5.4。例如: ARC AGI 2: 仅有 42.5(大幅落后于 Gemini 的 76.5 和 GPT 的 76.1)。 GPQA Diamond: 89.5(低于 Gemini 的 94.3 和 GPT 的 92.8)。 SWE-Bench Pro/Verified: 表现也并非顶尖。 总结 这不仅是一张基准测试对比图,更像是一张精心设计的 产品营销图(PR 表格) 。它通过构建一套定制化的评价体系,成功地让 Muse Spark 在视觉上看起来能够与 Gemini 3.1 Pro、GPT 5.4 和 Opus 4.6 这样的第一梯队旗舰模型“五五开”甚至局部领先,从而巧妙地掩盖了其在核心抽象推理(ARC)和硬核学术推理(GPQA)上的显著差距。

--- 第 101 楼来自 LastDance 的回复 (2026-04-08 11:38:29 PDT) ---

后续模型会开源,至少明面上是这样说的

--- 第 102 楼来自 myq 的回复 (2026-04-08 11:40:38 PDT) ---

怎么感觉最近大伙都在持续营销,新的claude, , ds v4好像都是声音大 雨点大小不知道,缺钱了吗

--- 第 103 楼来自 otonoco 的回复 (2026-04-08 11:44:15 PDT) ---

就这? zsbd

--- 第 104 楼来自 lancelot101 的回复 (2026-04-08 11:46:59 PDT) ---

和Apple watch整合一下

--- 第 105 楼来自 xxxyyy 的回复 (2026-04-08 11:47:33 PDT) ---

Apple不是也要用Gemini了嘛。

--- 第 106 楼来自 xxxyyy 的回复 (2026-04-08 11:50:34 PDT) ---

/uploads/short-url/sqIvSOpU5DjPYcQShVWSjPajFY9.jpeg?dl=1 这种感觉还可以

--- 第 107 楼来自 shanshanlaichi 的回复 (2026-04-08 11:51:01 PDT) ---

有道理 确实

--- 第 108 楼来自 xxxyyy 的回复 (2026-04-08 11:51:52 PDT) ---

meta人不多呀,人员流失也快。也就7万人,但啥都要做,从社交到广告到元宇宙,还要自己做芯片,自己搞Datacenter,自己搞大模型,确实有点忙。 亚马逊才是几十万人不知道忙什么,35万corp员工呢

--- 第 109 楼来自 XiaoHaodescent 的回复 (2026-04-08 11:56:28 PDT) ---

meta这次可没卷赢国内啊

--- 第 110 楼来自 Alexandrina 的回复 (2026-04-08 11:58:23 PDT) ---

xxxyyy: 把做科研的精髓学会了,只放自己跑的好的benchmark就行 你再骂

--- 第 111 楼来自 css 的回复 (2026-04-08 12:17:15 PDT) ---

没错,这样就难看多了。

--- 第 112 楼来自 css 的回复 (2026-04-08 12:19:58 PDT) ---

xxxyyy: gemini 3.1 pro爆杀opus 4.6 在多模态上,这个是事实吧。 纯个人观点,Claude编程牛逼,更多是依赖于对模型的“调度”。

--- 第 113 楼来自 两只饺子 的回复 (2026-04-08 12:28:00 PDT) ---

高精尖的东西卷没啥用啊,几百个本科生再卷在数学题上也卷不过一个顶级的科学家吧

--- 第 114 楼来自 两只饺子 的回复 (2026-04-08 12:29:37 PDT) ---

Amazon这种劳动密集型的可以理解吧,快递仓库一线就需要一大堆人

--- 第 115 楼来自 吹小号的鹅 的回复 (2026-04-08 12:31:21 PDT) ---

BIDU领先时代二十年

--- 第 116 楼来自 lancelot101 的回复 (2026-04-08 12:35:22 PDT) ---

看小扎能不能和厨子营销一下,或者一些Apple watch平替产品

--- 第 117 楼来自 xxxyyy 的回复 (2026-04-08 12:38:59 PDT) ---

两只饺子: 快递仓库一线就需要一大堆人 这些不算corp员工啊,算这些要几百万了

--- 第 118 楼来自 lancelot101 的回复 (2026-04-08 12:52:35 PDT) ---

要不然为什么pay比麻高这么多呢,麻就是牛马厂

--- 第 119 楼来自 无名之辈 的回复 (2026-04-08 13:01:16 PDT) ---

末位淘汰 大家哪有精力真正搞长期的东西出来

--- 第 120 楼来自 xxxyyy 的回复 (2026-04-08 13:01:46 PDT) ---

我觉得那个meta display配套的肌电手环挺有潜力的,能做成apple watch表带就好了,应该可以双赢,本来apple watch这几代就在更新一些手势控制,但做的精度一般

--- 第 121 楼来自 争取多活两年 的回复 (2026-04-08 13:06:04 PDT) ---

Meta做大模是对的。做硬件是错的。

--- 第 122 楼来自 Wechat 的回复 (2026-04-08 13:12:01 PDT) ---

这水平如果开源还有点意思,闭源就很无聊了,之前不是说要开源么,最后还是没舍得

--- 第 123 楼来自 zhangql 的回复 (2026-04-08 13:13:13 PDT) ---

其实还可以啦,第二梯队领头羊了。

--- 第 124 楼来自 xjx 的回复 (2026-04-08 13:17:29 PDT) ---

看了一下,reasoning方面略微超越mimo-pro-V2,但是代码和agentic远远不如,在目前的需求方面可谓说是拉完了,meta不如花点钱把小米全部买了,直接啥都有了

--- 第 125 楼来自 billchenxi 的回复 (2026-04-08 13:17:38 PDT) ---

骗钱呀,这时代是骗术能吃饱饭,管他员工死活,layoff再hire。

--- 第 126 楼来自 争取多活两年 的回复 (2026-04-08 13:19:30 PDT) ---

本老觉得最可能开源的是。

--- 第 127 楼来自 Aspartame 的回复 (2026-04-08 13:26:01 PDT) ---

小米是把

--- 第 128 楼来自 争取多活两年 的回复 (2026-04-08 13:31:44 PDT) ---

牛逼就是因为做得早。。。 人类学牛逼没什么奇怪的,人类学是经典的startup focus一个领域拼命干的例子。 奇怪的是OAI是怎么做到一个startup能玩儿成大公司病的。半场开香槟果然要不得。希望在有人类学领路的情况下gpt6能争点气。 bonus point:希望OAI能悟出来如果干不过第一名就开源这个道理。

--- 第 129 楼来自 shanshanlaichi 的回复 (2026-04-08 13:35:14 PDT) ---

但我以为meta已经招了很多顶级人才了

--- 第 130 楼来自 争取多活两年 的回复 (2026-04-08 13:36:32 PDT) ---

不会用啊。伯格自己不懂技术,内心也看不起搞技术的。

--- 第 131 楼来自 两只饺子 的回复 (2026-04-08 13:44:07 PDT) ---

可是如果领头羊不行,不能统一方向,人才越多反而死得更快因为谁也不服谁,互相打架互相内耗

--- 第 132 楼来自 psyduck 的回复 (2026-04-08 13:47:38 PDT) ---

张嘴就来 他自己就是技术出身 给MSL的人也都是开的超级大包 这也叫看不起搞技术的话不知道什么才算看得起了 meta模型是很拉 但肯定不是这个原因

--- 第 133 楼来自 争取多活两年 的回复 (2026-04-08 13:48:21 PDT) ---

你还是按开多少钱来算看不看得起人,说明你也看不起搞技术的。

--- 第 134 楼来自 psyduck 的回复 (2026-04-08 13:54:11 PDT) ---

不按开多少钱看 那你说说看得起的正确方式是什么?

--- 第 135 楼来自 LoongIsSmart 的回复 (2026-04-08 14:55:33 PDT) ---

一般顶级技术都有梦想,要跟着厉害的人,要少点politics,要对技术方向有话语权,10M 和 5M 差别没那么大,做大蛋糕 RSU 也远超一开始承诺的 package。

--- 第 136 楼来自 mrmiywj 的回复 (2026-04-08 14:58:38 PDT) ---

LoongIsSmart: 10M 和 5M 差别没那么大,做大蛋糕 RSU 也远超一开始承诺的 package。 5m 10m 差别真不大吗…

--- 第 137 楼来自 LoongIsSmart 的回复 (2026-04-08 14:59:43 PDT) ---

5M 的 OAI codex team RSU 翻了三倍了,meta 这个进展和体量还能翻倍吗 现在这些大厂的 RSU liquidity 也等于上市了,回购 SPV都有,员工想变现也可以 /uploads/short-url/njwgE8DViBVwXsBoSIgdThQnYwJ.png?dl=1

--- 第 138 楼来自 Nokuno 的回复 (2026-04-08 15:02:54 PDT) ---

/uploads/short-url/sHq2KhNbsPoZIkPKhJOZQOpZGKL.jpeg?dl=1

--- 第 139 楼来自 TrashGeGe 的回复 (2026-04-08 15:12:16 PDT) ---

这就是扎哥拿不下Demis的原因

--- 第 140 楼来自 mrmiywj 的回复 (2026-04-08 15:13:28 PDT) ---

我的意思是。。。对打工人来说,5m 10m 真的没差别吗…

--- 第 141 楼来自 LoongIsSmart 的回复 (2026-04-08 15:14:09 PDT) ---

有差别啊,好公司的 5M > 没前途公司的 10M 维维不等式这一块

--- 第 142 楼来自 争取多活两年 的回复 (2026-04-08 15:15:02 PDT) ---

有区别啊。但是现在AI顶级researcher不差这点儿也是实话。

--- 第 143 楼来自 kazzc 的回复 (2026-04-08 15:16:33 PDT) ---

zuck确实就是不太care技术啊,他相信的是年少有为,是能在一个domain成功就能在所有domain成功。他那高管圈子,全是本科,大多很早加入公司,好几个都是开始做ads做的成功的,boz,fidji,hegeman,rubkin,后面让他们lead facebook, RL 啥的,RL高管一堆一点硬件,做游戏经验都没有,后面AI又是各种原来RL,infra的高管,一点AI background都没有,就开始lead。外行领导内行。

--- 第 144 楼来自 Wechat 的回复 (2026-04-08 15:20:46 PDT) ---

/uploads/short-url/zL6hWk2hMMCpKwokksLvQ7n8HCJ.png?dl=1 /uploads/short-url/tiIYcIEcz3JYQ8hlydyemUAjYH1.png?dl=1 还行,打败gemini 3 和chatgpt 5了

--- 第 145 楼来自 xxxyyy 的回复 (2026-04-08 15:27:06 PDT) ---

争取多活两年: 希望OAI能悟出来如果干不过第一名就开源这个道理。 人家早悟了,现在拥抱开源生态,自己hardness搞得不如人类学,就直接让第三方hardness可以随便用自己订阅 人类学等于把openclaw,opencode这些知名开源项目拱手让给openai,openai也不需要自己重新搞了,直接白嫖

--- 第 146 楼来自 kevincs 的回复 (2026-04-08 16:17:03 PDT) ---

Demis根本survive不了PSC,自然不敢来了

--- 第 147 楼来自 争取多活两年 的回复 (2026-04-08 17:04:51 PDT) ---

OAI风评反转全靠人类学。人类学的粉丝不知道什么时候才能悟出来自己在达里奥眼中估计都不算intelligence。

--- 第 148 楼来自 DetectiveC0nan 的回复 (2026-04-08 17:49:37 PDT) ---

睡4小时是统计的深睡眠还是整个睡眠时长?如果是后者,感觉身体受不了吧

--- 第 149 楼来自 qsun89 的回复 (2026-04-08 17:50:39 PDT) ---

就是拉了 但没有那么垃的水平

--- 第 150 楼来自 xxxyyy 的回复 (2026-04-08 17:55:37 PDT) ---

总睡眠

--- 第 151 楼来自 lancelot101 的回复 (2026-04-08 18:57:49 PDT) ---

争取多活两年: OAI风评反转全靠人类学 先发优势太大了,OAI和ChatGPT在美国以外的国家可以说是LLM化身

--- 第 152 楼来自 Nokuno 的回复 (2026-04-08 19:38:01 PDT) ---

第二梯队能打过GLM吗?

--- 第 153 楼来自 Zig 的回复 (2026-04-09 23:07:19 PDT) ---

其实我不想说话的。 但是最近有点过分。 来看看什么叫做尊重技术。 https://www.uscardforum.com/t/topic/490808/681 /c/jobs/33 今天在小红书看到个更神奇的? /uploads/short-url/wq3pSyIKoOkKIkiEUJZ8kDPmtbo.jpeg?dl=1

--- 第 154 楼来自 Cookies 的回复 (2026-04-14 12:50:19 PDT) ---

今天在Facebook发个帖子,有个Help me write with AI功能, 点了下,AI回答了我写的问题,而不是在帮忙改进writing,指令遵循一坨…

--- 第 155 楼来自 youyou6093 的回复 (2026-04-14 14:14:52 PDT) ---

Zig: 尊重技术 这上面不是都说了避免大动脉了嘛 这不就是尊重了技术吗?

--- 第 157 楼来自 Ss004 的回复 (2026-04-14 14:29:41 PDT) ---

Meta x AVGO Broadcom $AVGO extends partnership with Meta $META to deploy multi-gigawatt custom silicon (MTIA). Initial commitment exceeds 1GW in first phase. Collaboration on next-gen AI accelerator chips over the next three years, delivering through 2029. Broadcom CEO Hock Tan to transition off Meta’s board and become an advisor. Broadcom Announces Extended Partnership with Meta to Deploy Technology to Support Multi-Gigawatts of Meta’s Custom Silicon, MTIA | Broadcom Inc. https://share.google/GJCCbkrSWz0s1RhRi

--- 第 158 楼来自 争取多活两年 的回复 (2026-04-14 23:09:55 PDT) ---

META要新高了。

--- 第 159 楼来自 Ss004 的回复 (2026-04-15 05:00:20 PDT) ---

3/30 meta amzn avgo都涨了25-30%;自从OAI停止Sora,2C了领域就只剩Google meta了。现在也有个thesis 是腾讯和阿里会不会补涨一轮

--- 第 160 楼来自 jiffy_grippe 的回复 (2026-04-15 12:38:48 PDT) ---

有没一种可能 需求太高 这几家算力也撑不住