泥潭日报 uscardforum · 每日精选

没人聊聊 Anthropic 最新的模型 Mythos 吗?

内容摘要

Anthropic新模型Mythos因过于强大引发热议,被指炒作与降智旧模型。

1. 关键信息

  • Mythos是Anthropic最新模型,API价格25/125(Opus为5/25),是Opus的5倍(#1, #17)。
  • 据称能发现并利用软件漏洞,已与Amazon、Apple、Google、Microsoft、CrowdStrike等合作Project Glasswing修补漏洞(#61, #86)。
  • 在SWE Bench Pro上准确率从~50%提升至70%+(#24),但部分benchmark不如ChatGPT(#119)。
  • 有报道称Mythos攻破FreeBSD获取root权限(#86),但也被质疑是营销(#44, #108)。
  • 用户反映Opus 4.6被降智(#79-#82),引发不满。

2. 羊毛/优惠信息

3. 最新动态

  • 模型已向部分企业客户开放,普通用户无法使用(#46, #102)。
  • 美国财长Bessent和美联储主席Powell警告银行关于Mythos的风险(#99)。
  • 有报道称Mythos被未授权用户访问(#120)。
  • 中国公司未参与合作,引发安全担忧(#92)。

4. 争议或不同意见

  • 多数用户认为是炒作,类似OpenAI GPT-2“太危险不发布”的套路(#5, #22, #56, #96)。
  • 质疑SWE Bench已饱和,模型提分方式可疑(#13, #27)。
  • CEO Dario被批“attention whore”“装逼”(#2, #28, #39)。
  • 用户愤怒于Opus降智,认为Anthropic“反人类”(#82, #93)。
  • 有测试显示小开源模型也能找到同样漏洞(#108)。

5. 行动建议

  • 关注Mythos在网络安全领域的实际应用,但警惕过度炒作。
  • 对Anthropic的“强大到不敢发布”叙事保持怀疑,等待第三方独立评测。
  • 若持有SK Telecom股票(曾投资Anthropic),注意稀释风险(#64, #75)。
  • 普通用户可继续使用现有模型,等待Mythos公开后评估性价比。
原始内容
--- 第 1 楼来自 hongl 的回复 (2026-04-07 23:35:19 PDT) ---

据说 强大到都不敢发不了 预设的价格还是 Opus 的 5倍

--- 第 2 楼来自 不知道是谁 的回复 (2026-04-07 23:37:26 PDT) ---

ceo爱装逼的特质体现在每一处细节

--- 第 3 楼来自 折木奉太郎 的回复 (2026-04-07 23:37:56 PDT) ---

hongl: 强大到都不敢发不了 对于人类学来说,这是一个悖论: 如果强大到不敢发布 → 有社会责任感 → 雪藏/销毁 如果发布 → 有社会责任感 → 没有多强

--- 第 4 楼来自 不知道是谁 的回复 (2026-04-07 23:38:09 PDT) ---

这跟橘子“赢太多了收不了了”不是一个套路么“模型太强了发不了”

--- 第 5 楼来自 harvey8 的回复 (2026-04-07 23:38:28 PDT) ---

Mythos到底是新模型,还是类似 Gemini Deep Think 这种靠超高推理成本堆出来的东西,现在看不太出来。说强到不敢发有点离谱。Opus确实强,但也没强到断层领先,感觉更像是宣发策略的一部分

--- 第 6 楼来自 tomandjerry 的回复 (2026-04-07 23:47:38 PDT) ---

如果一个模型很强,并且ready了,应该会立刻发布抢占市场吧

--- 第 7 楼来自 chioce 的回复 (2026-04-07 23:49:34 PDT) ---

估计是没有算力来大规模提供新模型体验,只能少范围preview和炒作

--- 第 8 楼来自 marszoom 的回复 (2026-04-08 00:26:06 PDT) ---

看了一下评论 有点毛骨悚然了。 之前觉得码农职业寿命没几年了 我现在觉得人类没几年了

--- 第 9 楼来自 ByteSlack 的回复 (2026-04-08 00:32:23 PDT) ---

我发现一个模型太强了大家就会怀疑是不是炒作 实际上这就是地球上最接近AGI的model,no kidding

--- 第 10 楼来自 Nik0major 的回复 (2026-04-08 00:33:17 PDT) ---

分不清上面在认真还是在串了,到底什么水平

--- 第 11 楼来自 anon2358 的回复 (2026-04-08 00:34:17 PDT) ---

炒作的话,为啥花给1亿美金的额度,这也是下血本了吧

--- 第 12 楼来自 marszoom 的回复 (2026-04-08 00:36:28 PDT) ---

你要理解一下人类学的宗旨。 如果一个无限接近agi的模型强到会伪装 能发现几十年的bug 还能跳出沙盒 然后你发布了 其他厂商开始蒸馏然后提纯出一个差不多的但是却没有相应对齐的模型 那就完犊子了

--- 第 13 楼来自 quartet 的回复 (2026-04-08 00:36:52 PDT) ---

我倾向于炒作,benchmark比较可疑,SWE bench不是早饱和了,剩下的都是有问题的,模型是怎么提分的system card也没写。而且五倍的价格我也没觉得还能立刻实用,况且真这么厉害我觉得应该有更impressive的demo而不是找bug,说实话这些安全漏洞opus/5.4也没说不能找啊。

--- 第 14 楼来自 boring 的回复 (2026-04-08 00:39:11 PDT) ---

赶紧测完加固完放出来帮我写代码

--- 第 15 楼来自 tomandjerry 的回复 (2026-04-08 00:40:16 PDT) ---

一个会伪装的模型,怎么蒸馏

--- 第 16 楼来自 illusionwing 的回复 (2026-04-08 00:52:33 PDT) ---

5倍啥意思,$500一个月? api价格上天了

--- 第 17 楼来自 boring 的回复 (2026-04-08 00:58:16 PDT) ---

Mythos API 价格 25/125,Opus 5/25

--- 第 18 楼来自 zuiaiwufan 的回复 (2026-04-08 01:10:45 PDT) ---

一个公司,唯一的目的就是赚钱 你从这个角度理解CEO的言行就行了

--- 第 19 楼来自 BoMfkingaz 的回复 (2026-04-08 05:38:05 PDT) ---

这下可以用Mythos五倍速烧钱了

--- 第 20 楼来自 clinica 的回复 (2026-04-08 05:43:31 PDT) ---

都在关注打仗没时间关注别的

--- 第 21 楼来自 anno82023825 的回复 (2026-04-08 05:54:36 PDT) ---

opus算上工具调教说断层领先不为过。

--- 第 22 楼来自 soffit 的回复 (2026-04-08 06:49:49 PDT) ---

炒作狗说的听听就算了,还真信了?

--- 第 23 楼来自 qwaszx 的回复 (2026-04-08 07:20:22 PDT) ---

hongl: 强大到都不敢发不了 lol,等价于有钱不赚,taco伊朗是因为心善

--- 第 24 楼来自 Cookies 的回复 (2026-04-08 07:27:00 PDT) ---

Anthropic测的是新出的SWE Bench Pro,之前最高只有一半的准确率,但是Mythos一下干到七十多快饱和了。如果LLM提高的方向是继续scale up,对中国不是个好消息。

--- 第 25 楼来自 XACO 的回复 (2026-04-08 09:09:00 PDT) ---

炒作狗看什么都是炒作,就ant现在这举世无双的风评和revenue趋势,随便阉割了发个4.6 uuuultra绝对满世界流水,有什么动机炒作? 看dario天天这皱眉头被采访的样子感觉大哥是真的为人类担忧了(可惜了,人类赶紧灭亡啊

--- 第 26 楼来自 Skwbs 的回复 (2026-04-08 09:22:00 PDT) ---

有没有发财机会

--- 第 27 楼来自 Vichy 的回复 (2026-04-08 09:26:17 PDT) ---

赞同 SWE-bench verified 93.9% 感觉不太可能?这个 benchmark 本身就有点问题

--- 第 28 楼来自 争取多活两年 的回复 (2026-04-08 09:34:53 PDT) ---

和达里奥比起来,奥特曼都显得眉清目秀了。

--- 第 29 楼来自 争取多活两年 的回复 (2026-04-08 09:41:01 PDT) ---

按AI目前吸干美国所有别的sector钱搞个大泡泡的趋势,中国要笑醒了。

--- 第 30 楼来自 Startrek 的回复 (2026-04-08 09:42:06 PDT) ---

和奥特曼一丘之貉,不装逼能死星人。 下次就是宇宙爆炸级

--- 第 31 楼来自 boring 的回复 (2026-04-08 09:44:17 PDT) ---

泥潭终于出现 LLM 降临派

--- 第 32 楼来自 争取多活两年 的回复 (2026-04-08 09:46:12 PDT) ---

其实LLM堆料和当年INTC刷主频一样没有上限的。但是有没有人愿意买单不好说。 人类学老想把自己包装成国防公司就是因为后面只有政府能买这种单,参考曼哈顿计划。

--- 第 33 楼来自 qwaszx 的回复 (2026-04-08 09:49:05 PDT) ---

咱就是说,swe也不是全部,能不能特化一下数据分析啊,几个模型对比较细致的数据处理都不太行

--- 第 34 楼来自 争取多活两年 的回复 (2026-04-08 09:51:05 PDT) ---

这你得等有公司愿意关注这个赛道了。后面应该会有不同的模型关注不同的vertical。

--- 第 35 楼来自 ytc 的回复 (2026-04-08 09:51:09 PDT) ---

opus 4.6 fast 的api价格是普通opus的6倍,速度只是2.5倍。这个Mythos如果真这么强还不如opus fast&gpt5.4 pro贵,合理吗

--- 第 36 楼来自 争取多活两年 的回复 (2026-04-08 09:51:58 PDT) ---

补贴价啊。

--- 第 37 楼来自 dancingbro 的回复 (2026-04-08 09:51:59 PDT) ---

Mythos是用来忽悠大客户的,小小码工来凑什么热闹。天天嘴上忧国忧民,不见拿出真金白银来推动立法。

--- 第 38 楼来自 争取多活两年 的回复 (2026-04-08 09:52:38 PDT) ---

嘴上都是__,心里都是__

--- 第 39 楼来自 cynthialin 的回复 (2026-04-08 09:53:42 PDT) ---

anthropic的CEO就是个attention whore

--- 第 40 楼来自 KingGrimlock 的回复 (2026-04-08 09:56:20 PDT) ---

强大到不敢发,可以一直赢,一直不发一直赢,这是无限赢闭环啊

--- 第 41 楼来自 争取多活两年 的回复 (2026-04-08 09:56:41 PDT) ---

本老觉得他是受迫害妄想症,硅谷码农挺常见的。

--- 第 42 楼来自 MarkATL 的回复 (2026-04-08 09:57:17 PDT) ---

希望早点public release。现在每天工作就靠cc了。

--- 第 43 楼来自 0xEthan 的回复 (2026-04-08 10:36:28 PDT) ---

模型(技术)过于先进,不便展示

--- 第 44 楼来自 quartet 的回复 (2026-04-08 10:36:35 PDT) ---

而且营销的点实在是一言难尽,bug得证明其他模型都找不到才算是meaningful吧。 https://www.zhihu.com/question/2025035806335596432/answer/2025202064951657527

--- 第 45 楼来自 0xEthan 的回复 (2026-04-08 11:02:14 PDT) ---

你看这个知乎帖子里面github link patch的作者,前几天他造的大新闻可不少

--- 第 46 楼来自 webmaster 的回复 (2026-04-08 11:14:26 PDT) ---

用上了,但是不能评论

--- 第 47 楼来自 BigCongming 的回复 (2026-04-08 11:30:35 PDT) ---

我自己用opus找一个大repo的bug,只搞一轮次感觉至少有50%是false positive

--- 第 48 楼来自 吃货不吐葡萄皮 的回复 (2026-04-08 11:43:41 PDT) ---

现在的中美AI竞赛,就像当年的**太空竞赛**:你发卫星、我射飞船,你上太空、我登月球。 唯一区别是节奏不同了——美国这边更像“独角戏”:顶尖模型越做越强,在前沿推理、复杂任务上仍领跑,但商业化主要靠高端用户和企业买单,路径窄、成本高。感觉唯一能呼应的就是资本家最终想不花一分钱雇人(当然有些人会说这样你就可以有时间去做更有意思的事了,但没收入了什么会有意思呢 ) 中国这边似乎显得从容许多,甚至有点“乐得其成”——没有被甩开太远,DeepSeek、Qwen等模型在性价比、开源、基础应用和落地速度上极具竞争力,特别在工业、消费级和实体经济场景中快速渗透。大家也乐于这个状态(当然也有其他限制),毕竟齐头并进的话就不好“摸着过河”。

--- 第 49 楼来自 webmaster 的回复 (2026-04-08 15:07:28 PDT) ---

吃货不吐葡萄皮: 特别在工业、消费级和实体经济场景中 翻译:把在线客服都换成AI,更恶心人

--- 第 50 楼来自 lllqqq1 的回复 (2026-04-08 15:11:27 PDT) ---

但是模型本身我感觉还是差gemini很多

--- 第 51 楼来自 折木奉太郎 的回复 (2026-04-08 15:12:55 PDT) ---

当年的太空竞赛是纯无意义烧钱秀肌肉,即使有用,在当时意义也不大。 今天这个肌肉是真的能干活 webmaster: 不能评论 传下去,用户说用完都无语了

--- 第 52 楼来自 争取多活两年 的回复 (2026-04-08 15:16:55 PDT) ---

中国急也没用啊,显卡和EUV又不会从天上掉下来。 不过本老觉得中国手握底牌:如果AI真那么牛逼,就把台积电炸了。

--- 第 53 楼来自 monkeytail 的回复 (2026-04-08 15:27:21 PDT) ---

你试过吗?

--- 第 54 楼来自 soxziw 的回复 (2026-04-08 18:17:37 PDT) ---

刚被国内AI客服忽悠的买一个错的产品 ,信誓旦旦说场景可用,发现用不了转人工才发现AI在胡扯,真的恶心

--- 第 55 楼来自 tomari 的回复 (2026-04-08 20:16:08 PDT) ---

好像是先对apple google microsoft开放,让他们把自己的漏洞修了,再说要不要GA,说是找安全漏洞的能力比之前强了很多可能会被利用

--- 第 56 楼来自 schenkerx 的回复 (2026-04-08 20:58:12 PDT) ---

彼时彼刻,恰如此时此刻 OpenAI says its text-generating algorithm GPT-2 is too dangerous to release. https://slate.com/technology/2019/02/openai-gpt2-text-generating-algorithm-ai-dangerous.html Meta says its new speech-generating AI model is too dangerous for public release. https://www.theverge.com/2023/6/17/23764565/meta-says-its-new-speech-generating-ai-model-is-too-dangerous-for-public-release

--- 第 57 楼来自 yczhang 的回复 (2026-04-08 21:11:03 PDT) ---

现有模型还可以割韭菜。到现在的割不动了再上新。

--- 第 58 楼来自 收束观测者 的回复 (2026-04-08 21:20:25 PDT) ---

吃货不吐葡萄皮: 摸着过河 互相摸,互相摸 据说Meta不敢直接蒸opus所以去蒸了蒸了opus的kimi 摸已经是家play里的一环了

--- 第 59 楼来自 McDonald 的回复 (2026-04-08 21:23:09 PDT) ---

看了,吹的神乎其神

--- 第 61 楼来自 dddd120 的回复 (2026-04-08 22:39:44 PDT) ---

如果大裁员的话,SP500看多还是看空? https://www.cnbc.com/2026/04/07/anthropic-claude-mythos-ai-hackers-cyberattacks.html https://www.cnbc.com/2026/04/07/anthropic-claude-mythos-ai-hackers-cyberattacks.html Microsoft, Amazon, Apple, CrowdStrike, Palo Alto Networks and others will use the model as part of a new cybersecurity initiative called Project Glasswing.

--- 第 62 楼来自 5GE 的回复 (2026-04-08 22:40:55 PDT) ---

已经有话题了,https://www.uscardforum.com/t/topic/497489

--- 第 63 楼来自 dddd120 的回复 (2026-04-08 22:42:01 PDT) ---

理财版看问题的角度不一样 ,我们关注于讨论有何发财机会

--- 第 64 楼来自 5GE 的回复 (2026-04-08 22:43:22 PDT) ---

这不简单吗,看好就买SK telecom的股票呗,不过不看好也可以为了Faker买

--- 第 65 楼来自 dddd120 的回复 (2026-04-08 22:44:51 PDT) ---

为啥SK telecom…

--- 第 66 楼来自 5GE 的回复 (2026-04-08 22:48:27 PDT) ---

23年的时候SKT不小心投了Anthropic一个亿USD

--- 第 67 楼来自 bujidao 的回复 (2026-04-08 22:51:08 PDT) ---

那时候还叫text-generating algorithm。。。一语道破本质

--- 第 68 楼来自 AWSNiuma 的回复 (2026-04-08 22:52:11 PDT) ---

用这个也要签nda吗

--- 第 69 楼来自 002 的回复 (2026-04-08 22:52:57 PDT) ---

真牛逼的话肯定自己藏着掖着闷声发大财了,还用得着大张旗鼓出来卖吗?

--- 第 70 楼来自 dddd120 的回复 (2026-04-08 22:53:01 PDT) ---

已经涨了60%了是不是有点贵了呀

--- 第 71 楼来自 bujidao 的回复 (2026-04-08 22:53:12 PDT) ---

商人本质还是很明显的,只许自己蒸馏互联网不许别人蒸馏他模型

--- 第 72 楼来自 002 的回复 (2026-04-08 22:55:15 PDT) ---

大佬zkjj?

--- 第 73 楼来自 0-1 的回复 (2026-04-08 22:55:24 PDT) ---

red team?

--- 第 74 楼来自 002 的回复 (2026-04-08 22:56:28 PDT) ---

/uploads/short-url/aNNhAGTuJcsW7EXPissX5gKDjVd.jpeg?dl=1

--- 第 75 楼来自 dddd120 的回复 (2026-04-08 23:00:16 PDT) ---

问了一下AI,说当年的投资已经被稀释很多了,如果IPO的话SK的持股会被进一步稀释,因为IPO一般都是发行新股而不是拿现有的股份出来卖。还是不要搞这种骚操作,感觉会被

--- 第 76 楼来自 KenF 的回复 (2026-04-08 23:20:26 PDT) ---

这个模型出来了之后,opus 4.6被降智商很多了?

--- 第 77 楼来自 awaken01641 的回复 (2026-04-08 23:37:21 PDT) ---

吃货不吐葡萄皮: 没收入了 凭什么要上班才能有收入

--- 第 78 楼来自 258 的回复 (2026-04-08 23:42:10 PDT) ---

员工部分在agentspace里选xxxx agent貌似可以使用 很难评

--- 第 79 楼来自 Startrek 的回复 (2026-04-08 23:42:38 PDT) ---

KenF: ,opus 4.6被降智商很多了? 现在4.6简直成了智障。。

--- 第 80 楼来自 CB2 的回复 (2026-04-08 23:44:38 PDT) ---

降成傻逼了

--- 第 81 楼来自 CB2 的回复 (2026-04-08 23:45:35 PDT) ---

tmd没人class action吗,付了钱,opus降智成sonnet,现在我天天对着claude code爆粗口

--- 第 82 楼来自 Startrek 的回复 (2026-04-08 23:54:02 PDT) ---

真的太过分了!!!所以我对mythos的所谓AGI嗤之以鼻,真牛逼有必要将至opus么? 太tmd的傻逼,人类学这个公司的恶心程度绝对不低于oai。

--- 第 83 楼来自 jnnksn 的回复 (2026-04-09 00:01:02 PDT) ---

hongl: 强大到都不敢发不了 预设的价格还是 Opus 的 5倍 tldr: 公司垃圾,模型没调教好,价格也降不下来

--- 第 84 楼来自 Aaronpang 的回复 (2026-04-09 00:10:21 PDT) ---

人类学把散户的数据偷光了,直接降智限额把散户踢了 现在出个Mythos只给企业大客户玩,散户在人类学眼中和机杯差不多

--- 第 85 楼来自 002 的回复 (2026-04-09 00:12:25 PDT) ---

一步到位成为牙膏厂哈哈哈

--- 第 86 楼来自 amx 的回复 (2026-04-09 00:14:51 PDT) ---

看到有报道说是他们用mythos扫描了很多大型开源项目源码,包括操作系统和浏览器,找到了很多以前没有发现的漏洞,有一个例子是攻破freebsd拿到root权限: https://www.forbes.com/sites/amirhusain/2026/04/01/ai-just-hacked-one-of-the-worlds-most-secure-operating-systems/ 如果这些是真的话新的模型的确危险,因为原来一些需要3-6个月才能利用的漏洞现在一个小时就能上线,使得防御的时间窗口大大缩小了,这是实实在在的安全威胁,跟gpt那种pr还是有本质的区别 他们现在在和amazon, apple, google, microsoft, crowdstrike, jpmorgan等公司合作修补模型发现的漏洞,估计是给他们时间patch完之后才上线。如果只是纯吹牛,估计这些公司不会鸟他们,有些还是竞争对手: https://www.linuxfoundation.org/blog/project-glasswing-gives-maintainers-advanced-ai-to-secure-open-source

--- 第 87 楼来自 akuw5uDi 的回复 (2026-04-09 00:15:09 PDT) ---

骂人也要token的

--- 第 88 楼来自 CB2 的回复 (2026-04-09 00:18:37 PDT) ---

老板的plan,我就管骂

--- 第 90 楼来自 KenF 的回复 (2026-04-09 00:22:18 PDT) ---

对啊,之前给我一套分析很有道理, 现在就说 对,没错。

--- 第 91 楼来自 illusionwing 的回复 (2026-04-09 00:24:44 PDT) ---

freebsd的没看,但是ffmpeg的那个bug/pr我感觉挺无关痛痒的 反正我行业还得找人坐牢,不担心被ai取代 不过总的趋势肯定是棺材造到一半还以为是张新床 不管怎么样老中真的能把TSMC炸了 人类早点死就好了

--- 第 92 楼来自 tomari 的回复 (2026-04-09 00:35:45 PDT) ---

没有和中国公司合作? 如果是真的, 那中国的企业,包括政府平台岂不是很危险?

--- 第 93 楼来自 CB2 的回复 (2026-04-09 01:07:22 PDT) ---

人类学就是社会达尔文的究极形态,大家的数据就是我的,我的还是我的,逆向我的模型,api,直接给你ban,蒸馏我的数据,给你数据投毒,就这么jb恶心。openai也恶心,但人家只想捞钱,人类学真的是反人类

--- 第 94 楼来自 webmaster 的回复 (2026-04-09 13:00:00 PDT) ---

我没签但是我怕我说了公司会把我开了

--- 第 95 楼来自 一起看海 的回复 (2026-04-09 13:15:20 PDT) ---

不是 为什么首次发帖就是金卡?

--- 第 96 楼来自 harvey8 的回复 (2026-04-09 15:24:01 PDT) ---

Anthropic CEO仍然在OpenAI的时候,OpenAI曾经放出话来,GPT-2太危险了,不能公布。。。换汤不换药啊 https://techcrunch.com/2019/02/17/openai-text-generator-dangerous/ https://techcrunch.com/2019/02/17/openai-text-generator-dangerous/ A storm is brewing over a new language model, built by non-profit artificial intelligence research company OpenAI, which it says is so good at generating Est. reading time: 3 minutes

--- 第 97 楼来自 GuanBai 的回复 (2026-04-09 18:39:11 PDT) ---

原来apple一直没有发布任何ai模型是因为做的太强大了,估计再过10年时代进步了才会发出来。

--- 第 98 楼来自 zhhy 的回复 (2026-04-09 18:41:13 PDT) ---

没用过很难聊啊 什么时候能拿来用用? 现在已经觉得Opus 4.6降智了非常傻逼

--- 第 99 楼来自 Chris 的回复 (2026-04-09 19:27:12 PDT) ---

感觉这次是真的狼来了 https://www.reuters.com/business/finance/bessent-powell-warn-bank-ceos-about-anthropic-model-risks-bloomberg-news-reports-2026-04-10/

--- 第 100 楼来自 msft 的回复 (2026-04-09 19:36:03 PDT) ---

这些mythos能干的 opus干不了嘛 这意思是到了军工级ai

--- 第 101 楼来自 xvxiaopei 的回复 (2026-04-09 19:37:35 PDT) ---

过于先进,不便展示 /uploads/short-url/rxWdieHiacraIjdhRDTzxW6UvQd.png?dl=1

--- 第 102 楼来自 菜鸟玩家 的回复 (2026-04-09 19:40:36 PDT) ---

组里抽掉了2/3的人加班加点要用上mythos

--- 第 103 楼来自 ttworld 的回复 (2026-04-09 21:10:31 PDT) ---

OpenAI 变成CloseAI, 人类学变成反人类学,大家都有美好的未来

--- 第 104 楼来自 rqc 的回复 (2026-04-10 12:57:45 PDT) ---

并非。我现在跟小奥躺倒椅子里反应一样,只是他ceo表演形人格

--- 第 105 楼来自 rqc 的回复 (2026-04-10 12:59:23 PDT) ---

很好奇还在怀疑ai泡沫的人有没有真正用过正经harness的agent环境

--- 第 106 楼来自 争取多活两年 的回复 (2026-04-10 13:00:27 PDT) ---

说说你的环境。

--- 第 107 楼来自 Skyler2022 的回复 (2026-04-10 18:05:20 PDT) ---

AI对找漏洞的赋能确实无敌,隔壁大组有一个做了很多年数据收集-发奖励的产品,最近被一个用户找到一个陈年老bug,3天时间被撸了$1M+礼品卡,还抓不到人

--- 第 108 楼来自 cnxcnx 的回复 (2026-04-10 18:12:24 PDT) ---

居然还有这个帖子。A的宣传一直都是这个风格。 昨天有机构测试了很小的开源模型也能找到同样的漏洞: https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier 包括gpt-oss

--- 第 109 楼来自 折木奉太郎 的回复 (2026-04-10 18:14:46 PDT) ---

我觉得可以派潭特务,扫描自家公司代码找羊毛薅

--- 第 110 楼来自 bujidao 的回复 (2026-04-10 18:41:00 PDT) ---

泡沫和harness有啥关系 互联网这么好用 当年不也是泡沫

--- 第 111 楼来自 hongl 的回复 (2026-04-16 21:17:11 PDT) ---

今天 4.7 出来,感觉也就那样?

--- 第 112 楼来自 002 的回复 (2026-04-16 21:44:01 PDT) ---

我骂完CC以后CC就罢工,真是气死人,好比招工招了个祖宗

--- 第 114 楼来自 002 的回复 (2026-04-16 21:47:07 PDT) ---

遥遥领先

--- 第 116 楼来自 RandomPerson 的回复 (2026-04-16 21:55:09 PDT) ---

如果真的很强就直接炒作 AGI 了,何必另辟蹊径去炒作特别会找 bug。或者直接 ask mythos 如何做 AGI 不就好了。

--- 第 117 楼来自 zpf0117b 的回复 (2026-04-16 21:58:06 PDT) ---

amex:来喽朋友们

--- 第 118 楼来自 DeutscheGrammophon 的回复 (2026-04-16 21:58:53 PDT) ---

/uploads/short-url/s9qeiX625tW2ovXn7bbQe4vZ3sE.jpeg?dl=1

--- 第 119 楼来自 jnnksn 的回复 (2026-04-17 12:42:23 PDT) ---

一些benchmark还不如ChatGPT,这就是强大到不敢发?______公司

--- 第 120 楼来自 吹小号的鹅 的回复 (2026-04-21 14:42:44 PDT) ---

Bbg headline: mythos model accessed by unauthorized user 这波尴尬了 要是不攻破点东西这故事就没办法吹下去了

--- 第 121 楼来自 ApplePay 的回复 (2026-04-21 17:05:10 PDT) ---

有没有可能“人类学”就是人类被archive了才需要的

--- 第 122 楼来自 ApplePay 的回复 (2026-04-21 17:06:16 PDT) ---

29k token前面在干啥

--- 第 123 楼来自 Yangff 的回复 (2026-04-21 17:10:40 PDT) ---

走路去吧。50米开车实在没必要——发动车、倒库、开过去再停车的时间,比你走过去还久,而且洗完车再开回家又会沾上灰。直接走 过去把车开到洗车店才合理 → ApplePay: 29k token 一堆system prompt之类的 切换到research模式之后 核心结论 走路去——但要注意题目里的隐藏前提:洗的是这辆车,所以车也得到店。最优顺序是: 走路过去(~40 秒)确认排队、报价 回家开车慢速过去(无可避免的 1 次冷启动) 洗完开回家 五维对比要点 ┌──────────┬──────────┬───────────────────────────────────────────────────┐ │ 维度 │ 步行 │ 开车 50 米 │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 时间 │ 35–42 秒 │ 100–190 秒(操作开销远大于行驶) │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 油耗 │ 0 │ 冷启动头 1 km 油耗高 50–100%,往返触发 2 次冷启动 │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 排放 │ 0 │ 50 米几乎 100% 落在冷启动阶段,催化器未起燃 │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 车辆磨损 │ 0 │ 冷凝水残留、燃油稀释机油、电瓶亏电 │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 清洁度 │ — │ 中性(不构成开车的理由) │ └──────────┴──────────┴───────────────────────────────────────────────────┘

--- 第 124 楼来自 DeutscheGrammophon 的回复 (2026-04-21 23:12:41 PDT) ---

/uploads/short-url/l2WcrNP4FHowRKxZ3sPDudvPFrw.png?dl=1 https://x.com/TheAmolAvasare/status/2046724659039932830 https://x.com/TheAmolAvasare/status/2046724659039932830 https://x.com/TheAmolAvasare/status/2046724659039932830 https://x.com/TheAmolAvasare/status/2046724659039932830 A\遥遥领先

--- 第 125 楼来自 mr_008 的回复 (2026-04-21 23:34:15 PDT) ---

白金了已经

--- 第 126 楼来自 bravefilm 的回复 (2026-04-24 17:28:31 PDT) ---

marszoom: 现在觉得人类没几年了 这是好事啊

--- 第 127 楼来自 bravefilm 的回复 (2026-04-24 17:30:44 PDT) ---

#p-8076380-aimythos-1强大到“比核弹还糟糕”的AI:Mythos拉响网络安全警报 https://cn.nytimes.com/technology/20260423/anthropics-mythos-ai/ https://cn.nytimes.com/technology/20260423/anthropics-mythos-ai/ Anthropic表示,该公司最新AI模型Mythos能够发现并利用全球银行、电网和政府所依赖的软件中的隐藏漏洞。各国领导人正在努力评估这一安全风险的严重程度以及如何应对。

--- 第 128 楼来自 youyou6093 的回复 (2026-04-24 17:34:04 PDT) ---

这题不是早就应该在训练数据了嘛?为啥还会错哦

--- 第 129 楼来自 收束观测者 的回复 (2026-04-25 08:44:59 PDT) ---

反过来说这段时间憋着可能是在让美国官家黑客在互联网上用独家0d大杀四方