没人聊聊 Anthropic 最新的模型 Mythos 吗?
Anthropic新模型Mythos因过于强大引发热议,被指炒作与降智旧模型。
1. 关键信息
- Mythos是Anthropic最新模型,API价格25/125(Opus为5/25),是Opus的5倍(#1, #17)。
- 据称能发现并利用软件漏洞,已与Amazon、Apple、Google、Microsoft、CrowdStrike等合作Project Glasswing修补漏洞(#61, #86)。
- 在SWE Bench Pro上准确率从~50%提升至70%+(#24),但部分benchmark不如ChatGPT(#119)。
- 有报道称Mythos攻破FreeBSD获取root权限(#86),但也被质疑是营销(#44, #108)。
- 用户反映Opus 4.6被降智(#79-#82),引发不满。
2. 羊毛/优惠信息
无
3. 最新动态
- 模型已向部分企业客户开放,普通用户无法使用(#46, #102)。
- 美国财长Bessent和美联储主席Powell警告银行关于Mythos的风险(#99)。
- 有报道称Mythos被未授权用户访问(#120)。
- 中国公司未参与合作,引发安全担忧(#92)。
4. 争议或不同意见
- 多数用户认为是炒作,类似OpenAI GPT-2“太危险不发布”的套路(#5, #22, #56, #96)。
- 质疑SWE Bench已饱和,模型提分方式可疑(#13, #27)。
- CEO Dario被批“attention whore”“装逼”(#2, #28, #39)。
- 用户愤怒于Opus降智,认为Anthropic“反人类”(#82, #93)。
- 有测试显示小开源模型也能找到同样漏洞(#108)。
5. 行动建议
- 关注Mythos在网络安全领域的实际应用,但警惕过度炒作。
- 对Anthropic的“强大到不敢发布”叙事保持怀疑,等待第三方独立评测。
- 若持有SK Telecom股票(曾投资Anthropic),注意稀释风险(#64, #75)。
- 普通用户可继续使用现有模型,等待Mythos公开后评估性价比。
据说 强大到都不敢发不了 预设的价格还是 Opus 的 5倍
ceo爱装逼的特质体现在每一处细节
hongl: 强大到都不敢发不了 对于人类学来说,这是一个悖论: 如果强大到不敢发布 → 有社会责任感 → 雪藏/销毁 如果发布 → 有社会责任感 → 没有多强
这跟橘子“赢太多了收不了了”不是一个套路么“模型太强了发不了”
Mythos到底是新模型,还是类似 Gemini Deep Think 这种靠超高推理成本堆出来的东西,现在看不太出来。说强到不敢发有点离谱。Opus确实强,但也没强到断层领先,感觉更像是宣发策略的一部分
如果一个模型很强,并且ready了,应该会立刻发布抢占市场吧
估计是没有算力来大规模提供新模型体验,只能少范围preview和炒作
看了一下评论 有点毛骨悚然了。 之前觉得码农职业寿命没几年了 我现在觉得人类没几年了
我发现一个模型太强了大家就会怀疑是不是炒作 实际上这就是地球上最接近AGI的model,no kidding
分不清上面在认真还是在串了,到底什么水平
炒作的话,为啥花给1亿美金的额度,这也是下血本了吧
你要理解一下人类学的宗旨。 如果一个无限接近agi的模型强到会伪装 能发现几十年的bug 还能跳出沙盒 然后你发布了 其他厂商开始蒸馏然后提纯出一个差不多的但是却没有相应对齐的模型 那就完犊子了
我倾向于炒作,benchmark比较可疑,SWE bench不是早饱和了,剩下的都是有问题的,模型是怎么提分的system card也没写。而且五倍的价格我也没觉得还能立刻实用,况且真这么厉害我觉得应该有更impressive的demo而不是找bug,说实话这些安全漏洞opus/5.4也没说不能找啊。
赶紧测完加固完放出来帮我写代码
一个会伪装的模型,怎么蒸馏
5倍啥意思,$500一个月? api价格上天了
Mythos API 价格 25/125,Opus 5/25
一个公司,唯一的目的就是赚钱 你从这个角度理解CEO的言行就行了
这下可以用Mythos五倍速烧钱了
都在关注打仗没时间关注别的
opus算上工具调教说断层领先不为过。
炒作狗说的听听就算了,还真信了?
hongl: 强大到都不敢发不了 lol,等价于有钱不赚,taco伊朗是因为心善
Anthropic测的是新出的SWE Bench Pro,之前最高只有一半的准确率,但是Mythos一下干到七十多快饱和了。如果LLM提高的方向是继续scale up,对中国不是个好消息。
炒作狗看什么都是炒作,就ant现在这举世无双的风评和revenue趋势,随便阉割了发个4.6 uuuultra绝对满世界流水,有什么动机炒作? 看dario天天这皱眉头被采访的样子感觉大哥是真的为人类担忧了(可惜了,人类赶紧灭亡啊
有没有发财机会
赞同 SWE-bench verified 93.9% 感觉不太可能?这个 benchmark 本身就有点问题
和达里奥比起来,奥特曼都显得眉清目秀了。
按AI目前吸干美国所有别的sector钱搞个大泡泡的趋势,中国要笑醒了。
和奥特曼一丘之貉,不装逼能死星人。 下次就是宇宙爆炸级
泥潭终于出现 LLM 降临派
其实LLM堆料和当年INTC刷主频一样没有上限的。但是有没有人愿意买单不好说。 人类学老想把自己包装成国防公司就是因为后面只有政府能买这种单,参考曼哈顿计划。
咱就是说,swe也不是全部,能不能特化一下数据分析啊,几个模型对比较细致的数据处理都不太行
这你得等有公司愿意关注这个赛道了。后面应该会有不同的模型关注不同的vertical。
opus 4.6 fast 的api价格是普通opus的6倍,速度只是2.5倍。这个Mythos如果真这么强还不如opus fast&gpt5.4 pro贵,合理吗
补贴价啊。
Mythos是用来忽悠大客户的,小小码工来凑什么热闹。天天嘴上忧国忧民,不见拿出真金白银来推动立法。
嘴上都是__,心里都是__
anthropic的CEO就是个attention whore
强大到不敢发,可以一直赢,一直不发一直赢,这是无限赢闭环啊
本老觉得他是受迫害妄想症,硅谷码农挺常见的。
希望早点public release。现在每天工作就靠cc了。
模型(技术)过于先进,不便展示
而且营销的点实在是一言难尽,bug得证明其他模型都找不到才算是meaningful吧。 https://www.zhihu.com/question/2025035806335596432/answer/2025202064951657527
你看这个知乎帖子里面github link patch的作者,前几天他造的大新闻可不少
用上了,但是不能评论
我自己用opus找一个大repo的bug,只搞一轮次感觉至少有50%是false positive
现在的中美AI竞赛,就像当年的**太空竞赛**:你发卫星、我射飞船,你上太空、我登月球。 唯一区别是节奏不同了——美国这边更像“独角戏”:顶尖模型越做越强,在前沿推理、复杂任务上仍领跑,但商业化主要靠高端用户和企业买单,路径窄、成本高。感觉唯一能呼应的就是资本家最终想不花一分钱雇人(当然有些人会说这样你就可以有时间去做更有意思的事了,但没收入了什么会有意思呢 ) 中国这边似乎显得从容许多,甚至有点“乐得其成”——没有被甩开太远,DeepSeek、Qwen等模型在性价比、开源、基础应用和落地速度上极具竞争力,特别在工业、消费级和实体经济场景中快速渗透。大家也乐于这个状态(当然也有其他限制),毕竟齐头并进的话就不好“摸着过河”。
吃货不吐葡萄皮: 特别在工业、消费级和实体经济场景中 翻译:把在线客服都换成AI,更恶心人
但是模型本身我感觉还是差gemini很多
当年的太空竞赛是纯无意义烧钱秀肌肉,即使有用,在当时意义也不大。 今天这个肌肉是真的能干活 webmaster: 不能评论 传下去,用户说用完都无语了
中国急也没用啊,显卡和EUV又不会从天上掉下来。 不过本老觉得中国手握底牌:如果AI真那么牛逼,就把台积电炸了。
你试过吗?
刚被国内AI客服忽悠的买一个错的产品 ,信誓旦旦说场景可用,发现用不了转人工才发现AI在胡扯,真的恶心
好像是先对apple google microsoft开放,让他们把自己的漏洞修了,再说要不要GA,说是找安全漏洞的能力比之前强了很多可能会被利用
彼时彼刻,恰如此时此刻 OpenAI says its text-generating algorithm GPT-2 is too dangerous to release. https://slate.com/technology/2019/02/openai-gpt2-text-generating-algorithm-ai-dangerous.html Meta says its new speech-generating AI model is too dangerous for public release. https://www.theverge.com/2023/6/17/23764565/meta-says-its-new-speech-generating-ai-model-is-too-dangerous-for-public-release
现有模型还可以割韭菜。到现在的割不动了再上新。
吃货不吐葡萄皮: 摸着过河 互相摸,互相摸 据说Meta不敢直接蒸opus所以去蒸了蒸了opus的kimi 摸已经是家play里的一环了
看了,吹的神乎其神
如果大裁员的话,SP500看多还是看空? https://www.cnbc.com/2026/04/07/anthropic-claude-mythos-ai-hackers-cyberattacks.html https://www.cnbc.com/2026/04/07/anthropic-claude-mythos-ai-hackers-cyberattacks.html Microsoft, Amazon, Apple, CrowdStrike, Palo Alto Networks and others will use the model as part of a new cybersecurity initiative called Project Glasswing.
已经有话题了,https://www.uscardforum.com/t/topic/497489
理财版看问题的角度不一样 ,我们关注于讨论有何发财机会
这不简单吗,看好就买SK telecom的股票呗,不过不看好也可以为了Faker买
为啥SK telecom…
23年的时候SKT不小心投了Anthropic一个亿USD
那时候还叫text-generating algorithm。。。一语道破本质
用这个也要签nda吗
真牛逼的话肯定自己藏着掖着闷声发大财了,还用得着大张旗鼓出来卖吗?
已经涨了60%了是不是有点贵了呀
商人本质还是很明显的,只许自己蒸馏互联网不许别人蒸馏他模型
大佬zkjj?
red team?
/uploads/short-url/aNNhAGTuJcsW7EXPissX5gKDjVd.jpeg?dl=1
问了一下AI,说当年的投资已经被稀释很多了,如果IPO的话SK的持股会被进一步稀释,因为IPO一般都是发行新股而不是拿现有的股份出来卖。还是不要搞这种骚操作,感觉会被
这个模型出来了之后,opus 4.6被降智商很多了?
吃货不吐葡萄皮: 没收入了 凭什么要上班才能有收入
员工部分在agentspace里选xxxx agent貌似可以使用 很难评
KenF: ,opus 4.6被降智商很多了? 现在4.6简直成了智障。。
降成傻逼了
tmd没人class action吗,付了钱,opus降智成sonnet,现在我天天对着claude code爆粗口
真的太过分了!!!所以我对mythos的所谓AGI嗤之以鼻,真牛逼有必要将至opus么? 太tmd的傻逼,人类学这个公司的恶心程度绝对不低于oai。
hongl: 强大到都不敢发不了 预设的价格还是 Opus 的 5倍 tldr: 公司垃圾,模型没调教好,价格也降不下来
人类学把散户的数据偷光了,直接降智限额把散户踢了 现在出个Mythos只给企业大客户玩,散户在人类学眼中和机杯差不多
一步到位成为牙膏厂哈哈哈
看到有报道说是他们用mythos扫描了很多大型开源项目源码,包括操作系统和浏览器,找到了很多以前没有发现的漏洞,有一个例子是攻破freebsd拿到root权限: https://www.forbes.com/sites/amirhusain/2026/04/01/ai-just-hacked-one-of-the-worlds-most-secure-operating-systems/ 如果这些是真的话新的模型的确危险,因为原来一些需要3-6个月才能利用的漏洞现在一个小时就能上线,使得防御的时间窗口大大缩小了,这是实实在在的安全威胁,跟gpt那种pr还是有本质的区别 他们现在在和amazon, apple, google, microsoft, crowdstrike, jpmorgan等公司合作修补模型发现的漏洞,估计是给他们时间patch完之后才上线。如果只是纯吹牛,估计这些公司不会鸟他们,有些还是竞争对手: https://www.linuxfoundation.org/blog/project-glasswing-gives-maintainers-advanced-ai-to-secure-open-source
骂人也要token的
老板的plan,我就管骂
对啊,之前给我一套分析很有道理, 现在就说 对,没错。
freebsd的没看,但是ffmpeg的那个bug/pr我感觉挺无关痛痒的 反正我行业还得找人坐牢,不担心被ai取代 不过总的趋势肯定是棺材造到一半还以为是张新床 不管怎么样老中真的能把TSMC炸了 人类早点死就好了
没有和中国公司合作? 如果是真的, 那中国的企业,包括政府平台岂不是很危险?
人类学就是社会达尔文的究极形态,大家的数据就是我的,我的还是我的,逆向我的模型,api,直接给你ban,蒸馏我的数据,给你数据投毒,就这么jb恶心。openai也恶心,但人家只想捞钱,人类学真的是反人类
我没签但是我怕我说了公司会把我开了
不是 为什么首次发帖就是金卡?
Anthropic CEO仍然在OpenAI的时候,OpenAI曾经放出话来,GPT-2太危险了,不能公布。。。换汤不换药啊 https://techcrunch.com/2019/02/17/openai-text-generator-dangerous/ https://techcrunch.com/2019/02/17/openai-text-generator-dangerous/ A storm is brewing over a new language model, built by non-profit artificial intelligence research company OpenAI, which it says is so good at generating Est. reading time: 3 minutes
原来apple一直没有发布任何ai模型是因为做的太强大了,估计再过10年时代进步了才会发出来。
没用过很难聊啊 什么时候能拿来用用? 现在已经觉得Opus 4.6降智了非常傻逼
感觉这次是真的狼来了 https://www.reuters.com/business/finance/bessent-powell-warn-bank-ceos-about-anthropic-model-risks-bloomberg-news-reports-2026-04-10/
这些mythos能干的 opus干不了嘛 这意思是到了军工级ai
过于先进,不便展示 /uploads/short-url/rxWdieHiacraIjdhRDTzxW6UvQd.png?dl=1
组里抽掉了2/3的人加班加点要用上mythos
OpenAI 变成CloseAI, 人类学变成反人类学,大家都有美好的未来
并非。我现在跟小奥躺倒椅子里反应一样,只是他ceo表演形人格
很好奇还在怀疑ai泡沫的人有没有真正用过正经harness的agent环境
说说你的环境。
AI对找漏洞的赋能确实无敌,隔壁大组有一个做了很多年数据收集-发奖励的产品,最近被一个用户找到一个陈年老bug,3天时间被撸了$1M+礼品卡,还抓不到人
居然还有这个帖子。A的宣传一直都是这个风格。 昨天有机构测试了很小的开源模型也能找到同样的漏洞: https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier 包括gpt-oss
我觉得可以派潭特务,扫描自家公司代码找羊毛薅
泡沫和harness有啥关系 互联网这么好用 当年不也是泡沫
今天 4.7 出来,感觉也就那样?
我骂完CC以后CC就罢工,真是气死人,好比招工招了个祖宗
遥遥领先
如果真的很强就直接炒作 AGI 了,何必另辟蹊径去炒作特别会找 bug。或者直接 ask mythos 如何做 AGI 不就好了。
amex:来喽朋友们
/uploads/short-url/s9qeiX625tW2ovXn7bbQe4vZ3sE.jpeg?dl=1
一些benchmark还不如ChatGPT,这就是强大到不敢发?______公司
Bbg headline: mythos model accessed by unauthorized user 这波尴尬了 要是不攻破点东西这故事就没办法吹下去了
有没有可能“人类学”就是人类被archive了才需要的
29k token前面在干啥
走路去吧。50米开车实在没必要——发动车、倒库、开过去再停车的时间,比你走过去还久,而且洗完车再开回家又会沾上灰。直接走 过去把车开到洗车店才合理 → ApplePay: 29k token 一堆system prompt之类的 切换到research模式之后 核心结论 走路去——但要注意题目里的隐藏前提:洗的是这辆车,所以车也得到店。最优顺序是: 走路过去(~40 秒)确认排队、报价 回家开车慢速过去(无可避免的 1 次冷启动) 洗完开回家 五维对比要点 ┌──────────┬──────────┬───────────────────────────────────────────────────┐ │ 维度 │ 步行 │ 开车 50 米 │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 时间 │ 35–42 秒 │ 100–190 秒(操作开销远大于行驶) │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 油耗 │ 0 │ 冷启动头 1 km 油耗高 50–100%,往返触发 2 次冷启动 │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 排放 │ 0 │ 50 米几乎 100% 落在冷启动阶段,催化器未起燃 │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 车辆磨损 │ 0 │ 冷凝水残留、燃油稀释机油、电瓶亏电 │ ├──────────┼──────────┼───────────────────────────────────────────────────┤ │ 清洁度 │ — │ 中性(不构成开车的理由) │ └──────────┴──────────┴───────────────────────────────────────────────────┘
/uploads/short-url/l2WcrNP4FHowRKxZ3sPDudvPFrw.png?dl=1 https://x.com/TheAmolAvasare/status/2046724659039932830 https://x.com/TheAmolAvasare/status/2046724659039932830 https://x.com/TheAmolAvasare/status/2046724659039932830 https://x.com/TheAmolAvasare/status/2046724659039932830 A\遥遥领先
白金了已经
marszoom: 现在觉得人类没几年了 这是好事啊
#p-8076380-aimythos-1强大到“比核弹还糟糕”的AI:Mythos拉响网络安全警报 https://cn.nytimes.com/technology/20260423/anthropics-mythos-ai/ https://cn.nytimes.com/technology/20260423/anthropics-mythos-ai/ Anthropic表示,该公司最新AI模型Mythos能够发现并利用全球银行、电网和政府所依赖的软件中的隐藏漏洞。各国领导人正在努力评估这一安全风险的严重程度以及如何应对。
这题不是早就应该在训练数据了嘛?为啥还会错哦
反过来说这段时间憋着可能是在让美国官家黑客在互联网上用独家0d大杀四方