泥潭日报 uscardforum · 内容汇总

【呼唤ai大神】llm模拟器真的能预测未来?

内容摘要

LLM行为模拟预测未来被指为Scam,企业买单源于风险规避而非技术壁垒

关键信息

  • 核心讨论:用户@〇〇〇质疑基于LLM的“生成式智能体”(Generative Agents, 引用论文 arxiv:2304.03442)能否真正预测人类行为及未来,并指出其融资额高但技术本质疑似“套皮”。
  • 项目背景:涉及斯坦福HCI PhD背景团队,获得李飞飞、Andrej Karpathy等知名投资人支持,声称500强CEO排队咨询,主要面向保险公司、服装公司等商业客户 #1, #4, #9
  • 技术原理:通过控制变量让LLM模拟特定情境下的人类行为交互,用于商业决策辅助或原型测试 #1

争议与不同意见

  • 看空派(主流观点)
    • 多数回复认为这是典型的AI Startup Scam(骗局),本质是“捞一笔跑路” #2, #7
    • 李飞飞被调侃为“最喜欢Scam的人”,其团队占坑后方法论停滞,甚至被指对Robotics领域贡献有限 #5, #14
    • 技术门槛极低,认为“手搓原型只需两三人一周”,无法解释数百万美元的合同价值 #37
    • 类比《少数派报告》或阿西莫夫的“心理史学”,认为科幻色彩大于现实可行性 #27, #28, #30
  • 理性/看多派
    • @VincentY 指出企业购买并非因为技术不可复制,而是出于风险规避经济账考量:自己做需承担全部成本及决策失误的“背锅”责任,外包则可将成本分摊给多个客户 #36, #38
    • 该技术在受监管行业(Regulated Industry)或真人调研困难场景中有替代价值,且SaaS模式可降低中小企业门槛 #32, #34

经验与数据点

  • 企业采购逻辑
    • 造不如买:虽然技术壁垒低,但Enterprise Solution的落地维护成本高,需专人负责。企业倾向于购买现成方案以规避内部开发的高沉没成本和决策风险 #36, #38
    • 销售话术:此类合同常包装为“Agentic Transformation”或“Enterprise Enablement”,实际买家多为SMB或大企业的Marketing/Product/Research部门,预算有限,大额合同多靠概念包装 #32
  • 技术对比
    • 用户提及Mirofish作为对比对象,但@VincentY指出其官网宣称“什么都能做”且缺乏Evaluation Research,归类为Vibe Coded Slop(情绪化代码垃圾),建议关注“不能做什么”比“能做什么”更重要 #39, #40
  • 学术现状
    • 知名学者发表论文更容易获得关注和审核通过,导致学术界存在“占坑”现象,而非单纯的技术突破 #16, #18

风险/限制/注意事项

  • 预测能力局限:LLM模拟无法预测SPX/QQY等具体金融市场每日收盘价,因为市场受多重复杂变量影响,且若真能精准预测,创始人无需融资而应自行获利 #21, #23, #25
  • 技术成熟度:Prototype与Enterprise Solution之间存在巨大鸿沟,目前多数同类Startup缺乏真正的Evaluation Research支持,存在较高的落地不确定性 #38, #40
原始内容
--- 第 1 楼来自 〇〇〇 的回复 (2026-06-17 13:21:53 PDT) ---

https://www.youtube.com/watch?v=lfhFmwcESRw https://www.youtube.com/watch?v=1RrPDLUcVqw 公司有一些相关业务 最近一直在讨论这类所谓的人类社会或者商业预测 本质上他们就是用llm在一些特定情况下控制一些变量跑一些模拟然后卖给商业公司 这人说的神乎其神 500强ceo排着队找他问未来是什么… 保险公司 服装公司啥的 这种公司有壁垒吗 如果就是llm套一些对话模拟 真的能预测人类未来 或者即使真的可以为啥公司自己不做要买他的这个大语言模型套皮 他们的起源应该都是这篇paper吧 感觉没啥突破啊 除了当时真的出圈了 商业公司真的愿意花几千万买这结果? https://arxiv.org/abs/2304.03442 https://arxiv.org/abs/2304.03442 Believable proxies of human behavior can empower interactive applications ranging from immersive environments to rehearsal spaces for interpersonal communication to prototyping tools. In this paper, we introduce generative agents--computational... 有真的ai学术大神指导一下么

--- 第 2 楼来自 LoRA 的回复 (2026-06-17 13:22:24 PDT) ---

〇〇〇: 这种公司有壁垒吗 如果就是llm套一些对话模拟 真的能预测人类未来 或者即使真的可以为啥公司自己不做要买他的这个大语言模型套皮 现在99%的AI startup都是scam

--- 第 3 楼来自 jlhqw187 的回复 (2026-06-17 13:23:18 PDT) ---

没啥ruan用

--- 第 4 楼来自 〇〇〇 的回复 (2026-06-17 13:23:26 PDT) ---

这些玩意融资了一两亿了 李飞飞 andrej karpathy这些人也投

--- 第 5 楼来自 jlhqw187 的回复 (2026-06-17 13:23:53 PDT) ---

飞飞最喜欢scam了

--- 第 6 楼来自 LPL 的回复 (2026-06-17 13:23:59 PDT) ---

没点开视频,看着封面 被采访者的样子就感觉悬 (像college dropout的)

--- 第 7 楼来自 天才美少女卡莎 的回复 (2026-06-17 13:24:27 PDT) ---

本质捞一笔跑路

--- 第 8 楼来自 258 的回复 (2026-06-17 13:24:41 PDT) ---

感觉不如mirofish

--- 第 9 楼来自 〇〇〇 的回复 (2026-06-17 13:24:47 PDT) ---

这人应该斯坦福hci phd

--- 第 10 楼来自 otonoco 的回复 (2026-06-17 13:24:56 PDT) ---

你说行,那就行,不狡辩

--- 第 11 楼来自 〇〇〇 的回复 (2026-06-17 13:25:17 PDT) ---

为啥愿意付钱这事我不懂啊

--- 第 12 楼来自 〇〇〇 的回复 (2026-06-17 13:26:20 PDT) ---

258: mirofish 对 感觉原理是一样的 只不过他们名门正派能融资 话说回来这玩意真能预测未来?

--- 第 13 楼来自 〇〇〇 的回复 (2026-06-17 13:26:50 PDT) ---

怎么说?

--- 第 14 楼来自 jlhqw187 的回复 (2026-06-17 13:30:26 PDT) ---

我做过一点robotics,很多都是飞飞他们占完坑之后,就再也没动过了,方法论也有问题。

--- 第 15 楼来自 〇〇〇 的回复 (2026-06-17 13:31:20 PDT) ---

jlhqw187: 很多都是飞飞他们占完坑之后 然后他们又成为教母了吗

--- 第 16 楼来自 jlhqw187 的回复 (2026-06-17 13:31:23 PDT) ---

不过话说回来AI大家都这么做,不然citation也不会是别的领域好多倍了

--- 第 17 楼来自 〇〇〇 的回复 (2026-06-17 13:31:48 PDT) ---

那为啥所有人不全都占坑

--- 第 18 楼来自 jlhqw187 的回复 (2026-06-17 13:32:42 PDT) ---

有名气的人发和没名气的人发得到的关注度是不一样的,通过审核的难度也不一样。

--- 第 19 楼来自 〇〇〇 的回复 (2026-06-17 13:33:43 PDT) ---

现在不都可以self publish了吗

--- 第 20 楼来自 jlhqw187 的回复 (2026-06-17 13:34:15 PDT) ---

这个不太清楚了,我也就是小白,自己的一点观察和别人的分享,不一定正确。

--- 第 21 楼来自 frozencoke 的回复 (2026-06-17 13:34:23 PDT) ---

能预测spx每日收盘价就不需要融资了

--- 第 22 楼来自 〇〇〇 的回复 (2026-06-17 13:34:57 PDT) ---

哈哈哈哈那肯定不行啊 好像说只能预测人类

--- 第 23 楼来自 xhxhxhxh 的回复 (2026-06-17 13:36:12 PDT) ---

先预测下每日QQQ, SPY趋势

--- 第 24 楼来自 璇瑢子 的回复 (2026-06-17 13:36:58 PDT) ---

股价不也是人类活动产生的结果吗

--- 第 25 楼来自 〇〇〇 的回复 (2026-06-17 13:38:00 PDT) ---

反正要是行 那老哥不需要买股份一个亿了 自己赚就行了

--- 第 26 楼来自 CB2 的回复 (2026-06-17 13:38:34 PDT) ---

我的评价是不如玩模拟人生

--- 第 27 楼来自 Zig 的回复 (2026-06-17 14:11:48 PDT) ---

能的。听说过心灵历史学家么。

--- 第 28 楼来自 uplus5f7b 的回复 (2026-06-17 14:16:42 PDT) ---

查了一下,我之前脑子里有一个类似的科幻idea,然后发现原来是阿西莫夫玩剩下的

--- 第 29 楼来自 st333 的回复 (2026-06-17 14:26:18 PDT) ---

所以没什么人看arxiv了啊

--- 第 30 楼来自 里见光钻 的回复 (2026-06-17 14:26:44 PDT) ---

懂了,少数派报告,预测各位潭友要犯罪先抓起来 最近东大不是有根据发言预测了已经

--- 第 31 楼来自 B1tWiz 的回复 (2026-06-17 14:29:20 PDT) ---

〇〇〇: hci BIG RED FLAG

--- 第 32 楼来自 VincentY 的回复 (2026-06-17 14:30:48 PDT) ---

不能预测未来,但是这东西有用的地方是对标以前完全没有模拟的情况。做决策靠 finger in the wind 的情况在企业里太常见了,有模拟总比没有好。 〇〇〇: 本质上他们就是用llm在一些特定情况下控制一些变量跑一些模拟然后卖给商业公司 所有用 LLM 的方案都能这么说,归根结底 LLM 看到还是 prompt 〇〇〇: 这种公司有壁垒吗 economy of scale,做大了成本就低了。千万级别那是做梦 。barrier of entry 不在技术而是画饼和 enterprise integration (但也可以说大部分 enterprise solution sales 都是这样) 做 synthetic persona 的 startup 现在非常多,走 SaaS 模式的甚至可以做到几百刀一个月,大部分买家是 SMB 或者大企业里面的 marketing/product/design/research 部门所以也掏不出多少钱。几十万上百万的合同都是当成 agentic transformation 去卖的,讲究一个 enterprise enablement。有些公司内部也在做,walmart CVS 什么的。还是 barrier of entry 太低了

--- 第 33 楼来自 〇〇〇 的回复 (2026-06-17 14:33:09 PDT) ---

VincentY: enterprise integration 这个怎么说 为啥500强ceo都排队找他们呢 这个东西难道不是内部自己也能很快搭一个出来吗 这种公司里应该都是有工程团队的吧

--- 第 34 楼来自 VincentY 的回复 (2026-06-17 14:33:46 PDT) ---

另外 regulated industry 比较喜欢这个东西,因为真人 research 太难做了

--- 第 35 楼来自 〇〇〇 的回复 (2026-06-17 14:34:12 PDT) ---

VincentY: 有些公司内部也在做,walmart CVS 什么的。还是 barrier of entry 太低了 对呢我也是这么想的 但为啥他们可以这么快就10亿美金说ceo找他都得排队

--- 第 36 楼来自 VincentY 的回复 (2026-06-17 14:41:06 PDT) ---

因为技术难度不高(谁做都一样)、落地维护成本高(要有专人负责)、回报不明确(万一觉得没用要能马上扔掉)。企业遇到这种情况一般都倾向于买而不是造轮子。 自己做就要自己负担所有的成本,他做了卖给十个客户平摊成本那就便宜了。经济账很好算,造不如买

--- 第 37 楼来自 〇〇〇 的回复 (2026-06-17 14:45:53 PDT) ---

我没懂 这个又不是啥高难度的东西 两三个人手搓个一两个礼拜不就行了吗 如果是看mirofish的程度 为啥要花几百万去买一个一直要持续付钱的东西

--- 第 38 楼来自 VincentY 的回复 (2026-06-17 14:55:44 PDT) ---

两三个人手搓还是图样图森破了,技术壁垒低也不是这么低的…… 搓个 prototype 和 enterprise solution 是两个世界的东西,salesforce 还没死呢 而且抛开技术不谈,这个东西做出来怎么说服高层用来做商业决策才是最难的地方。要是因为这个亏了几百万谁来背锅,手搓的人背锅吗

--- 第 39 楼来自 〇〇〇 的回复 (2026-06-17 14:56:21 PDT) ---

mirofish您看到过吗 你感觉咋样

--- 第 40 楼来自 UScardAK 的回复 (2026-06-17 15:14:48 PDT) ---

梁文峰:把大家的DS价格打下来,不要怕,我在A股买单

--- 第 41 楼来自 VincentY 的回复 (2026-06-17 15:18:34 PDT) ---

不了解,看了一眼官网不是一个领域的,而且还标榜说什么都能做的就不用往下看了 不能做什么比能做什么更重要。以及不提供 evaluation research 的都可以简单归类成 vibe coded slop