【呼唤ai大神】llm模拟器真的能预测未来?
LLM行为模拟预测未来被指为Scam,企业买单源于风险规避而非技术壁垒
关键信息
- 核心讨论:用户@〇〇〇质疑基于LLM的“生成式智能体”(Generative Agents, 引用论文 arxiv:2304.03442)能否真正预测人类行为及未来,并指出其融资额高但技术本质疑似“套皮”。
- 项目背景:涉及斯坦福HCI PhD背景团队,获得李飞飞、Andrej Karpathy等知名投资人支持,声称500强CEO排队咨询,主要面向保险公司、服装公司等商业客户 #1, #4, #9。
- 技术原理:通过控制变量让LLM模拟特定情境下的人类行为交互,用于商业决策辅助或原型测试 #1。
争议与不同意见
- 看空派(主流观点):
- 理性/看多派:
经验与数据点
- 企业采购逻辑:
- 技术对比:
- 学术现状:
风险/限制/注意事项
https://www.youtube.com/watch?v=lfhFmwcESRw https://www.youtube.com/watch?v=1RrPDLUcVqw 公司有一些相关业务 最近一直在讨论这类所谓的人类社会或者商业预测 本质上他们就是用llm在一些特定情况下控制一些变量跑一些模拟然后卖给商业公司 这人说的神乎其神 500强ceo排着队找他问未来是什么… 保险公司 服装公司啥的 这种公司有壁垒吗 如果就是llm套一些对话模拟 真的能预测人类未来 或者即使真的可以为啥公司自己不做要买他的这个大语言模型套皮 他们的起源应该都是这篇paper吧 感觉没啥突破啊 除了当时真的出圈了 商业公司真的愿意花几千万买这结果? https://arxiv.org/abs/2304.03442 https://arxiv.org/abs/2304.03442 Believable proxies of human behavior can empower interactive applications ranging from immersive environments to rehearsal spaces for interpersonal communication to prototyping tools. In this paper, we introduce generative agents--computational... 有真的ai学术大神指导一下么
〇〇〇: 这种公司有壁垒吗 如果就是llm套一些对话模拟 真的能预测人类未来 或者即使真的可以为啥公司自己不做要买他的这个大语言模型套皮 现在99%的AI startup都是scam
没啥ruan用
这些玩意融资了一两亿了 李飞飞 andrej karpathy这些人也投
飞飞最喜欢scam了
没点开视频,看着封面 被采访者的样子就感觉悬 (像college dropout的)
本质捞一笔跑路
感觉不如mirofish
这人应该斯坦福hci phd
你说行,那就行,不狡辩
为啥愿意付钱这事我不懂啊
258: mirofish 对 感觉原理是一样的 只不过他们名门正派能融资 话说回来这玩意真能预测未来?
怎么说?
我做过一点robotics,很多都是飞飞他们占完坑之后,就再也没动过了,方法论也有问题。
jlhqw187: 很多都是飞飞他们占完坑之后 然后他们又成为教母了吗
不过话说回来AI大家都这么做,不然citation也不会是别的领域好多倍了
那为啥所有人不全都占坑
有名气的人发和没名气的人发得到的关注度是不一样的,通过审核的难度也不一样。
现在不都可以self publish了吗
这个不太清楚了,我也就是小白,自己的一点观察和别人的分享,不一定正确。
能预测spx每日收盘价就不需要融资了
哈哈哈哈那肯定不行啊 好像说只能预测人类
先预测下每日QQQ, SPY趋势
股价不也是人类活动产生的结果吗
反正要是行 那老哥不需要买股份一个亿了 自己赚就行了
我的评价是不如玩模拟人生
能的。听说过心灵历史学家么。
查了一下,我之前脑子里有一个类似的科幻idea,然后发现原来是阿西莫夫玩剩下的
所以没什么人看arxiv了啊
懂了,少数派报告,预测各位潭友要犯罪先抓起来 最近东大不是有根据发言预测了已经
〇〇〇: hci BIG RED FLAG
不能预测未来,但是这东西有用的地方是对标以前完全没有模拟的情况。做决策靠 finger in the wind 的情况在企业里太常见了,有模拟总比没有好。 〇〇〇: 本质上他们就是用llm在一些特定情况下控制一些变量跑一些模拟然后卖给商业公司 所有用 LLM 的方案都能这么说,归根结底 LLM 看到还是 prompt 〇〇〇: 这种公司有壁垒吗 economy of scale,做大了成本就低了。千万级别那是做梦 。barrier of entry 不在技术而是画饼和 enterprise integration (但也可以说大部分 enterprise solution sales 都是这样) 做 synthetic persona 的 startup 现在非常多,走 SaaS 模式的甚至可以做到几百刀一个月,大部分买家是 SMB 或者大企业里面的 marketing/product/design/research 部门所以也掏不出多少钱。几十万上百万的合同都是当成 agentic transformation 去卖的,讲究一个 enterprise enablement。有些公司内部也在做,walmart CVS 什么的。还是 barrier of entry 太低了
VincentY: enterprise integration 这个怎么说 为啥500强ceo都排队找他们呢 这个东西难道不是内部自己也能很快搭一个出来吗 这种公司里应该都是有工程团队的吧
另外 regulated industry 比较喜欢这个东西,因为真人 research 太难做了
VincentY: 有些公司内部也在做,walmart CVS 什么的。还是 barrier of entry 太低了 对呢我也是这么想的 但为啥他们可以这么快就10亿美金说ceo找他都得排队
因为技术难度不高(谁做都一样)、落地维护成本高(要有专人负责)、回报不明确(万一觉得没用要能马上扔掉)。企业遇到这种情况一般都倾向于买而不是造轮子。 自己做就要自己负担所有的成本,他做了卖给十个客户平摊成本那就便宜了。经济账很好算,造不如买
我没懂 这个又不是啥高难度的东西 两三个人手搓个一两个礼拜不就行了吗 如果是看mirofish的程度 为啥要花几百万去买一个一直要持续付钱的东西
两三个人手搓还是图样图森破了,技术壁垒低也不是这么低的…… 搓个 prototype 和 enterprise solution 是两个世界的东西,salesforce 还没死呢 而且抛开技术不谈,这个东西做出来怎么说服高层用来做商业决策才是最难的地方。要是因为这个亏了几百万谁来背锅,手搓的人背锅吗
mirofish您看到过吗 你感觉咋样
梁文峰:把大家的DS价格打下来,不要怕,我在A股买单
不了解,看了一眼官网不是一个领域的,而且还标榜说什么都能做的就不用往下看了 不能做什么比能做什么更重要。以及不提供 evaluation research 的都可以简单归类成 vibe coded slop