泥潭日报 uscardforum · 每日精选

给新人一个建议:All in RL!

内容摘要

新手应All in RL以抓住未来需求机遇。

1. 关键信息

#1 建议新手抓住机会学习Reinforcement learning,RL需求将爆发。 #5 指出缺乏海量compute resources,RL最多用于atari game等toy model。 #25 认为AI只是提高生产力,代替不了人类思维模式。

2. 羊毛/优惠信息

3. 新兴动态

#6 指出“Reinforced learning”拼写错误。 #17 建议All in RN或学习NP。 #19 提及编程已被Claude Code解决,Anthropic生产力提升200%。

4. 争议或不同意见

#2 预测CS/AI分水岭是预训练,质疑RL造轮子需求。 #3 认为学完出来泡沫已破,ai自己RL自己。 #9 认为赛道太拥挤。 #10 质疑用户名Startrek的All in发言。 #31 指出compute门槛高,普通人难参与。

5. 行动建议

原始内容
--- 第 1 楼来自 Startrek 的回复 (2026-03-25 15:04:08 PDT) ---

如果你不知道之后之后要做什么,无论在学校还是刚入职场,那我建议抓住一切机会学习Reinforcement learning!之后不需要那么多纯software engineer,但是对RL的需求绝对会爆炸。

--- 第 2 楼来自 258 的回复 (2026-03-25 15:05:32 PDT) ---

【引用自 未知】:
大胆预测:今后大学CS/AI专业的分水岭是预训练 学术
不需要那么多人做预训练
有这么多RL造轮子需求?

--- 第 3 楼来自 Wechat 的回复 (2026-03-25 15:06:00 PDT) ---

学完出来泡沫已破,ai自己RL自己

--- 第 4 楼来自 Bryyyan 的回复 (2026-03-25 15:07:46 PDT) ---

搞错论坛了,应该发到母婴论坛

--- 第 5 楼来自 IRS_pro 的回复 (2026-03-25 15:08:06 PDT) ---

没有海量的 compute resources

RL 根本玩不动啊

最多玩玩 atari game 这种 toy model

--- 第 6 楼来自 十柒柒 的回复 (2026-03-25 15:09:33 PDT) ---

【引用自 Startrek】:
Reinforced learning
大哥你ALL IN RL倒是把词打对啊

--- 第 7 楼来自 Nik0major 的回复 (2026-03-25 15:11:20 PDT) ---

不做论述不联系实际的一律视为暴论

--- 第 8 楼来自 Tesla 的回复 (2026-03-25 15:12:46 PDT) ---

哈哈哈 Reinforced learning 绷不住

--- 第 9 楼来自 争取多活两年 的回复 (2026-03-25 15:14:06 PDT) ---

赛道太拥挤了。

--- 第 10 楼来自 Hunterlord 的回复 (2026-03-25 15:16:11 PDT) ---

请大家不要相信一个用户名为Startrek的人的All in发言,如果all in Star Wars已经发大财了

--- 第 11 楼来自 figfig 的回复 (2026-03-25 15:18:34 PDT) ---

新人表示我不信

--- 第 12 楼来自 natesf 的回复 (2026-03-25 15:20:45 PDT) ---

哈哈哈已经笑死

--- 第 13 楼来自 SSST7 的回复 (2026-03-25 15:21:03 PDT) ---

建议all in Real Life

--- 第 14 楼来自 Jimster 的回复 (2026-03-25 15:21:12 PDT) ---

以为是买Ralph Lauren股票,兴冲冲点进来

--- 第 15 楼来自 j824 的回复 (2026-03-25 15:21:54 PDT) ---

【引用自 SSST7】:
建议all in Real Life
楼主就是这个意思!

--- 第 16 楼来自 venusgun 的回复 (2026-03-25 15:22:26 PDT) ---

我还以为是reality labs呢

--- 第 17 楼来自 dancingbro 的回复 (2026-03-25 15:23:06 PDT) ---

OP干什么呢一惊一乍的。建议All in RN,也可以学NP。

--- 第 18 楼来自 benjemin 的回复 (2026-03-25 16:00:17 PDT) ---

我以为你说的Ralph Lauren

--- 第 19 楼来自 jnnksn 的回复 (2026-03-25 16:06:39 PDT) ---

【引用自 jnnksn】:
史上最强工贼,一个人干掉80%同事
编程已经被解决了,这位也是预测今年底
Boris 从 2024 年 11 月起 100% 用 Claude Code 写代码,卸载了 IDE,每天提交 10-30 个 PR。他认为编程作为一项人力密集的技能”已经基本被解决了”。
Anthropic 工程师人均生产力(以 PR 数量计)提升了 200% - 对比 Boris 在 Meta 时期,数百人干一年只能提升几个百分点。
Latent Demand 是 Boris 认为”产品开发中最重要的单一原则”。他现在把它延伸到了”第二维度”:不只观察用户想做什么,还要观察模型想做什么。
CoWork(Claude Code 的图形界面封装)10 天开发完成,增长速度比 Claude Code 初期还快。Boris 自己用它管项目、交停车罚单、回邮件。
Boris 曾离开 Anthropic 加入 Cursor,两周后回来了。原因是发现自己真正在乎的是 Anthropic 的安全使命。
他预测到年底,” 软件工程师”头衔将开始消失,被”Builder”取代。在 Claude Code 团队,PM、设计师、财务都在写代码。
Anthropic 有工程师每月 token 花费达数十万美元。Boris 的建议是:别优化初期成本,先用最强模型跑通。
当编程被解决之后:Claude Code 负责人深度访谈 | RichChat
帖子不能为空

--- 第 20 楼来自 YCShing 的回复 (2026-03-25 16:07:14 PDT) ---

我还以为是去抄底reality labs

--- 第 21 楼来自 Stubhub 的回复 (2026-03-25 16:08:16 PDT) ---

楼主在哪儿高就?

--- 第 22 楼来自 ubnt 的回复 (2026-03-25 16:08:23 PDT) ---

谁能给喂个饭 给个0基础入门roadmap

--- 第 23 楼来自 Edward40 的回复 (2026-03-25 16:09:12 PDT) ---

可解释性是深坑啊

--- 第 24 楼来自 China.No.1 的回复 (2026-03-25 16:09:50 PDT) ---

【引用自 jnnksn】:
史上最强工贼,一个人干掉80%同事
别优化初期成本,先用最强模型跑通
黑人问号脸。。。

--- 第 25 楼来自 Startrek 的回复 (2026-03-25 16:14:47 PDT) ---

【引用自 jnnksn】:
史上最强工贼,一个人干掉80%同事
Anthropic 工程师人均生产力(以 PR 数量计)提升了 200%
那你问anthtropic为啥不fire掉66%的人呢?

其实本质上AI只是提高生产力,代替不了人类的思维模式。

--- 第 26 楼来自 jnnksn 的回复 (2026-03-25 16:16:21 PDT) ---

【引用自 Startrek】:
那你问anthtropic为啥不fire掉66%的人呢?
【引用自 未知】:
码农是不是工作几年就可以自己办身份了 搬砖
Amazon 2027替代所有员工警告

--- 第 27 楼来自 LeoQ8 的回复 (2026-03-25 16:17:53 PDT) ---

我也以为是这个

--- 第 28 楼来自 r02941098 的回复 (2026-03-25 16:19:36 PDT) ---

學炒股,不會被AI取代

--- 第 29 楼来自 pandaman 的回复 (2026-03-25 16:23:23 PDT) ---

怎么可能,现在的LLM从业者,有需要懂LLM吗?大部分人都是API call,prompt engineering,到时候换成其他什么,都是一样的,做来做去,都是SDE需要的那些换汤不换药。造轮子的工作,十个人一起干活都嫌多。

--- 第 30 楼来自 rebellisa 的回复 (2026-03-25 16:47:02 PDT) ---

现在买真可以 W底

--- 第 31 楼来自 Ava.太太太后 的回复 (2026-03-25 17:01:06 PDT) ---

哈哈 以为真的是什么绝世赛道,点进来发现RL都打错了 不过说真的compute门槛在那,普通人很难玩起来