泥潭日报 uscardforum · 内容汇总

突发!claude-code 最新版本代码泄漏

内容摘要

Claude Code源码旧闻讨论转向脏话与训练数据来源。

1. 关键信息

  • 核心内容:楼主(ID: IrishCoffee)发布所谓 Claude Code 源码泄漏消息并附带官方 GitHub 链接。
  • 真实性:多位用户指出该项目本就在官方 GitHub 上公开,并非隐私泄漏;版本 2.1.88 的讨论在一个月前就已出现。
  • 代码规模:据引用信息,该项目包含 1880+ 文件、51 万行代码,涵盖 40+ 种内置工具。
  • 脏话现象:用户 #14 @Divinealex 发现 Claude 会主动说脏话并附截图;#15 @hoodl 认为可能与蒸馏 DeepSeek 有关;#16 @IrishCoffee 推测中文语料基调导致;#17 @收束观测者 调侃可能将“我操”映射到 bravo;#18 @Keiour 提供英文脏话截图,认为训练集清洗程度低、包含口语化资料;#19-#21 讨论 LLM 骨子里是红迪人,因预训练数据大量 Reddit 语料;#22 @qwaszx 感觉 DeepSeek 扒了小红书,国外模型没有。

2. 羊毛/优惠信息

3. 最新动态

  • Claude Code 作为一个终端 Agentic coding tool,支持文件操作、搜索获取及代码执行等核心功能。
  • 评论区流传相关技术解析视频及博文。
  • 新增讨论转向 Claude 的脏话输出,涉及训练数据来源(Reddit、小红书等)及清洗程度。

4. 争议或不同意见

  • 时效性争议:#2, #4, #7 等用户一致认为这是“上个月的旧闻”,讽刺楼主“突(上个月)发”。
  • 动机质疑:#6 认为楼主作为钛金会员在“水贴”博关注;#8 怀疑这是 Anthropic 官方的免费广告营销手段。
  • 脏话成因分歧:#15 主张蒸馏 DeepSeek 导致;#16 认为中文语料问题;#18 否认语言特异性,强调训练集清洗少;#22 指出 DeepSeek 可能用了小红书数据而国外模型没有。

5. 行动建议

  • 开发者:可直接访问官方 GitHub 查看源码,研究其 Agent Loop 及内置工具实现,无需寻找“泄漏版”。
  • 坛友:发布新闻前建议先进行关键词检索,避免搬运已过时的内容,维持论坛信息质量。
  • 对脏话讨论感兴趣的坛友:可进一步查找 Claude 官方说明或对比不同语言模型的训练数据构成。
原始内容
--- 第 1 楼来自 IrishCoffee 的回复 (2026-04-01 11:21:06 PDT) ---

github.com

GitHub - anthropics/claude-code: Claude Code is an agentic coding tool that lives...

Claude Code is an agentic coding tool that lives in your terminal, understands your codebase, and helps you code faster by executing routine tasks, explaining complex code, and handling git workflows - all through natural language commands.

--- 第 2 楼来自 catnipball 的回复 (2026-04-01 11:21:51 PDT) ---

上个月的旧闻了(

--- 第 3 楼来自 Pocky 的回复 (2026-04-01 11:22:36 PDT) ---

而且link的还是他们家Github的,这个一直有

--- 第 4 楼来自 webmaster 的回复 (2026-04-01 11:24:07 PDT) ---

突(上个月)发

--- 第 5 楼来自 noby 的回复 (2026-04-01 11:25:21 PDT) ---

April fools?

--- 第 6 楼来自 weiweiwieweieiw2192 的回复 (2026-04-01 11:28:00 PDT) ---

舊聞了 已經鈦金就不用水吧…..

--- 第 7 楼来自 llian 的回复 (2026-04-01 11:29:03 PDT) ---

仿佛是昨天的事,愣了一下,确实是上个月

--- 第 8 楼来自 weiweiwieweieiw2192 的回复 (2026-04-01 11:29:41 PDT) ---

上個月有 前兩天也有 根本是故意反正這樣廣告不用錢

--- 第 9 楼来自 klaxien 的回复 (2026-04-01 11:36:05 PDT) ---

image2000×1164 360 KB

--- 第 10 楼来自 weiweiwieweieiw2192 的回复 (2026-04-01 11:36:54 PDT) ---

ai 固定發文?

--- 第 11 楼来自 masue 的回复 (2026-04-01 11:39:08 PDT) ---

【引用自 未知】:
Claude Code 源码大揭秘 搬砖
Claude Code 源码大揭秘:40+ 工具全解析
当你向 Claude Code 输入一条消息时,背后究竟发生了什么?这篇视觉指南带你深入源码,拆解从按键到渲染的完整 Agent Loop。项目包含 1880+ 文件、51 万行代码,涵盖 40+ 种内置工具和 80+ 条命令。你可以探索文件操作、代码执行、搜索获取等核心功能,甚至发现那些尚未发布的隐藏特性。无论是日常工作流还是高级调试,这…
【引用自 未知】:
claude code 源码泄露 搬砖
泄露版本是2.1.88,各家可以学习起来了
看来是vibe coding把source map传上npm了

--- 第 12 楼来自 收束观测者 的回复 (2026-04-01 11:57:36 PDT) ---

我左看右看第一个帖就是楼主的,为啥还突发

--- 第 13 楼来自 adu 的回复 (2026-04-04 22:49:47 PDT) ---

https://www.youtube.com/watch?v=E2tD6Jjzx0k

--- 第 14 楼来自 Divinealex 的回复 (2026-05-12 22:59:57 PDT) ---

话说Claude为什么会主动说脏话? /uploads/short-url/xdmcg7woW9cbrh1dG3SbAryU5hZ.png?dl=1

--- 第 15 楼来自 hoodl 的回复 (2026-05-12 23:38:57 PDT) ---

可能是蒸了DeepSeek。 /uploads/short-url/haNuZnprOBUbK70q8OOCOG4xDy1.jpeg?dl=1

--- 第 16 楼来自 IrishCoffee 的回复 (2026-05-12 23:48:41 PDT) ---

会不会跟语言有关。 如果英语可能会比较文明的。 中文语料的基调可能就这样。

--- 第 17 楼来自 收束观测者 的回复 (2026-05-12 23:51:00 PDT) ---

可能把 “我操” map到 bravo 了

--- 第 18 楼来自 Keiour 的回复 (2026-05-12 23:53:36 PDT) ---

/uploads/short-url/9T4uvhboBtCT1rogtivbsGUiQCm.jpeg?dl=1 放心,英语也有。 大概说明A\清洗训练集的程度比较少,以及训练集里面有不少口语或者口语化的资料

--- 第 19 楼来自 收束观测者 的回复 (2026-05-13 00:01:50 PDT) ---

想起来那个帖子说LLM骨子里都是红迪人

--- 第 20 楼来自 Keiour 的回复 (2026-05-13 00:09:21 PDT) ---

Reddit倒也真把自己数据卖给训练LLM的公司了

--- 第 21 楼来自 收束观测者 的回复 (2026-05-13 00:10:13 PDT) ---

是啊,就是因为各家预训练数据大量红迪语料

--- 第 22 楼来自 qwaszx 的回复 (2026-05-13 05:14:15 PDT) ---

但是我感觉ds扒了xhs,国外的好像没有