除了全都买之外，如何保证一直用上最佳ai订阅？

🛍️ 败家作者 See 2026-05-01 12:27 PST 原帖 #502876 ↗

内容摘要

按月切换、开源工具、agent 分工、token 付费及架构优化控制 AI 订阅成本。

1. 关键信息

#5 @Hali 建议按月订阅，不好用就换另一家，利用 claude-mem、agents.md、claude.md 等自动同步技能，并用 cc-switch 切换模型。
#9 @Hali 分享两个 GitHub 项目：cc-switch（跨平台 AI 助手工具）和 claude-mem（自动记录 Claude 会话并注入上下文）。
#13 @Hali 推荐 caveman（减少 65% token 的 Claude Code 技能）、skills 仓库及外骨骼框架（superpowers、gstack、everything-claude-code 等）。
#17 @Gpg12 推荐 OpenRouter（按 token 付费，简单任务可用更便宜甚至免费模型）。
#23 @Hali 分享 CLIProxyAPI（将 Gemini CLI、ChatGPT Codex 等包装成兼容 API，享受免费模型），并提醒用 AMEX 改地址到 DE 免税。
#30 @Hali 分享 grillme、CMUX（tmux 的 fork，支持多 workspace）、Ghostty-based terminal（cmux）、Warp 终端等工具，并推荐 B 站 AI 日报、YouTube 的 brigemind/bridgecode（Jarvis 自动分配任务给多个 agent）。
#32 @Hali 演示 CMUX 可开十几个 terminal workspace，并介绍 bridgecode 中 Jarvis 自动分配任务。
#33 @AppleVisionPro 强调 ChatGPT 的 Custom instructions 类似 claude.md，可定义输出格式（如先 tldr、禁用表情包），并指出 Gemini 不能强制 web search，分析股市时胡扯。
#34 @Hali 强调多用 skill、勤用 skill，plan 好再干，避免绕圈子；skill.md 又长又臭但 AI 最爱，挑选顺手 skills 即可。
#35 @Skwbs 认为用 Copilot 就能覆盖所有需求。
#37 @CatGPT 指出 Gemini CLI 是免费版里最好的。
#39 @Hali 解释学生自费买 AI 是为了找工作，并提到前司 GPT、unpaid intern 用 GPT 给老板干活。
#41 @Hali 展示自己一天用 API 烧掉 200 美元（40 小时同时干 1-2 个 project），并用 AI 完成 OS project（一两百行 C 代码）。
#43 @Hali 自称 CS 快毕业没写过代码，全靠 GPT，考试靠背。
#44 @gggideon 反馈 skills 烧 token 严重，初体验确认烧得离谱，5x plan session limit 很快用完。
#45 @Hali 认为 skills 虽烧 token 但避免走弯路，选对方向最重要。
#46 @CatGPT 解释 skill 是按需才 load 进 context，平时只 load description，可能 request 对某些 skill 依赖大。
#47 @sukasky 指出 Gemini 的 custom instructions 经常没用，写了跟没写一样。
#49 @gggideon 反馈未 load skill 时 token 消耗也异常，怀疑与安装的 agents/skills 有关。
#50 @AppleVisionPro 确认 ChatGPT 的 custom instructions 好用，Gemini 格式记得住但内容容易忘。
#63 @Onvon 介绍 OpenRouter 的 auto 模型（openrouter/auto），可提供一串 predefined 模型 ID，根据 prompt 复杂程度自动选择；也可自己用便宜小模型/NLP 搓简单 router。
#64 @gggideon 反馈 token 消耗问题：使用 plan-like skills 后 cc 写 md 读写花了很多 token；让 cc 分析 session token 消耗用了 10% session 额度；caveman-mode 花了 30k token 新开 session 跑简单 prompt；怀疑刚装了几个 repo 导致 skills 太多，以及 caveman hooks 影响。
#65 @Onvon 建议用排除法定位 token 消耗问题：先 disable 一个 plugin，然后/rewind 回到之前的问题再问一次，重复直到找到问题；一个 plugin 里可能有很多 skill，但 skill 数量多没关系（自己有 100 多个 skills 从未 1m context 不够用）；如果 repo 复杂，可以用/init 让 Claude 生成类似导览的 claude.md 文件，每次 plan 会先看那个文件。
#67 @Onvon 说明本地跑开源大模型 vram 消耗大，128g Mac Mini 勉强跑一个 Claude Haiku/GPT-5.4-mini 级别的模型。
#69 @Onvon 解释如果使用订阅或 API key，10 年前的破笔电都能跑 Claude Code/agent harness，本身无性能需求。
#70 @See 反馈 20 刀档次订阅 quota 用完要等 3-5 小时，不敢直接连 API。
#71 @Onvon 建议做 agent 分工：只用 opus 或 5.5xh 来 planning，用便宜模型执行；推荐 deepseek v4 pro（实力略高于 Claude Sonnet 4.6，有时能摸到 opus 的边，价格极便宜，码一天不到 1 块），以及 codex2 人套餐（链接：https://www.uscardforum.com/t/topic/502565）。
#72 @See 表示完全不懂 agent 分工，需要学习。
#74 @Hali 推荐 claude 200 刀订阅，强调时间也是钱，2 个来回能解决不要兜圈子 10 个来回；展示自己用 opus 4.7 high + sonnet subagents 的用法，并指出 medium 比 high/xhigh 少很多 usage，如何安排模式（xhigh plan、medium 干活）。
#75 @Jasz 反馈 Claude 4.7 之后花费很高，连 max 都不够用，感觉没做什么就用完了。
#76 @Jasz 询问 codex 2 人套餐没了，求问哪里还能找到。
#77 @gggideon 反馈最近莫名出现一些 sonnet usage（约 6%），询问是否需要用户端设置；5x 用户觉得一点不够用。
#79 @Hali 解释 sonnet usage 可能是 skills 自动安排便宜的 subagents，sonnet 跟 weekly limit sync 即可；自己买 AI 是为了找工作，玩了一个月变相省钱。
#80 @donk666 建议直接用 API（钞能力）。
#81 @搞钱不到钱只能玩卡认为直接 API 比订阅便宜，除非能烧回本否则不考虑订阅。
#82 @See 安慰 Hali 工作肯定有，但美国 NG 年薪期望值比实际低 3.2 万，中国 NG 期望值与实际接近。
#83 @Onvon 补充说明：Claude Code 自带的 CC（Claude Code）很多时候会让默认的小模型（一般是 Haiku 有时是 Sonnet）去做工具调用和总结等简单任务，即使把模型设置成 Opus，Claude Code 也并非所有工作都用 Opus 执行。
#84 @zuiaiwufan 建议架构分工：先让牛逼的 staff engineer 做好架构，然后让 SDE1 实现功能，最后弄一个 lead/manager agent 管理最终交付质量，用户无需管理。
#85 @See 评论：能替代这么多？难怪埋塔大裁员。

2. 羊毛/优惠信息

#23 @Hali 提醒用 AMEX 改地址到 DE 免税。
#71 @Onvon 推荐 deepseek v4 pro（码一天不到 1 块）及 codex2 人套餐（原链接：https://www.uscardforum.com/t/topic/502565，但#76 反馈已失效）。
#81 @搞钱不到钱只能玩卡认为直接 API 比订阅便宜（无具体卡号，但强调成本优势）。

3. 最新动态

#1 引用 deeplearning.ai 报告：GPT-5.5 性能下降，撒谎率从 7% 升至 29%；Gemini 3.1 Pro Preview 跌至季军。
#10 @dhcp 建议用开源 router 替代 Perplexity。
#18 @Hali 展示自己一天用 API 烧掉 200 美元的例子。
#30 @Hali 分享多个新工具：grillme、CMUX、cmux、Warp、bridgecode，并推荐 B 站 AI 日报。
#33 @AppleVisionPro 对比 ChatGPT 与 Gemini：ChatGPT 可玩性更强，Gemini 不能强制 web search。
#37 @CatGPT 认为 Gemini CLI 是免费版里最好的。
#44-#46 #49 讨论 skills 烧 token 问题：按需加载但实际消耗大，

原始内容

--- 第 1 楼来自 See 的回复 (2026-05-01 12:27:32 PDT) ---

https://info.deeplearning.ai/e3t/Ctc/LX+113/cJhC404/VWlFx_3F4rdLW68VMJn7WPMCFW2lg-cV5Ny350N4Mwsfs3qgz0W6N1vHY6lZ3kMN3BcsFxw_fN5W5rGt4V1GsdQrW4slcxG1C1jdrW28z9mZ3FgsF4W2gLs2H7KfD83W44wf2b3kG7PkW78CV0W1pFlKVW2vVxBx4dS49KW5k03Rj2z97nKW1F91nP7Rg_v-W7LsSrx7sf9pfW1DFcvf85mKlxW6ZL-5s5JY4FrW5jyqQ45Yqcy0W6_BqLK1Q52VvW6xt-5x4stx8jW71V9-f76314WVLSVDK57J-5BW8wWCQy5NnyfCW4TS1Lb24pMbQW1NCkz91vnKDYW6JFL5w4JmWjsf1TX_RR04 GPT-5.5 knows more than its peers, but it answers incorrectly more often and acknowledges ignorance less often. https://info.deeplearning.ai/e3t/Ctc/LX+113/cJhC404/VWlFx_3F4rdLW68VMJn7WPMCFW2lg-cV5Ny350N4Mwsgl3qgz0W8wLKSR6lZ3prW5TNhmR18GTjhW8JpGK42TdD3_VVZB2q2PsDz1W3l6B0F2N1-b5W5F8BgX8dQ9JDW6p6TfK4n8dtgN51rQNy-f91LW92yD2f1mXBbyW83tn4q7m4wXhVKv_rQ2H-DNkW2wXZPh4x6TLfW24yN978L2Bq4W7Fl1tC3WKyYZN3Yl5NSWPdFyW3P3NJT6R5wv8W5w6P-q13VcjMW2S0h6S7h10-9W3yYV6v3dCJt5W4HDCpk2_qYS-VFgN5F2sgD5WVmJS3S6P68hHW3fblyy8nJHjwVg45-Z5GGRm1W8Jsx-f1kc-6XW51j7CR6xl19_W6GPj-z1gt3RrW75j_9N67BQxkW3Jk0Fl7L-7W-f6-jjkP04GPT-5.5 lied about completing an impossible programming task in 29 percent of samples, a significant jump from GPT-5.4’s 7 percent. GPT-5.5 is the fourth flagship launch since February, following Anthropic Claude Opus 4.7, GPT-5.4, and Google Gemini 3.1 Pro Preview. 狗家双子座圣斗士跌到季军。每隔一段时间这个榜就要刷一次，难道我们总要经常换ai么？怎么花最少的钱获得最佳使用体验，难道都去用perplexity？集思广益，潭友们分享的方法：自动sync skills https://www.uscardforum.com/t/topic/502876/5 /c/shopping/20 一个月一个月定就好了，不好用就换另一家反正claude-mem，agents.md, claude.md里面基本都有，让他们自己sync，github也有吧？cc-switch有mem有skills，只是接另外一个模型肯定不可能只用一家的，每家都有自己擅长的就比如paperclip自己设置CEO等各种重要的用贵的模型，下面打工仔用中等的/便宜的干苦力活，比如决策框架用opus，打工用s… https://www.uscardforum.com/t/topic/502876/9 /c/shopping/20 我自己用的然后我们做project，agent自己也会写progress文档，别的ai读一下就知道啥了 https://www.uscardforum.com/t/topic/502876/13 /c/shopping/20 错了等下强推这些是让ai自己学会的基础的外骨骼 Router法：

--- 第 2 楼来自 xxxyyy 的回复 (2026-05-01 12:28:55 PDT) ---

差距不大不用换，你又不是搞research非得什么都用SOTA

--- 第 3 楼来自 gggideon 的回复 (2026-05-01 12:28:56 PDT) ---

蹲一个，主要perplexity也不好用（不过我更在意coding tool

--- 第 4 楼来自 OSR 的回复 (2026-05-01 12:29:17 PDT) ---

经常换也是一个办法但是要重新练有点麻烦了

--- 第 5 楼来自 Hali 的回复 (2026-05-01 12:31:16 PDT) ---

一个月一个月定就好了，不好用就换另一家反正claude-mem，agents.md, claude.md里面基本都有，让他们自己sync，github也有吧？cc-switch有mem有skills，只是接另外一个模型肯定不可能只用一家的，每家都有自己擅长的就比如paperclip自己设置CEO等各种重要的用贵的模型，下面打工仔用中等的/便宜的干苦力活，比如决策框架用opus，打工用sonnet/国产

--- 第 6 楼来自 See 的回复 (2026-05-01 12:31:49 PDT) ---

我用它来批判其他ai的输出，还挺有用，因为都有出处，但别的功能确实不好用。

--- 第 7 楼来自 See 的回复 (2026-05-01 12:32:56 PDT) ---

你怎么搞能无缝切换？像楼上说的重新训练麻烦呐

--- 第 8 楼来自 AppleVisionPro 的回复 (2026-05-01 12:33:45 PDT) ---

充钱买api, 谁家强就用谁家, 毫无负担

--- 第 9 楼来自 Hali 的回复 (2026-05-01 12:34:12 PDT) ---

我自己用的 https://github.com/farion1231/cc-switch https://github.com/farion1231/cc-switch A cross-platform desktop All-in-One assistant tool for Claude Code, Codex, OpenCode, openclaw & Gemini CLI. https://github.com/thedotmack/claude-mem https://github.com/thedotmack/claude-mem A Claude Code plugin that automatically captures everything Claude does during your coding sessions, compresses it with AI (using Claude's agent-sdk), and injects relevant context back into future sessions. 然后我们做project，agent自己也会写progress文档，别的ai读一下就知道啥了

--- 第 10 楼来自 dhcp 的回复 (2026-05-01 12:34:23 PDT) ---

搬出老图用perplexity还不如用开源的router /uploads/short-url/zHDBclpmyOfouOT5ykBXSkcoeqr.jpeg?dl=1

--- 第 11 楼来自 Rosmontis 的回复 (2026-05-01 12:34:36 PDT) ---

chatgpt挺好的。chatbot能用，deepthink找论文挺好，pro解难题挺好，codex用来应付简单编程任务挺好额度也给的挺足。其他两家略微有点硬伤，gemini CLI基本属于完全用不了级别，claude的deepthink和chatbot一般般，没有pro级别的模型。

--- 第 12 楼来自 See 的回复 (2026-05-01 12:34:46 PDT) ---

你这个好高级，我得花时间研究下。

--- 第 13 楼来自 Hali 的回复 (2026-05-01 12:35:07 PDT) ---

错了等下强推 https://github.com/JuliusBrussee/caveman https://github.com/JuliusBrussee/caveman 🪨 why use many token when few token do trick — Claude Code skill that cuts 65% of tokens by talking like caveman 这些是让ai自己学会的基础的 https://github.com/mattpocock/skills https://github.com/mattpocock/skills Skills for Real Engineers. Straight from my .claude directory. https://www.star-history.com/forrestchang/andrej-karpathy-skills/ https://www.star-history.com/forrestchang/andrej-karpathy-skills/ A single CLAUDE.md file to improve Claude Code behavior, derived from Andrej Karpathy's observations on LLM coding pitfalls. — 98.1k stars, 7 contributors, This week: +3.2k stars https://www.star-history.com/addyosmani/agent-skills/ https://www.star-history.com/addyosmani/agent-skills/ Production-grade engineering skills for AI coding agents. — 25.7k stars, 17 contributors, This week: +668 stars 外骨骼 https://github.com/obra/superpowers https://github.com/obra/superpowers An agentic skills framework & software development methodology that works. https://github.com/garrytan/gstack https://github.com/garrytan/gstack Use Garry Tan's exact Claude Code setup: 23 opinionated tools that serve as CEO, Designer, Eng Manager, Release Manager, Doc Engineer, and QA https://github.com/affaan-m/everything-claude-code https://github.com/affaan-m/everything-claude-code The agent harness performance optimization system. Skills, instincts, memory, security, and research-first development for Claude Code, Codex, Opencode, Cursor and beyond. https://github.com/VoltAgent/awesome-design-md https://github.com/VoltAgent/awesome-design-md A collection of DESIGN.md files inspired by popular brand design systems. Drop one into your project and let coding agents generate a matching UI.

--- 第 14 楼来自 See 的回复 (2026-05-01 12:36:31 PDT) ---

你用的开源router分享下呗

--- 第 15 楼来自 AppleVisionPro 的回复 (2026-05-01 12:37:33 PDT) ---

我现在也感觉是chatgpt个人用综合最好在公司opus随便烧, 自己的project, 20刀会员送的codex也能用, 问答上chatgpt经过调教也比Gemini好

--- 第 16 楼来自 See 的回复 (2026-05-01 12:38:50 PDT) ---

AppleVisionPro: 问答上chatgpt经过调教分享下你的育ai儿经？

--- 第 17 楼来自 Gpg12 的回复 (2026-05-01 12:39:10 PDT) ---

用openrouter吧，pay-per-token，溢价不多而且一些简单task可以用更便宜甚至免费的model

--- 第 18 楼来自 Hali 的回复 (2026-05-01 12:42:30 PDT) ---

今天就干了十几句话真API的话烧不起 /uploads/short-url/wuK2RTHfQOdwr89mm552mmoTR7E.png?dl=1 /uploads/short-url/5WnEXPYAJMXEN3aXo8zFQrqRREl.png?dl=1 200刀就这样了 /uploads/short-url/78PMQWzPg8jug4iSMyIZQzFfSLs.png?dl=1

--- 第 19 楼来自 See 的回复 (2026-05-01 12:44:13 PDT) ---

放到主楼了 Hali: 强推 Gpg12: 用openrouter吧

--- 第 20 楼来自 AppleVisionPro 的回复 (2026-05-01 12:44:51 PDT) ---

首先知道什么问题用什么模式问, 很多人只会默认模式, 答案自然错的 Custom instructions 我把它当成claude.md玩, 写的太长了. 吐槽一句, chatgpt的前端做得太差, 现在编辑都很难, 现在基本上只append

--- 第 21 楼来自 Hali 的回复 (2026-05-01 12:46:06 PDT) ---

cc-switch setting里面就有sync skills 具体怎么玩我也在学 skills不是越多越好（穷），那几个gstack，ECC，superpowers很多重复的，选择几个自己用的顺手的就行了隔壁有CPA可以好几个号混在一起当API用，昨晚看得头大了还没弄 /uploads/short-url/5P44mY0vsoU6dNWMQVKMKH9aAcM.png?dl=1

--- 第 22 楼来自 gggideon 的回复 (2026-05-01 12:47:17 PDT) ---

现在这个时代真感觉脑子学习能力跟不上技术进步的脚步

--- 第 23 楼来自 Hali 的回复 (2026-05-01 12:48:07 PDT) ---

真的是学都不去上，每天在家十几个小时看，除了吃饭洗澡睡觉，躺床上也是看AI，越看越睡不着，几个东西一直开着给电脑干的呼呼响（m4 pro），干到后面都不知道干到哪了学不完的，找个方向跟上就行了，啥都学没那精力 https://github.com/router-for-me/CLIProxyAPI https://github.com/router-for-me/CLIProxyAPI Wrap Gemini CLI, Antigravity, ChatGPT Codex, Claude Code as an OpenAI/Gemini/Claude/Codex compatible API service, allowing you to enjoy the free Gemini 3.1 Pro, GPT 5.5, Claude model through API 很多小众的模型会免费，其他按需收费，现在大模型基本上全球一个价格，不同地方付款不会差太多的，我还自己去折腾中国的，可能便宜点，后俩发现 .com 和 .io/ai 放在STT会request timeout，延迟大，coding没事，实时的还是走国际的都玩泥潭了记得AMEX改到DE去无税 https://openrouter.ai https://openrouter.ai The unified interface for LLMs. Find the best models & prices for your prompts

--- 第 24 楼来自 See 的回复 (2026-05-01 12:59:43 PDT) ---

https://learn.deeplearning.ai/courses/ai-prompting-for-everyone/information https://learn.deeplearning.ai/courses/ai-prompting-for-everyone/information Become an AI power user in this new course taught by Andrew Ng. From finding information to building apps, you'll develop the prompting skills that get real, useful results from today's most powerful AI models. 你指的是学好prompting么？

--- 第 25 楼来自 Hali 的回复 (2026-05-01 13:00:35 PDT) ---

现在的聪明多了

--- 第 26 楼来自 See 的回复 (2026-05-01 13:03:36 PDT) ---

你这是真》沉浸式体验 Hali: 每天在家十几个小时看，除了吃饭洗澡睡觉，躺床上也是看AI

--- 第 27 楼来自吃货不吐葡萄皮的回复 (2026-05-01 13:04:52 PDT) ---

请问antigravity里用opus和Claude code里用opus的差别到底有多大？

--- 第 28 楼来自 See 的回复 (2026-05-01 13:04:56 PDT) ---

好的！感谢分享啊。我学渣还得多加时间学习才行。

--- 第 30 楼来自 Hali 的回复 (2026-05-01 13:06:43 PDT) ---

还有个很好玩的，grillme，我等下试试 /uploads/short-url/yq600Tn6i9PK36GPVIfJhjILG2X.png?dl=1 跟这个topic没关的，多线程操作 CMUX https://github.com/tmux/tmux https://github.com/tmux/tmux tmux source code TMUX https://github.com/manaflow-ai/cmux https://github.com/manaflow-ai/cmux Ghostty-based macOS terminal with vertical tabs and notifications for AI coding agents WARP https://github.com/warpdotdev/warp https://github.com/warpdotdev/warp Warp is an agentic development environment, born out of the terminal. b站很多AI自动生成的日报周报多看看三五分钟积攒经验就当是泥潭快报科技版现在缺的是idea和能实现他的model，自己手搓（没能力，没精力，浪费钱）有时候看到某某东西，发现刚好就是能补齐的最后一块拼图，赶紧去试着用了，或者日积月累经验

--- 第 31 楼来自 See 的回复 (2026-05-01 13:10:25 PDT) ---

这些都是做什么use cases的？

--- 第 32 楼来自 Hali 的回复 (2026-05-01 13:12:21 PDT) ---

大概这样 /uploads/short-url/dQ1SNKCGjA51StSx66nvKW3bjLH.png?dl=1 开十几个terminal真顶不住一个个拉很痛苦这个就可以好多workspace并存，project 1 2 3… 然后里面开几个都行，除了废眼睛我有在看YouTube的brigemind，他搞了个bridgecode，右边是Jarvis，跟他讲话他就自动开几个你想要的页面，然后他会自动分配任务给每个不同的agent，Jarvis会说话有反馈 https://www.youtube.com/watch?v=xKf0B6AEo9I

--- 第 33 楼来自 AppleVisionPro 的回复 (2026-05-01 13:15:41 PDT) ---

差不多就是Ng的样子和Hali回答的的样子你就把Custom instructions 当成personal claude.md 写告诉输出要什么样. 我会要它每次先tldr, 不要放表情包等等还有自定义/short, 基于本来要给答案只给个总结 chatgpt的可玩性比Gemini强太多了. Gemini居然不能强制web search, 让他分析当天股市就是在胡扯

--- 第 34 楼来自 Hali 的回复 (2026-05-01 13:19:11 PDT) ---

对反正多用skill，勤用skill，没干活前plan好，比之后绕圈子费时费劲，推倒重来强虽然skill.md又长又臭，又不是自己看，ai最爱看那些了，干的东西又好挑选自己顺手的skills就行，其他不用放着，很浪费token

--- 第 35 楼来自 Skwbs 的回复 (2026-05-01 13:25:33 PDT) ---

用copilot不是啥都有吗

--- 第 36 楼来自 gggideon 的回复 (2026-05-01 13:27:21 PDT) ---

哥们分享的这些真是好东西，已经在用了

--- 第 37 楼来自 CatGPT 的回复 (2026-05-01 13:30:07 PDT) ---

gemini cli唯一优势是免费版里最好的

--- 第 38 楼来自 lionlin 的回复 (2026-05-01 13:31:01 PDT) ---

自己充钱买这些有什么用途呢，要是工作用的话公司不是有免费的吗

--- 第 39 楼来自 Hali 的回复 (2026-05-01 13:32:05 PDT) ---

学生，不用感觉以后找工作老板问会不会ai 答不会估计就不要我了等我找工作的时候估计就是：你用了多少token，你工作流一个project开几个agent怎么分配任务，你一次性能干几个project 我还在用前司的gpt，看见那些悲惨的unpaid intern用着gpt再给老板干活

--- 第 40 楼来自 lionlin 的回复 (2026-05-01 13:33:55 PDT) ---

那就是以前充leetcode现在充ai对吧

--- 第 41 楼来自 Hali 的回复 (2026-05-01 13:34:20 PDT) ---

差不多意思现在不付钱=不会用到最好的/没用两下就用完了两百是1-2 project同时干 40小时在不浪费token情况下 /uploads/short-url/lXtYLAIojGzbNuBUq2ZwbSrI5At.png?dl=1 我都不去上课，很难想象要是没ai，我得手搓那一两百行 C的Operating System project 老师明确说明可以用ai，一分钟就出结果了

--- 第 42 楼来自 cybersecurity 的回复 (2026-05-01 13:40:08 PDT) ---

Hali: 那一两百行 C的Operating System project 才这么一点代码量

--- 第 43 楼来自 Hali 的回复 (2026-05-01 13:41:45 PDT) ---

我CS，快毕业了没写过代码，考试的代码全靠背跟数学套公式一样碰上了GPT年代还有节Software Engineering全班所有作业+考试全在gpt 照现在这样我觉得等我死磕完代码，人类已经自动坐火箭往返地球了

--- 第 44 楼来自 gggideon 的回复 (2026-05-01 13:48:36 PDT) ---

Hali: skills就是几百几千字提前写好的prompt 是不是有点烧token，初体验是这样 update：确认了，真烧得离谱啊；夸夸 5x plan session limit就用完了

--- 第 45 楼来自 Hali 的回复 (2026-05-01 13:55:33 PDT) ---

但是他不会走弯路，推倒重来+路上艰辛万苦费时费力更头疼万事开头难，选对方向最重要

--- 第 46 楼来自 CatGPT 的回复 (2026-05-01 13:56:28 PDT) ---

skill是按需才load进context的，平时只会load description，可能你的request对某些skill依赖巨大

--- 第 47 楼来自 sukasky 的回复 (2026-05-01 14:06:56 PDT) ---

AppleVisionPro: Custom instructions gemini的custom instructions经常没用写了跟没学一样

--- 第 48 楼来自 See 的回复 (2026-05-01 14:24:36 PDT) ---

太强了，ai的算力都被你吸干了

--- 第 49 楼来自 gggideon 的回复 (2026-05-01 14:25:55 PDT) ---

怪啊，不知道发生什么事情了，可能也不是skill的锅：我刚刚没load skill，就跑自己写的prompts，cc烧token的速度怎么跟前段时间 cc降智+4.7烧token一样。 update 早上不是这样的，唯一大变量是装了楼上几个agents / skills

--- 第 50 楼来自 AppleVisionPro 的回复 (2026-05-01 14:27:48 PDT) ---

我说的是chatgpt的我看了一下gemini格式上它记得住, 内容是就很容易忘记

--- 第 51 楼来自 See 的回复 (2026-05-01 14:30:21 PDT) ---

你错过了还要学用算盘的数学课时代，美名其曰“珠算课”，那个时代数学课上用计算器是死罪，会被株连家长叫到学校来训话。意思是早就过了死磕代码的时代了，当年算盘可以盲打打得飞快的数学课代表现在都不在任何跟数学领域沾边的工作。 /uploads/short-url/AaGftxQfdVaNhxa9oNQSubAa3lr.jpeg?dl=1 https://baike.baidu.com/item/%E7%AE%97%E7%9B%98/363020#:~:text=%E7%AE%97%E7%9B%98(%20Abacus)%E6%98%AF%E4%B8%80%E7%A7%8D,%E7%9A%84%E5%95%86%E5%BA%97%E9%87%8C%E4%B9%B0%E5%88%B0%E3%80%82 https://baike.baidu.com/item/%E7%AE%97%E7%9B%98/363020#:~:text=%E7%AE%97%E7%9B%98(%20Abacus)%E6%98%AF%E4%B8%80%E7%A7%8D,%E7%9A%84%E5%95%86%E5%BA%97%E9%87%8C%E4%B9%B0%E5%88%B0%E3%80%82 算盘( Abacus)是一种手动操作计算辅助工具形式。它起源于中国，是中国古代的一项重要发明。在阿拉伯数字出现前，算盘是世界广为使用的计算工具。现在，算盘在亚洲和中东的部分地区继续使用，尤其见于商店之中，可以从供应中国商品和日本商品的商店里买到。在西方，它有时被用来帮助小孩子们理解数字，而一些数学家喜欢体验一下使用算盘计算出简单算术问题的感觉。

--- 第 52 楼来自 Hali 的回复 (2026-05-01 14:33:04 PDT) ---

xs记得一年级还去过珠心算补习班，感觉出了补习班就没见过算盘了好处是长大了来泥潭guabi算账更快了

--- 第 53 楼来自 See 的回复 (2026-05-01 14:36:59 PDT) ---

哟呵，小看你了，那你没有错过任何时代啊。我也是小学珠算课受害者，算盘太tm难打了，明明计算器这么好用，又快，老师硬是不给用。所以算盘的用法在我手上都是拍放学路上拦路抢零花钱的小瘪三脸上的。

--- 第 54 楼来自 AppleVisionPro 的回复 (2026-05-01 14:38:03 PDT) ---

我就觉得大佬在说我, 我以前是数学课代表, 小时候陪我妈买菜, 口算算账比菜贩的计算器还快, 现在是ai的无脑鼓吹者和实践者, 最后在泥潭guabi

--- 第 55 楼来自 See 的回复 (2026-05-01 14:40:30 PDT) ---

AppleVisionPro: 数学课代表啥？你就是那个举报我用计算器的课代表，放学在学校后门等我，别想跑……

--- 第 56 楼来自 AppleVisionPro 的回复 (2026-05-01 14:42:08 PDT) ---

来来来来, 我们各自带上工具, 你用计算器, 我用算盘, 别动, 各自往对方头上抡, 看看谁先把谁打趴下

--- 第 57 楼来自 TimCookCook 的回复 (2026-05-01 14:42:26 PDT) ---

Hali: 珠心算补习班当时上这个课真的蛮潮流的

--- 第 58 楼来自 See 的回复 (2026-05-01 14:52:36 PDT) ---

/uploads/short-url/5QHq08Jh1bpClBUhkw6FserCV5B.jpeg?dl=1

--- 第 59 楼来自 Onvon 的回复 (2026-05-01 15:10:06 PDT) ---

skill是on-demand的只要没有明显的“read xxxx skill”就不会吧skill放进context 你可以/context看一下是谁的锅或者stats面板看下你的token消耗

--- 第 60 楼来自 CB2 的回复 (2026-05-01 15:10:46 PDT) ---

/uploads/short-url/x8zWKNrdoBUqFSbnAOrdDs0nUN3.jpeg?dl=1

--- 第 61 楼来自 Hali 的回复 (2026-05-01 15:56:43 PDT) ---

10 11年上的吧算盘只是小时候家长拉着报一堆补习班顺带的导致现在算术贼快

--- 第 62 楼来自 Chickenrice 的回复 (2026-05-01 16:22:42 PDT) ---

Hali: 答不会估计就不要我了是这样的

--- 第 63 楼来自 Onvon 的回复 (2026-05-01 17:09:31 PDT) ---

openrouter有个auto模型叫 openrouter/auto 你给他提供一串predefined的模型id 他就会根据你prompt的复杂程度自动选择合适的模型如果不想用OR 也可以自己用便宜小模型/NLP 搓一个简单的router

--- 第 64 楼来自 gggideon 的回复 (2026-05-01 17:55:12 PDT) ---

感谢，之前都没用过这个功能。 /uploads/short-url/rm3vniirLB8eysKgya0gmBXTAsp.png?dl=1 For some reason, 这个message怎么消耗了这么多。感觉是我用了 plan-like skills，cc写了一个md，读写花了很多token。我自己倒没有敲很多prompt。 update：实在是太奇怪了，我让cc自己分析一下为什么这个session用了这么多token，结果用了10% session 额度。分析有理有据，但是为什么，这一个简单分析可以用掉10%。以及我发现，caveman-mode 花了30k 新开了一个session 单独跑了很简单的prompt，这是分析，感觉是刚装了几个repo 导致skills太多了，还有caveman hooks /uploads/short-url/aiUyGImBfShxckuSGzkvHoDYahu.png?dl=1 这是已经安装的skills/plugin，感觉也不是很多呢 /uploads/short-url/jys1QGSoOtcsB4RhoA3KIdCaQ3m.png?dl=1

--- 第 65 楼来自 Onvon 的回复 (2026-05-01 19:31:19 PDT) ---

那就排除法咯先diable一个plugin 然后 /rewind 穿越回到之前你问那个问题前再问一次再看看token消耗不停重复就找到问题所在了一个plugin里也可能有很多skill 但是skill数量多是没关系的因为我有100多个skills 从来没有1m context不够用过另外小tips 如果repo很复杂可以用 /init 让claude生成一个类似导览/介绍的claude.md文件然后每次plan他都会先看那个文件

--- 第 66 楼来自 See 的回复 (2026-05-04 06:08:39 PDT) ---

你是用的本地机器跑吗？像这位同学： https://www.uscardforum.com/t/topic/503328/18

--- 第 67 楼来自 Onvon 的回复 (2026-05-04 06:18:43 PDT) ---

跑不动的绝大部分主流的开源大模型 vram消耗非常可怕 128g的mac mini也就勉强q跑一个claude haiku/gpt-5.4-mini级别的开源模型

--- 第 68 楼来自 See 的回复 (2026-05-04 06:20:40 PDT) ---

那你怎么解决的？直接连opus么？怎么控制开支啊？

--- 第 69 楼来自 Onvon 的回复 (2026-05-04 06:23:58 PDT) ---

啊你说的是本地跑还是用api key啊我说的是本地如果你订阅gpt/claude或者用他们的api的话 10年前的破笔电都能跑claude code.agent harness本身没有什么性能需求

--- 第 70 楼来自 See 的回复 (2026-05-04 06:27:10 PDT) ---

本想本地的，但照你说的机器性能肯定不够，所以只能用订阅了，现在20刀那个档次问个几个问题就用完quota要等3-5小时…直接连api不熟，不敢直接连上信用卡开水龙头给人类学

--- 第 71 楼来自 Onvon 的回复 (2026-05-04 06:33:58 PDT) ---

做agent分工就好只用opus或者5.5xh来planning, 用便宜模型执行怕花钱认准deepseek v4 pro, 我感觉实力略高于claude sonnet 4.6 有时能摸到opus的边价格巨便宜码一天用不到1块或者吃隔壁的codex2人套餐 https://www.uscardforum.com/t/topic/502565

--- 第 72 楼来自 See 的回复 (2026-05-04 06:35:22 PDT) ---

Onvon: 做agent分工就好只用opus或者5.5xh来planning, 用便宜模型执行完全不懂这个！我问下AI这怎么搞。

--- 第 73 楼来自 AppleVisionPro 的回复 (2026-05-04 19:52:58 PDT) ---

不要说claude, 周末干活把codex的20刀plan送的都差不多烧完了, 再也不敢说, codex量大管饱了.

--- 第 74 楼来自 Hali 的回复 (2026-05-04 19:57:21 PDT) ---

claude 200解君愁时间也是钱 2个来回能解决的，不要兜圈子10个来回更何况token使用更多，我这几天休闲vibe（全程opus 4.7 high，sonnet是他自己调用subagents） /uploads/short-url/75bzYMwqLCXAVJR4IIsye7iAy3Y.png?dl=1 这是刚刚一个号5hr limit了过来一会儿就（20） /uploads/short-url/34uGOe3HqWGWcFewJYpsWPdl58Z.png?dl=1 大概就claude desktop里给个差不多的goal，然后让5.5high慢慢跑着了话说好像medium比high/xhigh少很多usage？然后还有很多出其不意效果？ xhigh拿来plan？medium拿来干活？不懂到底要怎么安排

--- 第 75 楼来自 Jasz 的回复 (2026-05-05 10:31:49 PDT) ---

新的claude 4.7 之后真的花费好高连max都不够用问题还没有做什么只有我一个人那么觉得吗

--- 第 76 楼来自 Jasz 的回复 (2026-05-05 10:32:36 PDT) ---

隔壁的 codex 2人没了求问还有哪里找到

--- 第 77 楼来自 gggideon 的回复 (2026-05-05 14:12:55 PDT) ---

Hali: sonnet是他自己调用subagents 这需要用户端设置什么嘛，最近有看到莫名有一些sonnet usage，不过也就6%的样子。 5x用户觉得一点不够用。。

--- 第 78 楼来自 See 的回复 (2026-05-05 15:10:23 PDT) ---

投资这么巨大拿来做什么产品啊？我都用公司的，自己买的做私活

--- 第 79 楼来自 Hali 的回复 (2026-05-05 15:11:00 PDT) ---

拿来玩怕几个月后毕业找不到工作到时候家里蹲一个月就不止我这几个月订阅费了玩了一个月出去吃喝时间/精力都没变相省钱了 gggideon: 需要用户端设置什么嘛不知道是不是skills里自动会安排便宜的subagents，反正sonnet跟weekly limit sync就行了，只用一个的话也挺难受，不能用另外一个

--- 第 80 楼来自 donk666 的回复 (2026-05-05 15:12:15 PDT) ---

钞能力，直接用API

--- 第 81 楼来自搞钱不到钱只能玩卡的回复 (2026-05-05 15:16:03 PDT) ---

直接api比订阅便宜多了而且接到工具里也方便除非能把订阅的token烧回本不然根本不考虑

--- 第 82 楼来自 See 的回复 (2026-05-05 15:49:26 PDT) ---

怕啥，你这种技术控到处抢的。工作肯定有，但工资嘛…最近一个花街日报调查显示美国NG的年薪期望值比真实拿到的低3.2万，而中国NG的期望值和实际值则比较接近。

--- 第 83 楼来自 Onvon 的回复 (2026-05-05 21:20:59 PDT) ---

claude code自带的 CC很多时候会让默认的小模型(一般是haiku有时是sonnet) 去做工具调用和总结这种简单任务就算你把模型设置成opus, claude code并不是所有工作都会用opus执行

--- 第 84 楼来自 zuiaiwufan 的回复 (2026-05-30 13:05:03 PDT) ---

就是先让牛逼的staff engineer先帮你做好架构，然后让SDE1帮你实现功能就行了，然后弄一个lead /manager agent 管理最终交付质量，你啥也不用管了

--- 第 85 楼来自 See 的回复 (2026-05-30 13:30:41 PDT) ---

能替代这么多？难怪埋塔大裁员

🛍️ 败家 · 其他高楼

[DEAd余烬] 蟋蟀iPhone 16e 手机零元购+Plan $120→180 💬 9446
Visible 换号次数限制与 MetroPCS 购机策略讨论
[dead] 美国抖音refer新用户送50刀 💬 8421
TikTok Shop拉新活动风控严苛，新设备和新手机号直接被限制，成功率极低，用户转向Temu，Credit与Coupon叠加使用存在疑问。
iPhone 17全系offer大楼 💬 6814
iPhone 17全系offer大楼
[黑五献礼]Temu能买什么 💬 6736
总结 Temu 黑五羊毛最新玩法与风控避坑要点。
UberEATs/Postmates Coupon Codes 💬 5644
Postmates/UberEats 优惠码持续更新，近期新增大量 NCAA 疯三相关 40% off 优惠，覆盖众多大学地区，但部分地区用户反馈未获优惠。Postmates 新增洛杉矶和拉斯维加斯地区优惠码，并推出杂货优惠。
电车lease综合楼 💬 4950
帖子标题
C1S近期offer合集 💬 4607
C1S平台近期Offer动态更新：Temu返现成功追踪，苹果优惠力度不足，用户关注GNC、Braun等商家优惠，客服调整受限，新号Link Bank要求普遍化。
【dead新term上限】【有爬回DP】PayPal Pay Later 5%/20%返现 (10/6-12/31, 11/17-12/8)（不可使用Chase/C1卡，无季度返现） 💬 4102
PayPal Pay Later 积分清零引发用户维权，客服处理效率低下

← 返回 🛍️ 败家