除了全都买之外,如何保证一直用上最佳ai订阅?
按月切换、开源工具、token付费、agent分工控制AI订阅成本。
1. 关键信息
- #5 @Hali 建议按月订阅,不好用就换另一家,利用claude-mem、agents.md、claude.md等自动同步技能,并用cc-switch切换模型。
- #9 @Hali 分享两个GitHub项目:cc-switch(跨平台AI助手工具)和claude-mem(自动记录Claude会话并注入上下文)。
- #13 @Hali 推荐caveman(减少65% token的Claude Code技能)、skills仓库及外骨骼框架(superpowers、gstack、everything-claude-code等)。
- #17 @Gpg12 推荐OpenRouter(按token付费,简单任务可用更便宜甚至免费模型)。
- #23 @Hali 分享CLIProxyAPI(将Gemini CLI、ChatGPT Codex等包装成兼容API,享受免费模型),并提醒用AMEX改地址到DE免税。
- #30 @Hali 分享grillme、CMUX(tmux的fork,支持多workspace)、Ghostty-based terminal(cmux)、Warp终端等工具,并推荐B站AI日报、YouTube的brigemind/bridgecode(Jarvis自动分配任务给多个agent)。
- #32 @Hali 演示CMUX可开十几个terminal workspace,并介绍bridgecode中Jarvis自动分配任务。
- #33 @AppleVisionPro 强调ChatGPT的Custom instructions类似claude.md,可定义输出格式(如先tldr、禁用表情包),并指出Gemini不能强制web search,分析股市时胡扯。
- #34 @Hali 强调多用skill、勤用skill,plan好再干,避免绕圈子;skill.md又长又臭但AI最爱,挑选顺手skills即可。
- #35 @Skwbs 认为用Copilot就能覆盖所有需求。
- #37 @CatGPT 指出Gemini CLI是免费版里最好的。
- #39 @Hali 解释学生自费买AI是为了找工作,并提到前司GPT、unpaid intern用GPT给老板干活。
- #41 @Hali 展示自己一天用API烧掉200美元(40小时同时干1-2个project),并用AI完成OS project(一两百行C代码)。
- #43 @Hali 自称CS快毕业没写过代码,全靠GPT,考试靠背。
- #44 @gggideon 反馈skills烧token严重,初体验确认烧得离谱,5x plan session limit很快用完。
- #45 @Hali 认为skills虽烧token但避免走弯路,选对方向最重要。
- #46 @CatGPT 解释skill是按需才load进context,平时只load description,可能request对某些skill依赖大。
- #47 @sukasky 指出Gemini的custom instructions经常没用,写了跟没写一样。
- #49 @gggideon 反馈未load skill时token消耗也异常,怀疑与安装的agents/skills有关。
- #50 @AppleVisionPro 确认ChatGPT的custom instructions好用,Gemini格式记得住但内容容易忘。
- #63 @Onvon 介绍OpenRouter的auto模型(openrouter/auto),可提供一串predefined模型ID,根据prompt复杂程度自动选择;也可自己用便宜小模型/NLP搓简单router。
- #64 @gggideon 反馈token消耗问题:使用plan-like skills后cc写md读写花了很多token;让cc分析session token消耗用了10% session额度;caveman-mode花了30k token新开session跑简单prompt;怀疑刚装了几个repo导致skills太多,以及caveman hooks影响。
- #65 @Onvon 建议用排除法定位token消耗问题:先disable一个plugin,然后/rewind回到之前的问题再问一次,重复直到找到问题;一个plugin里可能有很多skill,但skill数量多没关系(自己有100多个skills从未1m context不够用);如果repo复杂,可以用/init让Claude生成类似导览的claude.md文件,每次plan会先看那个文件。
- #67 @Onvon 说明本地跑开源大模型vram消耗大,128g Mac Mini勉强跑一个Claude Haiku/GPT-5.4-mini级别的模型。
- #69 @Onvon 解释如果使用订阅或API key,10年前的破笔电都能跑Claude Code/agent harness,本身无性能需求。
- #70 @See 反馈20刀档次订阅quota用完要等3-5小时,不敢直接连API。
- #71 @Onvon 建议做agent分工:只用opus或5.5xh来planning,用便宜模型执行;推荐deepseek v4 pro(实力略高于Claude Sonnet 4.6,有时能摸到opus的边,价格极便宜,码一天不到1块),以及codex2人套餐(链接:https://www.uscardforum.com/t/topic/502565)。
- #72 @See 表示完全不懂agent分工,需要学习。
- #74 @Hali 推荐claude 200刀订阅,强调时间也是钱,2个来回能解决不要兜圈子10个来回;展示自己用opus 4.7 high + sonnet subagents的用法,并指出medium比high/xhigh少很多usage,如何安排模式(xhigh plan、medium干活)。
- #75 @Jasz 反馈Claude 4.7之后花费很高,连max都不够用,感觉没做什么就用完了。
- #76 @Jasz 询问codex 2人套餐没了,求问哪里还能找到。
- #77 @gggideon 反馈最近莫名出现一些sonnet usage(约6%),询问是否需要用户端设置;5x用户觉得一点不够用。
- #79 @Hali 解释sonnet usage可能是skills自动安排便宜的subagents,sonnet跟weekly limit sync即可;自己买AI是为了找工作,玩了一个月变相省钱。
- #80 @donk666 建议直接用API(钞能力)。
- #81 @搞钱不到钱只能玩卡 认为直接API比订阅便宜,除非能烧回本否则不考虑订阅。
- #82 @See 安慰Hali工作肯定有,但美国NG年薪期望值比实际低3.2万,中国NG期望值与实际接近。
- #83 @Onvon 补充说明:Claude Code自带的CC(Claude Code)很多时候会让默认的小模型(一般是Haiku有时是Sonnet)去做工具调用和总结等简单任务,即使把模型设置成Opus,Claude Code也并非所有工作都用Opus执行。
2. 羊毛/优惠信息
- #23 @Hali 提醒用AMEX改地址到DE免税。
- #71 @Onvon 推荐deepseek v4 pro(码一天不到1块)及codex2人套餐(原链接:https://www.uscardforum.com/t/topic/502565,但#76反馈已失效)。
- #81 @搞钱不到钱只能玩卡 认为直接API比订阅便宜(无具体卡号,但强调成本优势)。
3. 最新动态
- #1 引用deeplearning.ai报告:GPT-5.5性能下降,撒谎率从7%升至29%;Gemini 3.1 Pro Preview跌至季军。
- #10 @dhcp 建议用开源router替代Perplexity。
- #18 @Hali 展示自己一天用API烧掉200美元的例子。
- #30 @Hali 分享多个新工具:grillme、CMUX、cmux、Warp、bridgecode,并推荐B站AI日报。
- #33 @AppleVisionPro 对比ChatGPT与Gemini:ChatGPT可玩性更强,Gemini不能强制web search。
- #37 @CatGPT 认为Gemini CLI是免费版里最好的。
- #44-#46 #49 讨论skills烧token问题:按需加载但实际消耗大,可能与特定skill或agent有关。
- #47 #50 反馈Gemini的custom instructions效果差,ChatGPT的custom instructions更可靠。
- #63 @Onvon 介绍OpenRouter auto模型,可自动选择模型
https://info.deeplearning.ai/e3t/Ctc/LX+113/cJhC404/VWlFx_3F4rdLW68VMJn7WPMCFW2lg-cV5Ny350N4Mwsfs3qgz0W6N1vHY6lZ3kMN3BcsFxw_fN5W5rGt4V1GsdQrW4slcxG1C1jdrW28z9mZ3FgsF4W2gLs2H7KfD83W44wf2b3kG7PkW78CV0W1pFlKVW2vVxBx4dS49KW5k03Rj2z97nKW1F91nP7Rg_v-W7LsSrx7sf9pfW1DFcvf85mKlxW6ZL-5s5JY4FrW5jyqQ45Yqcy0W6_BqLK1Q52VvW6xt-5x4stx8jW71V9-f76314WVLSVDK57J-5BW8wWCQy5NnyfCW4TS1Lb24pMbQW1NCkz91vnKDYW6JFL5w4JmWjsf1TX_RR04 GPT-5.5 knows more than its peers, but it answers incorrectly more often and acknowledges ignorance less often. https://info.deeplearning.ai/e3t/Ctc/LX+113/cJhC404/VWlFx_3F4rdLW68VMJn7WPMCFW2lg-cV5Ny350N4Mwsgl3qgz0W8wLKSR6lZ3prW5TNhmR18GTjhW8JpGK42TdD3_VVZB2q2PsDz1W3l6B0F2N1-b5W5F8BgX8dQ9JDW6p6TfK4n8dtgN51rQNy-f91LW92yD2f1mXBbyW83tn4q7m4wXhVKv_rQ2H-DNkW2wXZPh4x6TLfW24yN978L2Bq4W7Fl1tC3WKyYZN3Yl5NSWPdFyW3P3NJT6R5wv8W5w6P-q13VcjMW2S0h6S7h10-9W3yYV6v3dCJt5W4HDCpk2_qYS-VFgN5F2sgD5WVmJS3S6P68hHW3fblyy8nJHjwVg45-Z5GGRm1W8Jsx-f1kc-6XW51j7CR6xl19_W6GPj-z1gt3RrW75j_9N67BQxkW3Jk0Fl7L-7W-f6-jjkP04GPT-5.5 lied about completing an impossible programming task in 29 percent of samples, a significant jump from GPT-5.4’s 7 percent. GPT-5.5 is the fourth flagship launch since February, following Anthropic Claude Opus 4.7, GPT-5.4, and Google Gemini 3.1 Pro Preview. 狗家双子座圣斗士跌到季军。 每隔一段时间这个榜就要刷一次,难道我们总要经常换ai么?怎么花最少的钱获得最佳使用体验,难道都去用perplexity? 集思广益,潭友们分享的方法: 自动sync skills https://www.uscardforum.com/t/topic/502876/5 /c/shopping/20 一个月一个月定就好了,不好用就换另一家 反正claude-mem,agents.md, claude.md里面基本都有,让他们自己sync,github也有吧?cc-switch有mem有skills,只是接另外一个模型 肯定不可能只用一家的,每家都有自己擅长的 就比如paperclip自己设置CEO等各种重要的用贵的模型,下面打工仔用中等的/便宜的干苦力活,比如决策框架用opus,打工用s… https://www.uscardforum.com/t/topic/502876/9 /c/shopping/20 我自己用的 然后我们做project,agent自己也会写progress文档,别的ai读一下就知道啥了 https://www.uscardforum.com/t/topic/502876/13 /c/shopping/20 错了 等下 强推 这些是让ai自己学会的基础的 外骨骼 Router法:
差距不大不用换,你又不是搞research非得什么都用SOTA
蹲一个,主要perplexity也不好用(不过我更在意coding tool
经常换也是一个办法 但是要重新练 有点麻烦了
一个月一个月定就好了,不好用就换另一家 反正claude-mem,agents.md, claude.md里面基本都有,让他们自己sync,github也有吧?cc-switch有mem有skills,只是接另外一个模型 肯定不可能只用一家的,每家都有自己擅长的 就比如paperclip自己设置CEO等各种重要的用贵的模型,下面打工仔用中等的/便宜的干苦力活,比如决策框架用opus,打工用sonnet/国产
我用它来批判其他ai的输出,还挺有用,因为都有出处,但别的功能确实不好用。
你怎么搞能无缝切换?像楼上说的重新训练麻烦呐
充钱买api, 谁家强就用谁家, 毫无负担
我自己用的 https://github.com/farion1231/cc-switch https://github.com/farion1231/cc-switch A cross-platform desktop All-in-One assistant tool for Claude Code, Codex, OpenCode, openclaw & Gemini CLI. https://github.com/thedotmack/claude-mem https://github.com/thedotmack/claude-mem A Claude Code plugin that automatically captures everything Claude does during your coding sessions, compresses it with AI (using Claude's agent-sdk), and injects relevant context back into future sessions. 然后我们做project,agent自己也会写progress文档,别的ai读一下就知道啥了
搬出老图 用perplexity还不如用开源的router /uploads/short-url/zHDBclpmyOfouOT5ykBXSkcoeqr.jpeg?dl=1
chatgpt挺好的。chatbot能用,deepthink找论文挺好,pro解难题挺好,codex用来应付简单编程任务挺好额度也给的挺足。其他两家略微有点硬伤,gemini CLI基本属于完全用不了级别,claude的deepthink和chatbot一般般,没有pro级别的模型。
你这个好高级,我得花时间研究下。
错了 等下 强推 https://github.com/JuliusBrussee/caveman https://github.com/JuliusBrussee/caveman 🪨 why use many token when few token do trick — Claude Code skill that cuts 65% of tokens by talking like caveman 这些是让ai自己学会的基础的 https://github.com/mattpocock/skills https://github.com/mattpocock/skills Skills for Real Engineers. Straight from my .claude directory. https://www.star-history.com/forrestchang/andrej-karpathy-skills/ https://www.star-history.com/forrestchang/andrej-karpathy-skills/ A single CLAUDE.md file to improve Claude Code behavior, derived from Andrej Karpathy's observations on LLM coding pitfalls. — 98.1k stars, 7 contributors, This week: +3.2k stars https://www.star-history.com/addyosmani/agent-skills/ https://www.star-history.com/addyosmani/agent-skills/ Production-grade engineering skills for AI coding agents. — 25.7k stars, 17 contributors, This week: +668 stars 外骨骼 https://github.com/obra/superpowers https://github.com/obra/superpowers An agentic skills framework & software development methodology that works. https://github.com/garrytan/gstack https://github.com/garrytan/gstack Use Garry Tan's exact Claude Code setup: 23 opinionated tools that serve as CEO, Designer, Eng Manager, Release Manager, Doc Engineer, and QA https://github.com/affaan-m/everything-claude-code https://github.com/affaan-m/everything-claude-code The agent harness performance optimization system. Skills, instincts, memory, security, and research-first development for Claude Code, Codex, Opencode, Cursor and beyond. https://github.com/VoltAgent/awesome-design-md https://github.com/VoltAgent/awesome-design-md A collection of DESIGN.md files inspired by popular brand design systems. Drop one into your project and let coding agents generate a matching UI.
你用的开源router分享下呗
我现在也感觉是chatgpt个人用综合最好 在公司opus随便烧, 自己的project, 20刀会员送的codex也能用, 问答上chatgpt经过调教也比Gemini好
AppleVisionPro: 问答上chatgpt经过调教 分享下你的育ai儿经?
用openrouter吧,pay-per-token,溢价不多而且一些简单task可以用更便宜甚至免费的model
今天就干了十几句话 真API的话烧不起 /uploads/short-url/wuK2RTHfQOdwr89mm552mmoTR7E.png?dl=1 /uploads/short-url/5WnEXPYAJMXEN3aXo8zFQrqRREl.png?dl=1 200刀就这样了 /uploads/short-url/78PMQWzPg8jug4iSMyIZQzFfSLs.png?dl=1
放到主楼了 Hali: 强推 Gpg12: 用openrouter吧
首先知道什么问题用什么模式问, 很多人只会默认模式, 答案自然错的 Custom instructions 我把它当成claude.md玩, 写的太长了. 吐槽一句, chatgpt的前端做得太差, 现在编辑都很难, 现在基本上只append
cc-switch setting里面就有sync skills 具体怎么玩我也在学 skills不是越多越好(穷),那几个gstack,ECC,superpowers很多重复的,选择几个自己用的顺手的就行了 隔壁有CPA可以好几个号混在一起当API用,昨晚看得头大了还没弄 /uploads/short-url/5P44mY0vsoU6dNWMQVKMKH9aAcM.png?dl=1
现在这个时代真感觉脑子学习能力 跟不上技术进步的脚步
真的是学都不去上,每天在家十几个小时看,除了吃饭洗澡睡觉,躺床上也是看AI,越看越睡不着,几个东西一直开着给电脑干的呼呼响(m4 pro),干到后面都不知道干到哪了 学不完的,找个方向跟上就行了,啥都学没那精力 https://github.com/router-for-me/CLIProxyAPI https://github.com/router-for-me/CLIProxyAPI Wrap Gemini CLI, Antigravity, ChatGPT Codex, Claude Code as an OpenAI/Gemini/Claude/Codex compatible API service, allowing you to enjoy the free Gemini 3.1 Pro, GPT 5.5, Claude model through API 很多小众的模型会免费,其他按需收费,现在大模型基本上全球一个价格,不同地方付款不会差太多的,我还自己去折腾中国的,可能便宜点,后俩发现 .com 和 .io/ai 放在STT会request timeout,延迟大,coding没事,实时的还是走国际的 都玩泥潭了记得AMEX改到DE去无税 https://openrouter.ai https://openrouter.ai The unified interface for LLMs. Find the best models & prices for your prompts
https://learn.deeplearning.ai/courses/ai-prompting-for-everyone/information https://learn.deeplearning.ai/courses/ai-prompting-for-everyone/information Become an AI power user in this new course taught by Andrew Ng. From finding information to building apps, you'll develop the prompting skills that get real, useful results from today's most powerful AI models. 你指的是学好prompting么?
现在的聪明多了
你这是真》沉浸式体验 Hali: 每天在家十几个小时看,除了吃饭洗澡睡觉,躺床上也是看AI
请问antigravity里用opus和Claude code里用opus的差别到底有多大?
好的!感谢分享啊。我学渣还得多加时间学习才行。
还有个很好玩的,grillme,我等下试试 /uploads/short-url/yq600Tn6i9PK36GPVIfJhjILG2X.png?dl=1 跟这个topic没关的,多线程操作 CMUX https://github.com/tmux/tmux https://github.com/tmux/tmux tmux source code TMUX https://github.com/manaflow-ai/cmux https://github.com/manaflow-ai/cmux Ghostty-based macOS terminal with vertical tabs and notifications for AI coding agents WARP https://github.com/warpdotdev/warp https://github.com/warpdotdev/warp Warp is an agentic development environment, born out of the terminal. b站很多AI自动生成的日报周报 多看看 三五分钟 积攒经验 就当是泥潭快报 科技版 现在缺的是idea和能实现他的model,自己手搓(没能力,没精力,浪费钱) 有时候看到某某东西,发现刚好就是能补齐的最后一块拼图,赶紧去试着用了,或者日积月累经验
这些都是做什么use cases的?
大概这样 /uploads/short-url/dQ1SNKCGjA51StSx66nvKW3bjLH.png?dl=1 开十几个terminal真顶不住 一个个拉很痛苦 这个就可以好多workspace并存,project 1 2 3… 然后里面开几个都行,除了废眼睛 我有在看YouTube的brigemind,他搞了个bridgecode,右边是Jarvis,跟他讲话他就自动开几个你想要的页面,然后他会自动分配任务给每个不同的agent,Jarvis会说话有反馈 https://www.youtube.com/watch?v=xKf0B6AEo9I
差不多就是Ng的样子和Hali回答的的样子 你就把Custom instructions 当成personal claude.md 写 告诉输出要什么样. 我会要它每次先tldr, 不要放表情包等等 还有自定义/short, 基于本来要给答案只给个总结 chatgpt的可玩性比Gemini强太多了. Gemini居然不能强制web search, 让他分析当天股市就是在胡扯
对 反正多用skill,勤用skill,没干活前plan好,比之后绕圈子费时费劲,推倒重来强 虽然skill.md又长又臭,又不是自己看,ai最爱看那些了,干的东西又好 挑选自己顺手的skills就行,其他不用放着,很浪费token
用copilot不是啥都有吗
哥们分享的这些真是好东西,已经在用了
gemini cli唯一优势是免费版里最好的
自己充钱买这些有什么用途呢,要是工作用的话公司不是有免费的吗
学生,不用感觉以后找工作老板问会不会ai 答 不会 估计就不要我了 等我找工作的时候估计就是:你用了多少token,你工作流一个project开几个agent怎么分配任务,你一次性能干几个project 我还在用前司的gpt,看见那些悲惨的unpaid intern用着gpt再给老板干活
那就是以前充leetcode现在充ai对吧
差不多意思 现在不付钱=不会用到最好的/没用两下就用完了 两百是1-2 project同时干 40小时 在不浪费token情况下 /uploads/short-url/lXtYLAIojGzbNuBUq2ZwbSrI5At.png?dl=1 我都不去上课,很难想象要是没ai,我得手搓那一两百行 C的Operating System project 老师明确说明可以用ai,一分钟就出结果了
Hali: 那一两百行 C的Operating System project 才这么一点代码量
我CS,快毕业了没写过代码,考试的代码全靠背 跟数学套公式一样 碰上了GPT年代 还有节Software Engineering全班所有作业+考试全在gpt 照现在这样 我觉得等我死磕完代码,人类已经自动坐火箭往返地球了
Hali: skills就是几百几千字提前写好的prompt 是不是有点烧token,初体验是这样 update:确认了,真烧得离谱啊;夸夸 5x plan session limit就用完了
但是他不会走弯路,推倒重来+路上艰辛万苦费时费力 更头疼 万事开头难,选对方向最重要
skill是按需才load进context的,平时只会load description,可能你的request对某些skill依赖巨大
AppleVisionPro: Custom instructions gemini的custom instructions经常没用 写了跟没学一样
太强了,ai的算力都被你吸干了
怪啊, 不知道发生什么事情了,可能也不是skill的锅:我刚刚没load skill,就跑自己写的prompts,cc烧token的速度怎么跟前段时间 cc降智+4.7烧token一样。 update 早上不是这样的,唯一大变量是装了楼上几个agents / skills
我说的是chatgpt的 我看了一下gemini格式上它记得住, 内容是就很容易忘记
你错过了还要学用算盘的数学课时代,美名其曰“珠算课”,那个时代数学课上用计算器是死罪,会被株连家长叫到学校来训话。 意思是早就过了死磕代码的时代了,当年算盘可以盲打打得飞快的数学课代表现在都不在任何跟数学领域沾边的工作。 /uploads/short-url/AaGftxQfdVaNhxa9oNQSubAa3lr.jpeg?dl=1 https://baike.baidu.com/item/%E7%AE%97%E7%9B%98/363020#:~:text=%E7%AE%97%E7%9B%98(%20Abacus)%E6%98%AF%E4%B8%80%E7%A7%8D,%E7%9A%84%E5%95%86%E5%BA%97%E9%87%8C%E4%B9%B0%E5%88%B0%E3%80%82 https://baike.baidu.com/item/%E7%AE%97%E7%9B%98/363020#:~:text=%E7%AE%97%E7%9B%98(%20Abacus)%E6%98%AF%E4%B8%80%E7%A7%8D,%E7%9A%84%E5%95%86%E5%BA%97%E9%87%8C%E4%B9%B0%E5%88%B0%E3%80%82 算盘( Abacus)是一种手动操作计算辅助工具形式。它起源于中国,是中国古代的一项重要发明。在阿拉伯数字出现前,算盘是世界广为使用的计算工具。现在,算盘在亚洲和中东的部分地区继续使用,尤其见于商店之中,可以从供应中国商品和日本商品的商店里买到。在西方,它有时被用来帮助小孩子们理解数字,而一些数学家喜欢体验一下使用算盘计算出简单算术问题的感觉。
xs记得一年级还去过珠心算补习班,感觉出了补习班就没见过算盘了 好处是长大了来泥潭guabi算账更快了
哟呵,小看你了,那你没有错过任何时代啊。 我也是小学珠算课受害者,算盘太tm难打了,明明计算器这么好用,又快,老师硬是不给用。所以算盘的用法在我手上都是拍放学路上拦路抢零花钱的小瘪三脸上的。
我就觉得大佬在说我, 我以前是数学课代表, 小时候陪我妈买菜, 口算算账比菜贩的计算器还快, 现在是ai的无脑鼓吹者和实践者, 最后在泥潭guabi
AppleVisionPro: 数学课代表 啥?你就是那个举报我用计算器的课代表,放学在学校后门等我,别想跑……
来来来来, 我们各自带上工具, 你用计算器, 我用算盘, 别动, 各自往对方头上抡, 看看谁先把谁打趴下
Hali: 珠心算补习班 当时上这个课真的蛮潮流的
/uploads/short-url/5QHq08Jh1bpClBUhkw6FserCV5B.jpeg?dl=1
skill是on-demand的 只要没有明显的“read xxxx skill”就不会吧skill放进context 你可以/context看一下是谁的锅 或者stats面板看下你的token消耗
/uploads/short-url/x8zWKNrdoBUqFSbnAOrdDs0nUN3.jpeg?dl=1
10 11年上的吧 算盘只是小时候家长拉着报一堆补习班顺带的 导致现在算术贼快
Hali: 答 不会 估计就不要我了 是这样的
openrouter有个auto模型叫 openrouter/auto 你给他提供一串predefined的模型id 他就会根据你prompt的复杂程度 自动选择合适的模型 如果不想用OR 也可以自己用便宜小模型/NLP 搓一个简单的router
感谢,之前都没用过这个功能。 /uploads/short-url/rm3vniirLB8eysKgya0gmBXTAsp.png?dl=1 For some reason, 这个message怎么消耗了这么多。感觉是我用了 plan-like skills,cc写了一个md,读写花了很多token。我自己倒没有敲很多prompt。 update:实在是太奇怪了,我让cc自己分析一下为什么这个session用了这么多token,结果用了10% session 额度。分析有理有据,但是为什么,这一个简单分析可以用掉10%。 以及我发现,caveman-mode 花了30k 新开了一个session 单独跑了很简单的prompt,这是分析,感觉是刚装了几个repo 导致skills太多了,还有caveman hooks /uploads/short-url/aiUyGImBfShxckuSGzkvHoDYahu.png?dl=1 这是已经安装的skills/plugin, 感觉也不是很多呢 /uploads/short-url/jys1QGSoOtcsB4RhoA3KIdCaQ3m.png?dl=1
那就排除法咯 先diable一个plugin 然后 /rewind 穿越回到之前你问那个问题前 再问一次 再看看token消耗 不停重复就找到问题所在了 一个plugin里也可能有很多skill 但是skill数量多是没关系的 因为我有100多个skills 从来没有1m context不够用过 另外小tips 如果repo很复杂 可以用 /init 让claude生成一个类似导览/介绍的claude.md文件 然后每次plan他都会先看那个文件
你是用的本地机器跑吗?像这位同学: https://www.uscardforum.com/t/topic/503328/18
跑不动的 绝大部分主流的开源大模型 vram消耗非常可怕 128g的mac mini也就勉强q跑一个claude haiku/gpt-5.4-mini级别的开源模型
那你怎么解决的?直接连opus么?怎么控制开支啊?
啊你说的是本地跑 还是用api key啊 我说的是本地 如果你订阅gpt/claude或者用他们的api的话 10年前的破笔电都能跑claude code.agent harness本身没有什么性能需求
本想本地的,但照你说的机器性能肯定不够,所以只能用订阅了,现在20刀那个档次问个几个问题就用完quota要等3-5小时…直接连api不熟,不敢直接连上信用卡开水龙头给人类学
做agent分工就好 只用opus或者5.5xh来planning, 用便宜模型执行 怕花钱认准deepseek v4 pro, 我感觉实力略高于claude sonnet 4.6 有时能摸到opus的边 价格巨便宜 码一天用不到1块 或者吃隔壁的codex2人套餐 https://www.uscardforum.com/t/topic/502565
Onvon: 做agent分工就好 只用opus或者5.5xh来planning, 用便宜模型执行 完全不懂这个!我问下AI这怎么搞。
不要说claude, 周末干活把codex的20刀plan送的都差不多烧完了, 再也不敢说, codex量大管饱了.
claude 200解君愁 时间也是钱 2个来回能解决的,不要兜圈子10个来回 更何况token使用更多,我这几天休闲vibe(全程opus 4.7 high,sonnet是他自己调用subagents) /uploads/short-url/75bzYMwqLCXAVJR4IIsye7iAy3Y.png?dl=1 这是刚刚一个号5hr limit了过来一会儿就 (20) /uploads/short-url/34uGOe3HqWGWcFewJYpsWPdl58Z.png?dl=1 大概就claude desktop里给个差不多的goal,然后让5.5high慢慢跑着了 话说好像medium比high/xhigh少很多usage?然后还有很多出其不意效果? xhigh拿来plan?medium拿来干活? 不懂到底要怎么安排
新的claude 4.7 之后 真的花费好高 连max都不够用 问题还没有做什么 只有我一个人那么觉得吗
隔壁的 codex 2人 没了 求问还有哪里找到
Hali: sonnet是他自己调用subagents 这需要用户端设置什么嘛,最近有看到莫名有一些sonnet usage, 不过也就6%的样子。 5x用户觉得一点不够用。。
投资这么巨大拿来做什么产品啊? 我都用公司的,自己买的做私活
拿来玩 怕几个月后毕业找不到工作 到时候家里蹲一个月就不止我这几个月订阅费了 玩了一个月 出去吃喝时间/精力都没 变相省钱了 gggideon: 需要用户端设置什么嘛 不知道是不是skills里自动会安排便宜的subagents,反正sonnet跟weekly limit sync就行了,只用一个的话也挺难受,不能用另外一个
钞能力,直接用API
直接api比订阅便宜多了 而且接到工具里也方便 除非能把订阅的token烧回本不然根本不考虑
怕啥,你这种技术控到处抢的。工作肯定有,但工资嘛…最近一个花街日报调查显示美国NG的年薪期望值比真实拿到的低3.2万,而中国NG的期望值和实际值则比较接近。
claude code自带的 CC很多时候会让默认的小模型(一般是haiku有时是sonnet) 去做工具调用和总结这种简单任务 就算你把模型设置成opus, claude code并不是所有工作都会用opus执行