博士做研究被学校管理google api的人问为啥两个礼拜用了3k刀的token
博士因高并发Agent实验两周耗尽3600刀Gemini额度遭校方质询
关键信息
- 事件核心:楼主(PhD)在LLM辅助科学发现项目中,使用Gemini 2.5 Flash w/ Thinking模型进行RAG和多轮次Agentic循环实验。
- 费用异常:两周消耗约$3600(按#17计算约为14亿输出Token+2.8亿输入Token),校方管理员发邮件询问用途并指出这是“激进的消费率”(#1, #5)。
- 资源背景:学校通过Google赞助获得免费API额度,但限制严格;校内开源LLM并发能力极差(仅5个)且易OOM,无法替代云端API(#1, #18)。
- 导师态度:老板希望效果好且不愿付费,甚至询问是否有“免费LLM API”或拒绝使用中国模型(如DeepSeek),导致楼主陷入两难(#30, #40)。
争议与不同意见
- 用量合理性:多数网友认为2.5 Flash单价极低,两周$3600属于异常高消耗。有观点指出可能是“力大砖飞”式的暴力搜索或Agent设计低效(#8, #20, #49)。
- 并发策略:楼主承认开启了约100个Agent并行运行(#48),被网友批评为类似Grid-search的Brute-force,效率低下且浪费Token(#64)。
- 报销困境:网友指出美国高校常见操作是由老板报销订阅费(如$20/月的ChatGPT Pro或Teams版),但楼主老板拒绝报销,试图白嫖学校赞助额度(#29, #31, #52)。
经验与解决方案
- 成本控制建议:
- 技术优化:建议开启Caching(需特定Region如us-central1),减少重复Prompt消耗;优化Agent工作流,避免盲目并行(#59, #62)。
- 沟通策略:建议向老板明确学校额度限制及潜在封号风险,推动报销或调整实验方案;将高消耗转化为科研影响力以证明价值(#31, #50)。
风险/限制/注意事项
我的心情:尖叫划过漫长黑夜 在读博士,项目是要调用LLM进行科学发现。前期的工作就是要尝试不同的方案啊。学校的token管理 About $3600 has been spent in the last two weeks on Gemini 2.5 Flash w/ Thinking in the last two weeks in your project. This is a somewhat aggressive rate of spend. Could you let us know what this is being used for? 这是气话 我真的服了,我不用你不用,token被拿来当作宝贝么? 系里有免费的开源LLM 但是没办法一次并发超过5个,根本没办法用。。。所以就找到了学校的gemini,然后还出了这个事儿。 感谢各位的出谋划策,我晚一点总结下,给其他人提供经验
你们免费用?!
他和我们说的是免费用,也没提过花钱的事情。就很难崩。。。。
2.5flash也不值钱啊
Gemini 2.5 Flash不值钱还能用3600,那你这个确实挺猛的,我也好奇what this is being used for?
就是调用rag+thinking 跑的轮次比较多
接着用大不了被封号呗
2.5 Flash 用了$3600?我估计他不是心疼钱,是真的想知道这么便宜的model你怎么用这么多的?(我也好奇 )
zhhy: 被封号 被学校封了
因为prompt 写的也很多,而且还要用rag,就是整个项目下,一来一回+多轮次,蚂蚁搬家,就会用很多 3600刀到底有多少token啊 我怎么自己看了请求,发现自己也用不了那么多啊
难道不应该你老板付钱吗?
你这个用量,弄个gpt 200都够够的了,甚至能省很多,2.5 flash能干活吗
Hughu: Gemini 2.5 Flash w/ Thinking 真不如不用
啥学校能免费用token啊,不都是走老板经费么
现在都出了3.5 更便宜 https://ai.google.dev/gemini-api/docs/pricing?hl=zh-cn#gemini-3.5-flash
放轻松,美国style,大家都走个程序就好了
$0.30 / $2.50 per 1M 好家伙,十亿左右token,还是输出1:5的情况 Input Tokens: 281.25 million (281,250,000 tokens) Output Tokens: 1,406.25 million (1,406,250,000 tokens, or ~1.4 billion)
因为学校的和google合作 所以算是赞助 老板让做loop 之前 我加了agentic 就导致了多次查询,还开了thinking ,就会用的很多。 主要是跑实验,得一遍一遍看结果,谁也不知道实验设计对不对,看了结果才知道。 老师还说,要不咱们用我们本地的gpt120b。 我说那个本地服务器,不能并发,propmpt大一点电脑就内存溢出了。
exactly,API标价水分太高,学校要真金白银付钱太亏。 开两张商白送的chatgpt business能用掉的token标价都比这个多多了。用学校邮箱免费领一个每月20的google AI pro反代出来用API应该也能用个几百刀。
真的就是力大砖飞 越厉害的反而不会花很多钱就干完事情了 phd时间也是钱
唉 是的,菜是原罪
2.5 Flash都能用三千?
,我们用几十$都会被说太多
Google好像也发现了避税密码啊。以前AWS赞助给学校一百万刀AWS credit是真的能用掉好多算力的,AWS溢价也就比市场价贵个五到十倍。现在Google跟IRS说赞助给学校一百万刀AI token拿回退税,实际上phd们能用掉的量还不如一个大撸比phd自己名下开的几张amex卡加起来送的多。 PI也得到了简历上光鲜的一笔(Google赞助$1M),三赢
我感觉这种免费一般不是让你这么用的,一般都是默认网页聊天框随便用,api跑大规模任务得用经费
/uploads/short-url/pQf9MZ7VO1KqnBHwz7fdiAPjRLC.png?dl=1 我也在用谷歌api做一些项目,一个月自费30刀够用了而且新的模型api还便宜点
Hughu: 我不用你不用,token被拿来当作宝贝么? token要付钱呀,你用了他们就得花钱,所以不想你用太多
主要是 老师还要用LLM 进行科学发现,那大规模读论文,大规模调用agent,那3000哪打得住啊。咱就是说从工程角度
你开个订阅多简单,比你这直接花API便宜多了,一般价格都是1/10。走老板funding报销一个claude/openai的20x pro就完事了,一个月才200
你是说反代理 用么? 这还没想过。老板根本不给报销,这也是现在的问题。老板是能省就省,能不花钱就不花钱。然后之前还问过,是不是有卖免费的LLM API。我当时人都傻了,老师怎么还能问出这个问题。算力+训练都是要钱的,谁还会公益免费。。。 后面我说,要不DeepSeek。老师说,项目不能用中国的模型。
CPA反代。 你跟老板说学校不让你用这么多,给他讲清楚呗。不然学校不让你用,老板又不出钱,你也撂挑子不干了。这种钱得让他知道省不了,现在老板报销PhD的订阅是很常见的操作
应该远远不止1/10,大量用的话更接近1/50。我观察自己这边一个$15-$20的chatgpt teams 2 seat每个5h limit大概$16-$20标价用量,也就是$15能买到每个月$1000左右。 Hughu: 我不用你不用 如果这个quota只能拿来用token那无可厚非,但如果是Google cloud的generic credit可以用于其他算力,那楼主就是无端挥霍了,毕竟别人可以拿来用价格水分低的正常算力/存储。去云上租GPU用都比token标价便宜啊。
那就用呗,学校受不了要么找你老板,要么封你号 不过你这用法,不如考虑一下其他高级的包月plan,不过你用的多的话,可能几小时就没quote了
200刀的订阅能用的token价格远超api直接买 https://blog.csdn.net/weixin_40774379/article/details/157761460
你有amex商卡的话可以弄一下免费的GPT,不够用还可以买各家的订阅,这些都是高级model,比2.5 flash强太多了,潭里有教程说怎么manage各种不同来源的token
Hughu: 要不咱们用我们本地的gpt120b 你如果东西连oss 120B都能干,那就直接白嫖吧。太多渠道了,够你无限用了。 看这个帖子 https://www.uscardforum.com/t/topic/489382 /c/shopping/20 最近openclaw很火, 但是在隔壁楼看到大家还在纠结base llm怎么部署的问题, 于是这里分享一些我认为比较靠谱的API来源给大家. "比较靠谱"我个人认为要下面几个标准: 模型不能太菜, 弄个7b模型的API显然没什么意思 能保证数据安全, 毕竟OpenClaw这种会接触大量个人信息, 奇怪的API来源会导致数据安全无法保证, 所以我在这里不会推荐比较小的API农场/公益站 不会因… 英伟达无上限调用,延迟不高,失败率10%以下你加几次重试即可。OpenRouter充10刀一天1000次调用。 我反正自己试过一段时间,每天一千次调用来做知识库抽取什么的靠白嫖完全没问题
xenomorph: 潭里有教程说怎么manage各种不同来源的token 能指路一下么,想学习
给楼主推荐 http://freeinference.org ,是legit学术用途写个email过去让他们给开高一点用量就行
如果你就是benchmark的话,直接自己搭一个中转转算了呗,可以直接通过通过网页的方式获得免费的2.5 token
主要是老板想要效果好 还想白嫖API。我就有点烦。 感谢你的各种建议。我也还没试过反代。 英伟达的我也去看看。 老板让我做LLM + science科学发现。后期还要做agentic system 这玩意儿更费token,而且模型之间差异巨大。后面只会更烦,不会更简单。
哈里老师说话有点伤人。
没啦 感谢指出问题 后面我会改的
2.5 flash 都能用 3000刀,只能说,人才啊。 以前我 2.5 flash 使劲登都登不了几个钱。而且这货思考没深度,两下就强迫输出了,也消耗不了几个TOKEN
感谢感谢,别骂了
最简单就是cliproxyapi,以此为基础可以搞出很多玩法
你看一下 code 而且加一点 AUDIT CODE 吧 别完全当黑盒子啊 我自己的 非 CODING USE CASE, 每次 API CALL 都 LOG 的
两周3600用的还是2.5 flash?你是开了100个agent一起跑吗?
是的 你说对了
问的没问题。我觉得gemini 2.5 f这种模型,用了3k,你的pipeline有问题。
能编出/找出 impact来就不亏 跟你老板说能省下更多的开支/时间
Hughu: Could you let us know what this is being used for? 这正是增加visibility以及collaborate的好机会啊…
一开始给我们说的也是免费用 LTS is working on the process for payment of these API keys. We will let you know when one has been processed for you for Anthropic. To answer your previous question, when the the $100 cap is reached, you can apply for another key. We’ll likely need additional details on how the tool is being applied for record keeping. 年初蹬Antigravity的时候没了额度 我说支持一下正版吧 100的额度很快就没了 我申请第二个key的时候问我 Yes, I saw you quickly went through the allocation. Can you provide specifics on what you are working on? 我说用的opus+cc啊 然后倒是给了我第二个key 但是 This would be the last allocation I can approve given the costs. 建议没钱就别学大款 这个钱还是一个韩国校友捐的 我就说学校不可能突然这么大方
确实比较厉害的,我给office跑自动化一个星期也才几百
他们就是管理这个的engineer,,,,老师从他们里面还招了个新PhD学生。。。
/uploads/short-url/j8lsrJtyDxMRmQzmVSB2WmqS7x9.png?dl=1 这个好像就是2.5 flash? 这得回答多少问题才3000
咱就是说 那肯定不是简单的一问一答啊。。。。。。。。。
能讲出/编出 量化的 impact来就不亏
今天才跑出来新的结果,不用跑那么多循环了。可以降低费用了。只是 学校这个态度和老师这个想法,就是不pair啊 那之后做agentic AI researcher 那不更是,could you explain your research and why did you use so much token?
你开了caching了吗?我记得需要把location改成某个region eg us-central1才能用。
Hughu: could you explain your research and why did you use so much token If you are interested in my research please search my google scholar
开了 zszs
咱要不先理解一下agent工作流
这样子,不要开这么多线,开一个,跑完了,教学给agent怎么改,再跑下一个,等学一段时间以后agent就比Phd更好用了,自动进化
100个agent, 听上去有点厉害 不过真的适合吗? 有点像,找最大值的时候, 不用脑子,直接 brute-force, full grid-search.
Em……槽点满满,不知道从哪里吐起。
码农还是路径依赖,什么都得想想o,等非码农都开始用agent了,那才告诉你们什么叫tokenmaxxing
ssinz7: 建议没钱就别学大款 人家开始的时候也没想过是有人这样登吧。或者只想着对话或者类似的轻度。 有点像,GITHUB COPILOT 按次数计费的时候,没想到一些人居然 用一堆奇技淫巧,几千万 token 的塞到一个 request, 比如无限追问法等等。只能拉闸了。