Tokenmaxxing用途之一:反编译后audit各种自用的软件
Tokenmaxxing催生AI辅助反编译审计闭源软件新需求
关键信息与核心观点
- 应用场景:用户 @Wi-Fi 分享利用高额信用卡额度获取的无限Token进行“Tokenmaxxing”,将AI Agent用于反编译和审计自用的闭源/半闭源软件,以检测后门、恶意代码或逻辑异常 #1。
- 具体案例:
- 技术流程:并非让LLM直接读取二进制,而是由Agent调用专门的反编译/脱壳工具(如针对VB6、加壳软件的工具),再将结果输入AI进行逻辑分析和代码审查 #10, #11。
成本与经济效益分析
- API成本对比:@Wi-Fi 指出使用GPT-5.5 API审计一个小软件花费约$44,而该软件售价仅$5-$10;若让AI修改开源源码自行编译以规避付费,成本约为每月$20 #9。
- 价值主张:虽然API标价水分高,但对于拥有免费/高额Token额度的用户(如Amex持有者),边际成本极低,使得“审计闭源软件”变得经济可行,打破了以往仅依赖开源软件的局限 #1, #9。
- 建议:普通用户若想省钱,可采购低价模型(如Deepseek)而非使用高价美国AI模型 #9。
技术限制与注意事项
- 工具依赖性:LLM本身不具备反编译能力,必须依赖Agent调用外部逆向工程工具;不同环境(如Windows vs Ubuntu)对特定语言(如VB6)或加壳软件的支持程度不同,可能需要配置特定的运行环境 #10, #11, #12。
- AI局限性:AI擅长发现明显的恶意逻辑、网络请求异常和简单混淆代码,但对于隐藏极深的后门或大型复杂项目(如Adobe全家桶)效果有限,主要适用于一人作者开发的小型工具 #1, #7。
- 幻觉风险:在输出伪代码时可能出现Hallucination,需人工复核关键逻辑 #7。
社区讨论与衍生话题
之前已经有不少讨论在公司内tokenmaxxing如何找用途的帖子(https://www.uscardforum.com/t/topic/509368 https://www.uscardforum.com/t/topic/496841),昨天看到这个https://www.uscardforum.com/t/topic/512800/,在个人生活/学习途中也tokenmaxxing,有感而发,想分享一下我被tokenmaxxing催生的新需求:auditing。 众所周知,code review是很累的,即使是开源软件也不见得有很多双眼睛盯着,可能黑帽比白帽多;闭源软件就更不用说了,肯定有一直没修的陈年酿造bug,而且不管是大企业还是不知名小作者都可能留后门。以前我在电脑和手机上装软件也都比较懒惰,确认是reproducible build的就拉倒。最近有篇论文说AI code review做的比人好,我觉得这个结论本身不见得靠谱,但是侧重点不同,AI牛马不喊累,多加班肯定是好的。 故事源于两年前的这个时候,有人质疑泥潭某插件,为了公众利益我手动https://www.uscardforum.com/t/topic/150382/611了它的代码;代码是obfuscate编译压缩后的,当时还没有coding agent只有chatbox,我手动deobfuscate然后肉眼+AI结合着看完非常累。这个插件后来不再更新了,我有一天想安装它的继任者,于是又开始audit(虽然我也挺相信各位作者潭友,但我自用的插件还是得routinely的audit一下,毕竟涉及金融)。这次就比较偷懒了,直接丢给agent让他反编译、拆分功能,着重分析所有网络请求,给我出一份报告着重讲我想检查的部分。很快报告就回来了,我也愉快的装上了插件。以前我在论坛看到有人分享userscript我都要顺手读一下看看没有恶意投毒,但是这种大插件我是懒得看的,现在tokenmaxxing了都可以看了。 某次跟着潭友买手机也是,要用毛子来路不明软件尝试解锁。我一开始也懒得分析这软件到底干了啥,丢进虚拟机里拉倒,但是软件不work,解锁失败。我想知道为啥,顺便深入学习一下毛子神奇的解锁黑科技;于是又开始让agent反编译、让AI帮我搞清楚具体的功能逻辑,然后才能我来分析到底为啥不work。当然,结论有点令人失望,那软件真的啥都没干,是T家上游服务器有bug,后来bug被封死了。 今天看到有个核心开源GUI闭源的方便本地跑模型推理框架的工具,GitHub上只放了图文并茂的README和二进制,但是官网又写download from GitHub有点误导消费者的感觉,而且只有一个作者。可能是他想方便以后盈利吧?换成往常我就不敢用了,乖乖自己手动跑mlx/hf库加载模型(一人作者的软件起码得像openwhispr这样开源+收费我才敢用)。但是tokenmaxxing!我决定audit一下,没问题的话也是可以用的。于是打开agent简单说了一下任务让它开工了。事实证明这个作者没什么心眼,程序没混淆(可能也是vibe出一个能跑通的就直接上架了),里面就是一个electron壳套html前端、一套打包好的开源核心。接下来让AI审一下所有的网络和文件读取部分,没找到什么异常,我也就决定可以用用看了。 一来二去养成了习惯,所有我不太相信的软件都tokenmaxxing分析一下再用,反正token越来越多、模型也越来越懂了。模型基本不会拒绝不涉及挖洞的security audit的请求(只要别用那个发“你好”就封号的公司的模型就行)。 tokenmaxxing打开的新世界是让我可以随时分析我刚下载的软件/刚打开的网页,有没有明显的后门;虽然拦不住隐藏的很深的后门,但能挡掉一些拙劣的尝试也够了。以前只看开源的软件、自己大致看几眼关键部分的代码,以后闭源的也可以audit、全面分析无死角不遗漏。当然,AI对大项目(比如各位潭友刚白嫖上车的Adobe全家桶)有心无力,但对一人作者写的小项目足够了。 至于具体如何执行,每个人都有自己的偏好和侧重点,我觉得大家写各自看重的方向更好,这样agent进行audit的思路也更diverse。如果没有相关背景可以搜几个skill装上。 最后,感谢amex赞助的用不完的token。没有amex的泥潭地铁蟋蟀选手也可以搞点开源模型配额,参见 https://www.uscardforum.com/t/topic/489382
前排支持最好的Wi-Fi老师
后排支持最好的 /u/wi-fi 老师
快进到 #52pojie 版
破解就算了,如无必要不用非开源软件。而且在泥潭买正版还可以倒赚,拉动一些GDP也是不错的。 我其实比较支持开源但是app store收费上架那种模式,自己编译就不用给钱。
小工具以前还可以收懒人税 到ai时代护城河很难办吧 要不就是和deepseek一样开源但是本地正常人无法部署?
虽然不是tokenmaxxing,不过我也确实用过某些llm反汇编,结果只能说差强人意吧。 确实判断出了程序本质是个骗钱软件(写着"未注册"要打钱实际上是个空壳),但在试着输出伪代码的时候还是hallucinate了(而且还是VB6这种被逆烂的东西 258: 快进到 #52pojie 版 我这骗钱软件就是52pojie下的
几个月前我就开始搞这些了,但是公司内部不能这么做比如你要分析个啥竞品,有法务风险,只能自己玩。
懒人税可以继续收,比AI便宜就行。给一个totally out of context的对比,我用gpt-5.5刚跑完一个小软件的audit,按API计价算一共花了$44,小软件本身可能卖$5,撑死了$10。之前分析openwhispr GUI也花了差不多这么久,钱应该差不多,这个软件的高级模式每月$20;让AI改开源源码自己编译来不给钱的成本我估计是一个月的月租。 当然,必须mandatory disclaimer,美国AI模型的标价水分很高,让 https://www.uscardforum.com/t/topic/510012/34 每天用$10000的员工更加感恩戴德 我只是刚好白嫖了所以用,想省钱应该 https://www.uscardforum.com/t/topic/510012/34 采购¥1的deepseek
snowboy: 用过某些llm反汇编 应该是agent下载安装专门的工具跑反编译、再去读反编译出来的结果,不是让agent自己读入二进制之后输出结果。实在不行的话需要agent现场改工具、给工具写插件,但也不能从零开始写反编译反汇编工具。各种软件加壳都有专门适配的脱壳分析工具,llm负责认出来是哪一种然后对症下药就行。
那当然是agent去跑工具出来的结果了 也许VB6在Ubuntu环境下没有很好的工具吧
你提醒了我,agent自己不会主动开windows虚拟机换成在windows下跑,有些逆向工具windows下方便,我得搞个windows环境装好agent方便跑这类需求
aqua: 后排支持最好的 /u/wi-fi 老师 后备箱支持最最好的 /u/aqua 老师后排支持最好的 /u/wi-fi 老师
https://x.com/beaversteever/status/2061177528123793728
Wi-Fi: tokenmaxxing 感觉已经到头了。现在各大公司都在收紧token usage了。
你们平常一周token用量都在什么水平,我基本就1b token不会再多了
前排支持 高质量好帖
Wi-Fi: tokenmaxxing打开的新世界是让我可以随时分析我刚下载的软件 再进一步直接让ai复刻一个别人的软件
Just never get caught. 我特此对外宣称,我从来不读任何paper的,如果有AI半夜读了我自己也是不知道的,我从来不和AI讨论任何idea。以后如果打patent invalidation官司,对方律师提出我家的网络半夜3am打开了arxiv pdf,一定不是人类活动,要么就是AI随机测试搜索功能,要么就是IoT设备被黑了替国内的industrial espionage下载美国尖端技术机密。人类才不会3am打开paper。