有啥AI coding的软件推荐么
AI编程工具Agent模式持续进化,Copilot额度不足成新痛点,国内模型及Opencode成为成本优化和功能扩展的新选择,用户倾向多工具协同使用以应对不同场景需求。
1. 关键信息
- (之前已归纳) 原帖主痛点: 现有ChatGPT交互页面在代码生成和对话久了后会非常卡顿;为方便AI读取,所有代码放在一个
.py文件导致代码阅读和工程管理体验差。 - (之前已归纳) 原帖主需求:
- 支持SSH/Jupyter/Python/Terminal。
- 代码生成水准不弱于GPT 5.2 thinking。
- 更好的工程管理:能设定项目文件夹、子文件夹,针对特定文件或整体功能提问,AI能自动读取相关代码并提示修改。
- 价格合理,可靠性高。
- (之前已归纳) 推荐软件列表:
- (之前已归纳) IDE类: Cursor, Antigravity, iflow, VSCode (配合插件如Claude Code/Codex)。
- (之前已归纳) CLI类: Codex (原帖主订阅可能已包含), Claude Code, Opencode。
- (之前已归纳) 新增工具: Gemini CLI。
- (之前已归纳) 特定服务: Amazon Q (针对AWS服务)。
- (之前已归纳) 新增工具: Copilot,有用户表示是公司内的唯一选择,且支持Agent模式,能跑系列任务。
- (之前已归纳) Opencode的使用与本地模型挑战: 有用户询问Opencode与本地Ollama LLM结合使用的效果,指出本地模型调用存在问题,且不愿使用“大黄瓜”(可能指某大型商业模型),而Opencode的“zen”订阅价格与“cc”(可能指Claude Code或Cursor)相当。另有用户对Opencode给出积极反馈,认为其“真香”,且今年的Agent模式进步显著。
- (之前已归纳) 新增资源: SanityHarness Leaderboard,提供AI编码Agent的高信号、Agent无关评估,可用于比较不同工具的排名、通过率和模型。
- (之前已归纳) VS Code配合GitHub Copilot被认为是主要编辑器和AI辅助工具,Antigravity则作为Copilot用完时的备用选择。
- (之前已归纳) Opencode除了CLI版本外,还提供GUI和网页版本,但CLI版本被认为最好用。
- (之前已归纳) AI工具使用模式与分类:
- (之前已归纳) 有用户表示会同时使用多种工具,如Antigravity + VSCode + Codex + Claude + Cursor IDE + Cursor CLI,实现协同工作,甚至根据心情在不同工具间切换(如觉得Codex“蠢”时切换到Claude)。
- (之前已归纳) 新增分类: 根据用户参与度,工具可分为:
- (之前已归纳) “Vibe coding”模式(AI主导,用户少干预,不想自己看代码写代码): Claude Code, Codex, Gemini CLI。
- (之前已归纳) 协作编程模式(用户也参与编写): Antigravity, VSCode, Cursor。
- (之前已归纳) Codex的项目管理优势: Codex app被特别提及,其项目管理功能可为每个项目显示所有对话,方便随意切换项目和增加新任务,完美符合原帖主的工程管理需求。
- (之前已归纳) 新增反馈: 再次有用户强烈推荐直接下载Codex app,称其“非常好用”。
- (之前已归纳) Codex和Claude常被用户同时购买和使用,原因包括单一工具的套餐额度不足以及用户希望尝试不同工具的效果。
- (之前已归纳) NG程序员困惑: 类似痛点,希望学习高效的AI辅助编程(vibe coding),摆脱复制粘贴、上下文管理不便的现状。
- (之前已归纳) 本地模型实用性讨论: 用户对本地模型(如通过Ollama调用)在编码场景下的参数量和实际效果表示疑问,认为除非有很强的保密需求,否则用本地模型进行编码可能存在困难。
- (之前已归纳) Agent模式与工作流: 用户强调Agent模式进步显著,但使用时仍需细心调整prompt和workflow;有用户提到最长可记录15分钟的上下文,但其中很多时间用于压缩上下文窗口,导致运行变慢。
- (之前已归纳) 平台兼容性: 有用户询问Android项目是否也能使用这类AI IDE开发,得到肯定答复,认为完全可以。
- (之前已归纳) 用户环境特点: 有用户指出其开发环境不区分dev/prod,仅通过不同的BigQuery table来区分,这可能影响AI工具在敏感操作上的使用考量。
- (之前已归纳) Opencode的一个优势是可以无缝集成GitHub Copilot,利用Copilot慷慨的模型额度来弥补其工作流的不足。
- (之前已归纳) Agent模式被多位用户提及发展迅速,有用户表示体验后“回不去了”。
- (之前已归纳) GitHub Copilot目前不支持多个子Agent或Claude Teams,但对在现有代码库中开发新功能表现良好,其他Agent和技能仍可使用。
- (之前已归纳) 有“天坑专业”的学生寻求AI编程的入门教程推荐。
- (之前已归纳) 有用户询问Antigravity和Codex在使用中如何定位主次工具。
- (之前已归纳) 分享了多个
linux.do论坛上关于AI编程工具和技巧的讨论链接。 - 新增: 用户对CLI agent是否能实现端到端的代码审查和测试表示疑问,认为审查环节尤其困难,因为AI可能需要检查其修改范围之外的代码。
- 新增: 不同AI模型的编码风格差异显著,可能导致项目代码出现“拉屎山”(指代码质量差、风格不一致、难以维护),用户甚至能通过代码风格识别出是哪个模型生成的。
- 新增: 有用户建议,对于需要省钱且任务不大的场景,可以考虑使用国内模型(如glm-5, kimi 2.5, mm 2.5),而将Codex/Claude等用于更复杂的任务,最后再考虑Copilot。
- 新增: Agent模式在过去两个月内进步显著,被认为比半年前强太多,呈现指数级增长。
- 新增: OpenClaw-5.3 Codex被认为是体验最好的工具之一,尤其是在给予足够权限的情况下,但对于上班代码,建议用户谨慎使用,更倾向于LLM Chat一行行查看。
- 新增: Opencode支持Plan和Action模式,并能设置任务的有监督或无监督执行,解决了权限和复制粘贴问题。同时,Opencode可以“套壳”Codex和Claude Code的CLI,利用其订阅额度。Claude也推出了电脑版客户端。
- 新增: GitHub Copilot虽然有人认为不好用,但仍有用户认为其在公司环境中表现“挺给力”。
- 新增: 模型本身能力的提升(特别是Claude)是Agent模式效果显著提升的关键原因。
- 新增: OpenClaw的作者分享了其使用AI进行代码审查、优化和测试的经验:定期让AI回顾代码库,尝试优化和增加测试,甚至在没有明确功能需求时让AI重构代码和检查bug。其核心习惯是“每次merge之后问智能体:‘现在可以重构什么?’”,并强调智能体时代重构成本低。他还提到让AI自助学习,以及同时运行4到10个智能体处理不同任务(大功能、修bug、写文档)。
- 新增: 用户反馈同时运行3-4个Agent已感到精力不济,认为Agent的长期记忆和避免互相干扰是难点。大代码库从头读取效率不高,设计文档和代码的同步也可能出现问题。即使是简单的动态增减pod功能,也需要持续的Prompt输入和Debug。
- 新增: 关于Agent间协作,有观点认为Opencode自带的子Agent拆解任务可以避免用户手动管理多个Agent,但也有用户认为主Agent需要保留一定上下文才能有效管理子Agent,否则会增加用户负担,并且模型(如Opus 4.6 1M)在处理多任务时存在Context Blending和Mid-conversation decay问题。
- 新增: 用户对模型(如Gemini 1M context)的Attention有限和Context Blending问题表示担忧,认为其追踪复杂任务进度能力不足。
- 新增: Opus 4.6 1M模型在处理多任务时,即使有指令要求使用Subagent,也存在Context Blending和Mid-conversation decay问题。
- 新增: 用户直接对比了Opencode+Opus和Claude Code的强度,认为Opencode+Opus在Agent模式方面(Plan/Action、无监督执行)可能更强,但Claude Code作为独立工具,其模型能力本身也很强。
- 新增: 用户反馈即使拥有免费的Copilot,也常常感觉额度不够用,甚至使用了家人的账号。
- 新增: 有用户提出,当AI完成某项任务需要持续输入prompt时,这表明需要编写一个“skill”来自动化该流程。
- 新增: Antigravity(AG)被认为与VSCode+CLI类似,但其语音输入功能在对准度要求不高时非常方便。
- 新增: 用户强调多工具协同使用,如Claude Code(CC)和Gemini,因为单一工具可能无法解决所有问题,CC解决不了的,Gemini可能迅速发现。
2. 羊毛/优惠信息
- (之前已归纳) 学生优惠: 有学生身份的用户表示Copilot、Cursor和Antigravity都有免费一年的优惠。Codex和Claude则是自行购买。
- 新增: 建议考虑国内模型(如glm-5, kimi 2.5, mm 2.5)作为低成本、适合小任务的AI编程工具。
- 新增: Opencode可以“套壳”Codex和Claude Code的CLI,利用其订阅额度,这是一种间接的成本优化方式。
- 新增: Claude最近推出了电脑版客户端,虽然定位可能不是专业程序员,但也暗示了其在更广泛场景下的可用性。
- 新增: opencode上面现在可以免费使用 kimi 2.5 和 minmax 2.5。
3. 最新动态
- (之前已归纳) Agent模式被强调为发展迅速且进步显著,有用户表示其体验已达到“回不去了”的程度。
- (之前已归纳) Agent模式在代码审查和测试方面的能力受到关注和质疑,表明其应用场景正在被深入探索和评估。
- 新增: 国内模型(如glm-5, kimi 2.5, mm 2.5)被提及为新的AI编程工具选项,尤其适用于成本敏感和任务较小的场景。
- 新增: Agent模式在过去两个月内经历了显著的性能提升,被认为比半年前有了指数级的进步。
- 新增: OpenClaw-5.3 Codex被认为是当前体验最好的AI编程工具之一。
- 新增: Opencode在Plan和Action模式上的发展,以及其与Codex/Claude CLI的集成能力,是Agent模式应用的新进展。
- 新增: Claude推出了电脑版客户端,标志着其产品线向桌面端延伸。
- 新增: 用户反馈Copilot额度不足成为新的痛点,促使寻找替代或补充方案。
- 新增: AI需要持续输入prompt的情况被认为是编写“skill”以实现自动化的信号。
- 新增: Antigravity的语音输入功能被认为是一种便捷的交互方式。
- 新增: Gemini作为Claude Code的补充工具,在解决特定问题上展现出快速发现能力。
4. 争议或不同意见
- (之前已归纳) Cursor风险: 有用户报告Cursor曾尝试执行删除BigQuery表的命令,提示使用时需谨慎。
- (之前已归纳) Codex性能争议: 有用户体验反馈Codex有时表现“蠢”,导致需要切换到Claude等其他工具,这与部分用户对其项目管理功能的肯定形成对比。
- (之前已归纳) Opencode与本地模型集成挑战: 用户反馈Opencode在接本地Ollama LLM时调用存在问题,且其“zen”订阅价格与主流商业AI工具相当,引发了对性价比的考量。
- (之前已归纳) 本地模型编码实用性争议: 针对本地模型,有用户质疑其在编码场景下的实际效果和参数量是否足够,认为除非有极高的保密需求,否则本地模型可能难以满足编码需求,且其Agent模式性能可能很差。
- (之前已归纳) 付费/免费模式疑问: 有用户询问所推荐工具是付费还是免费版本,反映了用户对成本的普遍关注。
- (之前已归纳) 关于Agent模式的实际“代差”体验存在不同看法:有用户认为Agent模式发展迅速,体验后“回不去了”,但也有用户认为当前工具尚未达到“代差”级别,对现有代码库开发新功能表现良好。
- 新增: 对CLI agent在代码审查和测试方面的端到端能力存在疑问,认为其审查能力可能不足以完全替代人工。
- 新增: 不同AI模型产生的代码风格差异可能导致项目代码质量下降和维护困难,这是一个新的潜在问题被提出。
- 新增: 关于是否应优先使用国内模型来降低成本的策略存在不同意见,需要根据任务复杂度和成本敏感度来权衡。
- 新增: 对于上班代码,用户对直接使用Agent(如OpenClaw-5.3 Codex)持谨慎态度,更倾向于传统的LLM Chat交互方式。
- 新增: 关于Agent间协作的有效性存在分歧,尤其是在处理复杂任务和保持长期记忆方面,模型(如Opus 4.6 1M)的Attention有限和Context Blending问题被提及。
- 新增: 用户认为,即使是Opencode自带的子Agent拆解任务,也可能需要主Agent保留一定上下文才能有效管理,否则会增加用户负担。
- 新增: 用户直接对比了Opencode+Opus和Claude Code的强度,认为Opencode+Opus在Agent模式方面(Plan/Action、无监督执行)可能更强,但Claude Code作为独立工具,其模型能力本身也很强。
- 新增: Copilot额度不足成为普遍现象,即使是免费用户也面临此问题,促使人们寻找其他解决方案。
- 新增: 对于AI需要持续输入prompt的情况,存在两种观点:一是需要编写skill来自动化,二是可能表明AI的自主性或理解能力有待提高。
- 新增: Antigravity被认为与VSCode+CLI功能相似,其独特性在于语音输入,但整体上与其他工具的差异不大。
- 新增: 用户认为,单一AI工具可能无法满足所有需求,多工具协同使用是更优解。
5. 行动建议
- (之前已归纳) 针对工程管理和上下文问题: 优先考虑集成度高、支持项目文件夹和文件级提问的AI IDEs,如Antigravity、Cursor或iflow,它们旨在提供更流畅的开发体验。
- (之前已归纳) 探索Codex app的项目管理功能: 鉴于其在项目对话管理和任务切换方面的优势,建议尝试Codex app以改善工程管理体验。
- (之前已归纳) 再次强调: 强烈建议直接下载并使用Codex app。
- (之前已归纳) 利用现有资源: 如果已订阅Codex或Claude Code,可尝试将其与VSCode等常用IDE结合使用,以改善交互和上下文管理。
- (之前已归纳) 根据编程风格选择工具:
- (之前已归纳) 若倾向于“vibe coding”(AI主导,减少手动编写),可尝试Claude Code, Codex或Gemini CLI。
- (之前已归纳) 若倾向于与AI协作编写代码,Antigravity、VSCode或Cursor会是更好的选择。
- (之前已归纳) 安全性考量: 对AI工具执行的敏感操作保持警惕,尤其是像Cursor这样可能尝试执行破坏性命令的工具,并结合自身开发环境(如无明确dev/prod区分,仅依赖BigQuery table)进行风险评估。
- (之前已归纳) NG程序员入门: 建议从Antigravity或VSCode搭配主流AI插件(如Claude Code/Codex)开始,逐步熟悉AI辅助编程的工作流,并探索多工具协同的优势。
- (之前已归纳) 谨慎评估Opencode及本地模型: 对于考虑Opencode或本地模型(如通过Ollama)的用户,需充分评估其与本地LLM集成的稳定性、实际代码生成效果以及订阅成本,权衡与主流商业AI工具的优劣,尤其是在没有强保密需求的情况下。
- (之前已归纳) 入门建议: 建议通过Claude或Codex直接上手小项目,即便没有太多技巧也已很好用,同时可学习软件工程技巧以提高可靠性。
- (之前已归纳) 优化工作流: 使用AI编程工具时,需细心调整prompt和workflow,以更好地管理上下文和提高效率,尤其要注意上下文窗口压缩可能导致的性能下降。
- (之前已归纳) Android开发: 确认AI IDEs可用于Android项目开发,建议尝试以提升效率,摆脱传统“Studio + GPT复制粘贴”的低效模式。
- (之前已归纳) 关注Agent模式: 鉴于Opencode和Copilot等工具在Agent模式上的进步,建议用户探索其执行系列任务的能力。
- (之前已归纳) 混合编程模式: 如果不想完全依赖“vibe coding”,可选择在VSCode等IDE中观察AI如何修改代码,实现人机协作。
- (之前已归纳) 评估工具性能: 建议查阅SanityHarness Leaderboard等专业评估平台,以比较不同AI编码Agent的性能和排名。
- (之前已归纳) 探索学生优惠: 具备学生身份的用户应积极查询Copilot、Cursor和Antigravity等工具的免费或优惠政策。
- (之前已归纳) 鉴于Agent模式的快速发展和用户积极反馈,建议用户积极尝试并探索其在编程工作流中的应用。
- (之前已归纳) 对于寻求入门的“天坑专业”学生,建议关注社区推荐的入门教程和资源,并可从Claude或Codex等工具的小项目实践开始。
- (之前已归纳) 考虑Opencode与GitHub Copilot的集成,以利用Copilot的额度优势。
- (之前已归纳) 探索并利用社区分享的外部资源,如
linux.do上的相关讨论,获取更多信息和经验。 - (之前已归纳) 关注不同工具(如Antigravity和Codex)在工作流中的定位,根据个人习惯选择主工具和辅助工具。
- (之前已归纳) 建议将VS Code与GitHub Copilot作为主要的AI编程环境,并考虑Antigravity作为备用方案,以应对Copilot额度或特定任务需求。
- (之前已归纳) 尝试Opencode的CLI版本,因其被用户评价为最好用。
- (之前已归纳) 考虑根据个人使用量和对不同模型的需求,灵活购买和搭配使用Codex和Claude等工具。
- (之前已归纳) 在多AI模型协同编程时,需警惕不同模型产生的代码风格差异可能导致项目代码质量下降和维护困难,建议制定统一的编码规范或尽量标准化使用的AI模型。
- (之前已归纳) 在使用CLI agent进行代码编写时,需要审慎评估其端到端审查和测试的能力,必要时进行人工复核,以确保代码质量和项目稳定性。
- 新增: 建议根据任务复杂度和成本敏感度,策略性地选择使用国内模型(如glm-5, kimi 2.5, mm 2.5)处理小任务,以节省成本,并将更高级的AI工具(如Codex/Claude)用于复杂任务,最后再考虑Copilot。
- 新增: 鉴于Agent模式的指数级进步,建议用户积极关注和尝试最新的Agent工具和技术,以跟上行业发展。
- 新增: 对于OpenClaw-5.3 Codex等体验极佳的工具,建议在非关键的上班代码场景下谨慎使用,或作为辅助工具,并优先考虑LLM Chat等更可控的方式。
- 新增: 探索Opencode的Plan和Action模式,以及其与Codex/Claude CLI的集成能力,以提升工作流的自动化和效率。
- 新增: 关注Claude电脑版客户端的发布,评估其是否适用于个人或团队的编程需求。
- 新增: 对于Agent协作中的长期记忆和避免互相干扰问题,建议关注模型(如Opus 4.6 1M)在Context Blending和Mid-conversation decay方面的进展,并尝试优化Prompt和Agent管理策略。
- 新增: 建议用户在多Agent协作时,明确主Agent和子Agent的角色分工,并根据模型能力调整期望,避免过度依赖单一Agent完成复杂任务。
- 新增: 考虑使用SanityHarness Leaderboard等工具来客观评估不同AI编码Agent的性能。
- 新增: 直接对比Opencode+Opus和Claude Code的强度,认为Opencode+Opus在Agent模式方面(Plan/Action、无监督执行)可能更强,但Claude Code作为独立工具,其模型能力本身也很强。
- 新增: opencode上面现在可以免费使用 kimi 2.5 和 minmax 2.5,可以作为低成本选择。
- 新增: 针对AI需要持续输入prompt的情况,建议研究和开发“skill”来自动化重复性任务,提高AI的自主性和效率。
- 新增: 面对Copilot额度不足的问题,用户应积极探索Opencode(利用其套壳能力)、国内模型以及其他AI工具作为补充方案。
- 新增: 建议尝试Antigravity的语音输入功能,尤其是在对代码精度要求不高的场景下,可以提升交互效率。
- 新增: 鼓励用户采用多工具协同的策略,例如将Claude Code与Gemini结合使用,以应对不同AI工具的优劣势,提高问题解决的全面性和效率。
现在经常性的是和chatgpt交互 用5.2 extend thinking 然后生成各种ML代码 自己再去微调 但还是用最原始的复制粘贴代码
但发现两个问题: (1)代码生成久了 那个对话的网页就特别特别卡 不知道是feature还是也和电脑配置有关 在PC上稍好但依然比较卡… (2) 为了维持一致性 所有的代码都放在一个.py文件下(方便直接复制丢给AI)但代码阅读体验就很差…
求推荐一些更先进的软件:
(1)需要支持SSH/Jupyter/Python/Terminal(这些应该没啥问题吧)
(2)代码生成水准起码不弱于GPT 5.2 thinking
(3)更好的工程管理?希望就是我能设定一个project 文件夹 里面有不同的subfolder存不同部分的代码 我能针对于特定某个文件提问(比如最核心的train.py)/general的说要实现一个新功能 然后AI能自动读取需要的subfolder里面代码文件 根据prompt提示每个文件分别需要改哪里 而不需要人工贴不同文件的内容给它
日常用量不小 软件靠谱价格合适就行 不需要挂逼
有关注到cursor/codex/claude code 但不知道哪个用起来综合体验更好一些 还是说这玩意也YMMV
cursor?不过我们公司发生过cursor想要跑把bigquery table删掉的命令…
claude or amazon q for AWS servies.
这不就是codex和claude code
IDE: Cursor, antigravity
CLI: Codex (你订阅已包含), Claude Code
开源的就不列举了
(感觉你问 ChatGPT 也能得到答案
个人使用antigravity或者vscode+claudecode/codex
iflow可以试试
個人目前是antigravity +vscode+codex+claude+cursor ide+cursor cli。 基本上是一個交響樂團我只是指揮
求问下咋一次性用这么多?交叉用吗
我也有类似的问题请教大佬们,作为有编程基础的NG程序员怎么从零开始学vibe coding()
目前都是chat页面复制粘贴一来一回,感觉效率很低(改一个东西就要对话一个回合),而且不是很方便交代上下文,要么整个文件扔给他(还要指出重点看哪里),要么铺垫半天
什么样的set up比较好?
if you want ide, antigravity
if you want cli, opencode
直接干,玩个小project, 马上就能上手
你们dev能连prod?
感觉cline也不错
各种model可以随便用
肯定比复制粘贴到chatgpt强
你這是看心情決定叫哪一個起來用嗎
LetMeGoogleThat.com
Agentic Coding
For those who think it's easier to annoy you than to Google 'Agentic coding' themselves.
Or 你问过ChatGPT这个问题了吗
看我今天心情怎樣哈哈哈
還真的是這樣。用一用覺得他媽的codex蠢死了我就叫Claude 出來
project management完美符合codex app,每个项目给你显示所有的conversation,你可以随意switch项目增加新的working task
只想vibe coding,不想自己看代码写代码,claude code,codex,gemini cli
想自己也写:antigravity,vscode,cursor
opencode + codex最便宜实惠,还功能强。甚至想要啥功能可以自己写
【引用自 未知】:
明天组会懒得做slides了 搬砖
直接让OpenCode写个HTML网页展示
[d422aee325f30d6686fa555945bba7b4]
反正项目也是它写的,实验也是它跑的,架构和数据什么的门清,一次搞出来了非常像样的demo网站
正想说你这个
另外楼主的描述就
ai很容易让人觉得自己生活在原始社会… 很容易outdated。
另一方面又因为这些需求的存在导致还有很多遇到了就能想到的并不难的问题创造了很多中小机会。
opencode好用吗,我接本地的ollama几个llm工具调用都有问题,模型不想用大黄瓜又得订阅zen,一看价格跟cc一样贵…
本地模型多少参数的啊
除非有很强的保密需求 我觉得用本地模型做coding实在有点难了
试过deepseek671b,gpt-oss120b和qwen3:32b,都不行,有的会有[tool=todolist]这种output,有的直接答非所问,主要是不想花钱
你可以去localllama上翻一下 说不定有人踩过坑了
我只有16g vram跑不起来能用的模型
minimax 2.1我高强度用 上个月也就花了35rmb
他家还有个包月的订阅好像是50多
我可能是少数,喜欢vscode + github copilot
也能做一些小customization
一是不喜欢命令行(虽然也有)
二是不写前端,也不放心agent 自己跑很久
vscode的prompt感觉写的不太好,同模型claude code就很强,但vscode上效果打了不少折扣,不过好处是按次计费,虽然有的模型(我发现gpt很喜欢这样)无论你prompt多详细,给你几段话就直接结束了
可以找一个小项目用claude或者codex直接开做,现在的这些工具即便没有太多技巧也已经很好用了。要更可靠一点可以了解一些软件工程的技巧。
需要细心调promopt和workflow
我试过最长记录一个context跑15分钟
但其中很多时间是压缩context window,跑一会就慢了
我公司里唯一的选择
借楼问下Android项目也能用这类IDE开发嘛
你可以试试,但本地小模型agent估计性能很差吧
完全可以吧
我去年也这么干,后来换了opencode,真香,今年的agent 比以前进步太多了
一直用的studio + GPT copy paste,感觉效率很低,这我得试试了
copilot 也有 agent mode,能跑系列
claude code 和 codex 二选一吧,亚麻的kiro也聪明一些了,但跟CC还没法比。不想完全vibe coding,开个vscode看它怎么改的
完全两回事,有代差了
我们不像正经公司有env区别的,dev和prod只是存在不同的bigquery table…
SanityHarness
SanityHarness Leaderboard
High-signal, agent-agnostic evaluation for AI coding agents. Compare rankings by weighted score, pass rate, and model.
推荐直接下载codex app,非常好用
这些都是付费的么?还是都用免费版
我還有學生身分所以copilot cursor antigravity都有免費一年。codex Claude是自己買的
opencode有个好处是可以无缝integrate github copilot
copilot的工作流不行 但是模型额度给的很慷慨
大佬有没有什么入门教程推荐给天坑专业的苦逼学生
我以前也是这样,但是最近用了agent后回不去了。发展太快,建议试试。
是antigravity作为主要工具,安装各类插件吗?还是codex作为主要工具,拿antigravity做编辑器?
没有到代差地步。唯一缺的就是 github copilot 不支持多个 sub agent / cc 新出的 claude teams,其他 agents / skills 都能用。如果你不是从头开始玩个新的项目,而是在已有的 codebase 内部开发新 feature,它还完成的不错。
linux do很多,我收藏的一些
https://linux.do/t/topic/1329050
https://linux.do/t/topic/1430711
https://linux.do/t/topic/1404993
https://linux.do/t/topic/1463543
https://linux.do/t/topic/1447395
https://linux.do/t/topic/1011983
其實編輯器主要還是vs code +github copilot
Antigravity 主要是在GitHub copilot 用完的時候的下位替代。
Codex 跟 Claude 我的用法基本上是一樣的 。會兩個都買其實只是20元的plan不夠用,再加上兩邊都想試看看
Opencode +1
而且这货不仅有CLI 还有GUI和网页版本 虽然没CLI好用
不同model的coding style差别挺大的,最后看到一个project里不同model互相拉屎山也是眼前一黑,有些func看两行我就知道是哪个model撇的了
Coding Agent 目前算是 LLM 最明显的生产力落地项目,还抱着 Chatbot 一问一答属实太低效
Antigravity 或 VSCode Copilot 是运行在编辑器这一侧的,Claude Code 和 Codex 运行在远程的 Shell 中。与我而言半自动 Coding──每修改都需要我认真审查的我会有前者,而全自动 Coding──无需我审查代码只需要验收效果的就后者来。
苹果用户CC
安卓用户codex
欢迎尝试Adal-CLI,性能可以和Claude Code媲美的CLI,但是提供了更好的交互和模型选择!website: https://sylph.ai/
doc: https://docs.sylph.ai/
用CLI agent写代码是直接让AI自己end-to-end review加测试吗
感觉review很困难啊
很多时候需要检查它修改范围以外的代码
【引用自 Yen-Hsiang】:
Codex 跟 Claude 我的用法基本上是一樣的 。會兩個都買其實只是20元的plan不夠用,再加上兩邊都想試看看
想省钱要不要试一下国内模型? 最近出的 glm-5, kimi 2.5, mm 2.5 都很好了。小task用这些,大task (比如开头plan或者比较难的debug) 用 codex/claude? 到时候,如果codex/claude 需求少的话,还能上copilot. 才10刀。
cli agent会自己写测试,假如不加unit test的话加一些提示词也很容易让它做完所有task以后写测试验证。
review我一般是用github action的claude code pr review。这样发现不对还可以直接倒退。
别多想,所有能试用的全都下载下来用一遍
这也太古法了……应该先让Claude code plan,搞不定再自己上手
个人体感codex 5.3 extra high写的代码质量最好。但codex app做的不太想,纯单线程。
cli本身的质量最好的是opencode,其次是claude code。但claudecode的max llan便宜token opencode没法用。所以我现在都是退而求其次,用cc+oh my claudecode。然后让codex解决复杂问题或者review来提高代码质量。不差钱的话其实oh my opencode是最完美的。
但是有一些是existing code base上改,也可以吗?
没啥不可以的,可以完全handsoff,等改好了自己review一下。我现在工作pr title description 全都是Claude code写的manual test直接指挥claude本地vibecode一些oneoff scripts
我觉得这两个月的agent都比半年前的强太多。真指数增长
论体验最好的我目前觉得是openclaw-5.3 codex,只要胆子够大,权限给足
惊喜杠杠的
上班代码的话建议还是自己老老实实llm chat一行行看比较好。。。
还有plan和action模式 并且可以设置各种任务执行是有监督还是无监督 解决了楼上很多人担心的权限问题还不用复制粘贴
还能套壳Codex和Claude code这两个cli 有这两家订阅也能直接用(我个人不仅用claude写代码还有其他毫不相干的需求,只买cursor这样的代码工具的subscription觉得不划算)
不过Claude 最近也出电脑版客户端了,虽然我看是给非马工准备的(之前看了一篇文章讲一个不懂代码的vc是怎么挣扎着用Claude code命令行处理表格的,说明这方面需求也在变多)
很多人说copilot不好用,但是我在公司一直用的copilot了,一直挺给力的
主要是模型本身变强了,claude 贡献很大。
以前的模型太弱了,做agent效果也不好
OpenClaw的作者讲过他自己的经验,我参考他的做法,定期让AI自己回顾整个代码库,让它尝试优化和增加测试。有的时候想不出来要加什么功能了,或者需要开会没空管AI,就让他自己去重构代码和检查bug。
从不回滚,永远commit到main。 如果有问题,让智能体往前修,不往回退。他在本地跑CI(持续集成),测试通过直接push到main,没有develop分支。这个做法的前提是:智能体时代,重构的成本已经很低了。
每次merge之后问智能体:“现在可以重构什么?” 这是他的核心习惯。智能体在构建过程中会发现痛点,就像人类程序员写完代码后会产生重构冲动一样。如果你不定期做这件事,代码库会越来越烂,智能体工作效率也会越来越低——然后你就会上Reddit发帖说"模型变笨了"。
“你有什么问题要问我吗?” 这是他跟智能体互动时最常说的一句话。目的是了解智能体的知识盲区。很多时候他的回答是:"去读更多代码,自己回答自己的问题。"让智能体学会自助,而不是事事依赖人类。
他日常同时运行4到10个智能体,取决于任务复杂度和自己的精力。一个做大功能,其他的修bug、写文档。文档大部分是智能体自动生成的,他在里面注入prompt来控制风格和质量。
运行10个是精力真好
我现在3-4个感觉已经有点drain了
当然可能是我的配置还不够有效率agent不够自主
我觉得难点在于让agent保持代码库现状的长期记忆
特别是你开几个不同的在同一份代码上做事之后怎么避免互相打架
大repo每次从头读真的不太行
我现在试的是让它把design doc和代码一起进
但是有时候两者会diverge,然后agent就会开始confuse
还有就是有些我需要的处理的代码它确实还是处理不了必须手把手教它写
我昨天试图脱手让它搞一个很简单的动态增减pod的功能。我完全不看代码出问题看一眼log告诉它往哪里debug
一天下来都没完全跑通
【引用自 收束观测者】:
特别是你开几个不同的在同一份代码上做事之后怎么避免互相打架
不需要自己开几个agent在同一个代码库上干活啊,opencode自己会分发subagent拆解任务一起干活的
【引用自 xxxyyy】:
不需要自己开几个agent在同一个代码库上干活啊
做的不同feature不同的事啊
你全告诉主agent呀,他自己会拆解分工给几个agent。
我每次都是说要做1 2 3 4 这件事,完全没问题
我的体验是不太行
做一件事都需要我持续输入prompt
以它lose context的频率来看一个context window做多件事我不觉得它能做好
如果主agent只是起一个给多件事的subagent传话作用的话跟起多个没区别,反而增加我处理的负担,每次我都得处理所有事的下一步输入
如果主agent在同时管所有事的话我的经验是1M window一会儿就没了(即使所有代码已经是在subagent里处理了)
【引用自 收束观测者】:
以它lose context的频率来看一个context window做多件事我不觉得它能做好
sub agent都是自己的context,跟主agent没关系。
主agent会把任务分发给其他agent(比如planner,explore什么的),自己context不会很大,主要就是代替了你自己管理4-10个agent
【引用自 收束观测者】:
现在3-4个感觉已经有点drain了
主agent必须要知道subagent在做什么这个sub关系才有意义
所以它可以少keep一点context但是不可以完全没有
不然它无法正确管理subagent
你这个感觉单纯就是每个任务复杂度都很低
现在model感觉attention非常有限
三四个prompt之前的指令即使没有和后面的冲突,decay也非常厉害
让一个context追踪3、4个复杂任务的进度肯定出问题
【引用自 收束观测者】:
现在model感觉attention非常有限
你用的什么模型?Gemini的话1M context表现会很差
opus 4.6 1M
公司掏钱我always on instruction是让它干任何事都用subagent操作的
它违反指令以后我让它自己分析为什么违反
最明确的答案就是mid conversation decay和context blending
system prompt也应该更新了 不过确实模型强了不是一点半点 最近两周每天感觉都在给自己的码农职业数倒计时
【引用自 marszoom】:
最近两周每天感觉都在给自己的码农职业数倒计时
打不过就加入,去做agent的组就行了
我最近也开始用越来越多用AI写code,分析数据。模型和agent确实是越来越强,比一年前好太多了。就现在我还是半自动化,想好问题和大概解决方案,分解成大概步骤后交给cursor或者claude完成,中间人机交互多一点但最后效果和效率都还不错。
之后准备逐步尝试全自动工作流,减少人机交互,同时尝试多任务并行执行。我感觉公司内部只要能把各种数据,API,内部系统和LLM打通(通过mcp和skills),整体效率还能再上一个档次。
最后确实感觉码农被革命越来越近了,大模型比组里的junior和某些水货senior写的代码和文档强多了,就算是屎山至少基本的工程质量也完爆手写的代码,更不要说效率的天差地别。
现在公司还在逐步适应阶段,等各个流程全面打通和AI能无缝集成了,裁掉50%初级和中级码农绝对不是空谈。
【引用自 tty17】:
大模型比组里的junior和某些水货senior写的代码和文档强多了,就算是屎山至少基本的工程质量也完爆手写的代码,更不要说效率的天差地别。
+10086
Windsurf,便宜
感觉会很有用的帖子,先收藏一波。
【引用自 hahaandhehe】:
最近出的 glm-5
看到有帖子说饥饿营销根本抢不到
所以opencode+opus强,还是claude code强?
有人试过新出的minimax 2.5么 感觉有点不太敢信国内新闻
(另 gemini 3 pro high太弱智了 但antigravity白嫖的4.6感觉只能撑几分钟
借楼问下有什么经济方便的技巧
感觉现在也不能固定用哪家的model
买很多API又麻烦,也是选择copilot的一个原因
【引用自 桂花粥】:
看到有帖子说饥饿营销根本抢不到
kimi 2.5 and minmax 2.5 都一样,都半斤八两。这两个现在opencode上面就是免费用。
我有免費的copilot啊。我連我老婆的都拿來用了哈哈哈哈還是不太夠
【引用自 收束观测者】:
做一件事都需要我持续输入prompt
这个时候就是需要写一个skill的信号了
国产模型那么便宜,就不要那么抠了啊。按API付费也没几个钱
能写skill的早都写了
更general的行为模式我试过自己写,不如superpowers套装就直接用人家的了
很多时候持续prompt是在回答它问题
或者各种case by case的决策,怎么写skill?
买个 Claude Code $20 订阅,打开就会了
像我这种老古董Antigravity最适合我,还是喜欢IDE,CLI对我来说太没有安全感了
那只能尽量把问题break up出去了,就把agent 当成一个mid level eng来用
没啥区别啊 ag也就是个vscode+cli吧
antigravity的直接语音输入也很方便,扒拉扒拉一大堆话描述,对于准度要求不高的,非常爽的
一般来说确实cc厉害,但我觉得不能一杆子打死,今天有个问题cc半天解决不了,我让gemini火速给我发现了
三家一起用
下次试试,ag现在把cc的quota降低到基本不能用了 醉了