泥潭日报 uscardforum · 每日精选

开发agent大家有什么见解嘛

内容摘要

开发Agent的讨论深入探讨了AI辅助编码的挑战与实践,特别是模型的不确定性以及如何通过代码来稳定Agent的行为。

1. 关键信息

  • (之前已归纳)讨论围绕“开发Agent”展开,明确为“开发agent”而非“用agent开发”。
  • (之前已归纳)提到了可以使用现成的Framework或公司CLI。
  • (之前已归纳)用户询问开发Agent的具体目的,例如解决特定问题。
  • (之前已归纳)建议利用Claude等AI助手辅助Agent的编码工作。
  • (之前已归纳)推荐GitHub仓库 badlogic/pi-mono 作为AI Agent工具集,包含CLI、LLM API、UI库等,可用于学习和实践。
  • (之前已归纳)用户cl3提到“N姐好多面試呀!”,暗示了讨论可能涉及与招聘或职业发展相关的背景,但具体细节未展开。
  • 最新回复用户表示在开发Agent的过程中遇到了困难,形容为“头秃了”。
  • IlllIIlIIIllIIl指出,开发Agent的主要难点在于模型输出的不确定性,即使模型当前表现良好,也可能随时出现错误,需要大量代码来验证其输出。
  • IlllIIlIIIllIIl认为许多所谓的“全自动”Agent难以落地,容易陷入无限循环或卡死,强调应设定明确的规则和范围,让Agent稳定地完成一到两件重复性的小任务。
  • IlllIIlIIIllIIl认为花哨的框架不如自己手写判断逻辑来得稳健,本质上Agent开发就是处理模型的不确定性,并用代码来“接住”这些不稳定的输出。
  • IlllIIlIIIllIIl建议从最简单的任务开始,优先解决“稳定”问题,再考虑复杂性。
  • deng47将使用本地LLM搞Agent比作教导一个婴儿走路,形象地说明了本地模型的不成熟和需要大量调教。
  • whtf提到“Qclaw已经内测了,即将发布”,暗示可能是一个新的Agent或相关产品。
  • otonoco建议在开发Agent时要“循序渐进”并“设定好安全词”,强调了稳定性和风险控制。

2. 羊毛/优惠信息

3. 最新动态

  • whtf提到“Qclaw已经内测了,即将发布”。

4. 争议或不同意见

  • 无明显争议,讨论主要集中在技术实现和应用方向的探讨。

5. 行动建议

  • (之前已归纳)对于想开发Agent的用户,可以考虑利用现有的Framework或CLI工具。
  • (之前已归纳)在开发前,明确Agent需要解决的具体问题和应用场景。
  • (之前已归纳)可以尝试使用Claude等AI工具辅助Agent的开发编码。
  • (之前已归纳)推荐研究 badlogic/pi-mono 这个GitHub项目,通过代码学习和实践Agent的开发。
  • 对于在开发Agent过程中遇到困难的用户,可以继续探索和寻求解决方案。
  • IlllIIlIIIllIIl建议开发者优先关注Agent的“稳定性”,从简单任务入手,并强调通过代码处理模型的不确定性。
  • deng47的经验表明,使用本地LLM进行Agent开发需要耐心和大量的调教。
  • otonoco建议在Agent开发过程中,应采取“循序渐进”的方式,并设置“安全词”来控制风险。
原始内容
--- 第 1 楼来自 nin11 的回复 (2026-03-12 14:27:05 PDT) ---

哎 ng真是太可怜了

问完gemini来当伸手党

明明昨晚还在k8s linux

--- 第 2 楼来自 psilocybin 的回复 (2026-03-12 14:28:47 PDT) ---

占楼编辑

--- 第 3 楼来自 Puyi 的回复 (2026-03-12 14:29:42 PDT) ---

现在NG很多作用

--- 第 4 楼来自 creamboy 的回复 (2026-03-12 14:29:43 PDT) ---

是用agent开发,还是开发agent?

--- 第 5 楼来自 nin11 的回复 (2026-03-12 14:29:52 PDT) ---

开发agent

--- 第 6 楼来自 Puyi 的回复 (2026-03-12 14:29:55 PDT) ---

Agent可以用agent开发

--- 第 7 楼来自 creamboy 的回复 (2026-03-12 14:31:03 PDT) ---

有很多现成的framework可以用,甚至可以直接套壳那几家的cli

--- 第 8 楼来自 nin11 的回复 (2026-03-12 14:31:31 PDT) ---

可以说的仔细点嘛

--- 第 9 楼来自 GhostCafe 的回复 (2026-03-12 14:35:09 PDT) ---

你开发agent要具体解决一个什么问题么

--- 第 10 楼来自 nin11 的回复 (2026-03-12 14:35:36 PDT) ---

不知道啊 要面的组说是在搞

--- 第 11 楼来自 郁小南 的回复 (2026-03-12 22:01:16 PDT) ---

让Claude code给你把这个repo讲一遍 拿着自己用用就懂了

github.com

GitHub - badlogic/pi-mono: AI agent toolkit: coding agent CLI, unified LLM...

AI agent toolkit: coding agent CLI, unified LLM API, TUI & web UI libraries, Slack bot, vLLM pods

--- 第 12 楼来自 cl3 的回复 (2026-03-13 07:40:02 PDT) ---

N姐好多面試呀!

--- 第 13 楼来自 打豆豆 的回复 (2026-03-13 08:31:16 PDT) ---

先找个agent,然后让他去开发你的agent

--- 第 14 楼来自 harvey8 的回复 (2026-03-13 08:38:59 PDT) ---

别只聊 LangChain 那套简单的 ReAct 逻辑。现在的卷点在于:

Long-term Memory:Agent 怎么在多轮对话中不丢上下文?是靠 Vector DB 还是靠最新的 Infinite Context 技术?
Planning & Tool Use:面对复杂任务,Agent 是如何拆解的?对于返回的 Tool Output 报错,它有没有 Self-Correction的能力?
Reliability & Evaluation:Agent/LLM 最怕 幻觉。面试时可以问问他们怎么做 Agent Eval,是用 LLM-as-a-judge 还是有一套固定的 Sandbox 环境跑测试。

只要聊到这三点,面试官就知道你是真钻研过 Agentic Workflow 的

不过对于 NG,前面2点也有可能要求太过了。就看你想不想成为像我一样,当一个真正的 LLM/AI Agent 了

--- 第 15 楼来自 nin11 的回复 (2026-03-13 09:35:48 PDT) ---

换我头秃了

--- 第 16 楼来自 IlllIIlIIIllIIl 的回复 (2026-03-18 23:41:26 PDT) ---

现在搞 Agent 挺让人头大的。外面吹得天花乱坠,但真动手写代码就发现,大部分时间都在跟那几条指令较劲。最烦的不是逻辑怎么写,而是模型现在表现好,过一会儿可能就乱说话了,你还得写一堆代码去检查它的输出对不对。

很多所谓的“全自动”其实根本没法落地。你要是真让它自己去想,它能给你跑出无限循环或者直接卡死。所以现在还是得老老实实地定好规矩,让它在一个明确的范围里转。别想着用它解决所有问题,能稳定地帮人干成一两件重复的小事,这产品就算成了。

另外,那些花哨的框架其实没那么重要,很多时候自己手写几个判断逻辑反而更稳。本质上,现在做 Agent 就是在处理模型产生的不确定性,把那些不稳的地方用代码接住。

要是真想动手,建议先从最简单的任务开始,先把“稳定”这关过了,再去想那些复杂的。

--- 第 17 楼来自 wrysta 的回复 (2026-03-18 23:58:34 PDT) ---

This sounds like an agent response

--- 第 18 楼来自 ShuRaymond 的回复 (2026-03-19 00:09:56 PDT) ---

楼主最近这么活跃 刷到好几次你的帖子了

--- 第 19 楼来自 郁小南 的回复 (2026-03-19 00:12:12 PDT) ---

【引用自 IlllIIlIIIllIIl】:

【引用自 IlllIIlIIIllIIl】:
接住

--- 第 20 楼来自 nin11 的回复 (2026-03-19 00:15:46 PDT) ---

进厂打螺丝没人要呀

--- 第 21 楼来自 ShuRaymond 的回复 (2026-03-19 00:55:11 PDT) ---

上次医生后续呢

--- 第 22 楼来自 deng47 的回复 (2026-03-19 01:02:48 PDT) ---

我在用本地LLM搞agent,有时候感觉LLM就是个婴儿,而我正在造学步车,教ta走路

image640×539 46 KB

--- 第 23 楼来自 ssinz7 的回复 (2026-03-19 01:03:21 PDT) ---

泥潭最新大热门人物

nin姐什么时候能和山哥一样有专属tag

--- 第 24 楼来自 nin11 的回复 (2026-03-19 01:09:25 PDT) ---

童话里 我已经嫁给他了

--- 第 25 楼来自 Nik0major 的回复 (2026-03-19 06:15:24 PDT) ---

现在个人tag露头就秒,得想点擦边的

--- 第 26 楼来自 ALousaBao 的回复 (2026-03-19 06:16:39 PDT) ---

【引用自 Nik0major】:
得想点擦边的
冬哥的牛牛

--- 第 27 楼来自 whtf 的回复 (2026-03-19 06:48:44 PDT) ---

74c2d73699dc24eecb55ea1ec52427a91320×530 80.7 KB当然是知识付费,Qclaw已经内测了,即将发布

--- 第 28 楼来自 otonoco 的回复 (2026-03-19 22:15:44 PDT) ---

循序渐进

设定好安全词

--- 第 29 楼来自 科怀伦纳德GOAT 的回复 (2026-03-20 12:14:41 PDT) ---

同感,我也是ollama的本地model,和花钱订阅的api相比差太多了