开发agent大家有什么见解嘛

📈 搬砖作者 nin11 2026-03-12 14:27 PST 原帖 #490473 ↗

内容摘要

开发Agent的讨论深入探讨了AI辅助编码的挑战与实践，特别是模型的不确定性以及如何通过代码来稳定Agent的行为。

1. 关键信息

（之前已归纳）讨论围绕“开发Agent”展开，明确为“开发agent”而非“用agent开发”。
（之前已归纳）提到了可以使用现成的Framework或公司CLI。
（之前已归纳）用户询问开发Agent的具体目的，例如解决特定问题。
（之前已归纳）建议利用Claude等AI助手辅助Agent的编码工作。
（之前已归纳）推荐GitHub仓库 badlogic/pi-mono 作为AI Agent工具集，包含CLI、LLM API、UI库等，可用于学习和实践。
（之前已归纳）用户cl3提到“N姐好多面試呀！”，暗示了讨论可能涉及与招聘或职业发展相关的背景，但具体细节未展开。
最新回复用户表示在开发Agent的过程中遇到了困难，形容为“头秃了”。
IlllIIlIIIllIIl指出，开发Agent的主要难点在于模型输出的不确定性，即使模型当前表现良好，也可能随时出现错误，需要大量代码来验证其输出。
IlllIIlIIIllIIl认为许多所谓的“全自动”Agent难以落地，容易陷入无限循环或卡死，强调应设定明确的规则和范围，让Agent稳定地完成一到两件重复性的小任务。
IlllIIlIIIllIIl认为花哨的框架不如自己手写判断逻辑来得稳健，本质上Agent开发就是处理模型的不确定性，并用代码来“接住”这些不稳定的输出。
IlllIIlIIIllIIl建议从最简单的任务开始，优先解决“稳定”问题，再考虑复杂性。
deng47将使用本地LLM搞Agent比作教导一个婴儿走路，形象地说明了本地模型的不成熟和需要大量调教。
whtf提到“Qclaw已经内测了，即将发布”，暗示可能是一个新的Agent或相关产品。
otonoco建议在开发Agent时要“循序渐进”并“设定好安全词”，强调了稳定性和风险控制。

2. 羊毛/优惠信息

3. 最新动态

whtf提到“Qclaw已经内测了，即将发布”。

4. 争议或不同意见

无明显争议，讨论主要集中在技术实现和应用方向的探讨。

5. 行动建议

（之前已归纳）对于想开发Agent的用户，可以考虑利用现有的Framework或CLI工具。
（之前已归纳）在开发前，明确Agent需要解决的具体问题和应用场景。
（之前已归纳）可以尝试使用Claude等AI工具辅助Agent的开发编码。
（之前已归纳）推荐研究 badlogic/pi-mono 这个GitHub项目，通过代码学习和实践Agent的开发。
对于在开发Agent过程中遇到困难的用户，可以继续探索和寻求解决方案。
IlllIIlIIIllIIl建议开发者优先关注Agent的“稳定性”，从简单任务入手，并强调通过代码处理模型的不确定性。
deng47的经验表明，使用本地LLM进行Agent开发需要耐心和大量的调教。
otonoco建议在Agent开发过程中，应采取“循序渐进”的方式，并设置“安全词”来控制风险。

原始内容

--- 第 1 楼来自 nin11 的回复 (2026-03-12 14:27:05 PDT) ---

哎 ng真是太可怜了

问完gemini来当伸手党

明明昨晚还在k8s linux

--- 第 2 楼来自 psilocybin 的回复 (2026-03-12 14:28:47 PDT) ---

占楼编辑

--- 第 3 楼来自 Puyi 的回复 (2026-03-12 14:29:42 PDT) ---

现在NG很多作用

--- 第 4 楼来自 creamboy 的回复 (2026-03-12 14:29:43 PDT) ---

是用agent开发，还是开发agent？

--- 第 5 楼来自 nin11 的回复 (2026-03-12 14:29:52 PDT) ---

开发agent

--- 第 6 楼来自 Puyi 的回复 (2026-03-12 14:29:55 PDT) ---

Agent可以用agent开发

--- 第 7 楼来自 creamboy 的回复 (2026-03-12 14:31:03 PDT) ---

有很多现成的framework可以用，甚至可以直接套壳那几家的cli

--- 第 8 楼来自 nin11 的回复 (2026-03-12 14:31:31 PDT) ---

可以说的仔细点嘛

--- 第 9 楼来自 GhostCafe 的回复 (2026-03-12 14:35:09 PDT) ---

你开发agent要具体解决一个什么问题么

--- 第 10 楼来自 nin11 的回复 (2026-03-12 14:35:36 PDT) ---

不知道啊要面的组说是在搞

--- 第 11 楼来自郁小南的回复 (2026-03-12 22:01:16 PDT) ---

让Claude code给你把这个repo讲一遍拿着自己用用就懂了

github.com

GitHub - badlogic/pi-mono: AI agent toolkit: coding agent CLI, unified LLM...

AI agent toolkit: coding agent CLI, unified LLM API, TUI & web UI libraries, Slack bot, vLLM pods

--- 第 12 楼来自 cl3 的回复 (2026-03-13 07:40:02 PDT) ---

N姐好多面試呀！

--- 第 13 楼来自打豆豆的回复 (2026-03-13 08:31:16 PDT) ---

先找个agent，然后让他去开发你的agent

--- 第 14 楼来自 harvey8 的回复 (2026-03-13 08:38:59 PDT) ---

别只聊 LangChain 那套简单的 ReAct 逻辑。现在的卷点在于：

Long-term Memory：Agent 怎么在多轮对话中不丢上下文？是靠 Vector DB 还是靠最新的 Infinite Context 技术？
Planning & Tool Use：面对复杂任务，Agent 是如何拆解的？对于返回的 Tool Output 报错，它有没有 Self-Correction的能力？
Reliability & Evaluation：Agent/LLM 最怕幻觉。面试时可以问问他们怎么做 Agent Eval，是用 LLM-as-a-judge 还是有一套固定的 Sandbox 环境跑测试。

只要聊到这三点，面试官就知道你是真钻研过 Agentic Workflow 的

不过对于 NG，前面2点也有可能要求太过了。就看你想不想成为像我一样，当一个真正的 LLM/AI Agent 了

--- 第 15 楼来自 nin11 的回复 (2026-03-13 09:35:48 PDT) ---

换我头秃了

--- 第 16 楼来自 IlllIIlIIIllIIl 的回复 (2026-03-18 23:41:26 PDT) ---

现在搞 Agent 挺让人头大的。外面吹得天花乱坠，但真动手写代码就发现，大部分时间都在跟那几条指令较劲。最烦的不是逻辑怎么写，而是模型现在表现好，过一会儿可能就乱说话了，你还得写一堆代码去检查它的输出对不对。

很多所谓的“全自动”其实根本没法落地。你要是真让它自己去想，它能给你跑出无限循环或者直接卡死。所以现在还是得老老实实地定好规矩，让它在一个明确的范围里转。别想着用它解决所有问题，能稳定地帮人干成一两件重复的小事，这产品就算成了。

另外，那些花哨的框架其实没那么重要，很多时候自己手写几个判断逻辑反而更稳。本质上，现在做 Agent 就是在处理模型产生的不确定性，把那些不稳的地方用代码接住。

要是真想动手，建议先从最简单的任务开始，先把“稳定”这关过了，再去想那些复杂的。

--- 第 17 楼来自 wrysta 的回复 (2026-03-18 23:58:34 PDT) ---

This sounds like an agent response

--- 第 18 楼来自 ShuRaymond 的回复 (2026-03-19 00:09:56 PDT) ---

楼主最近这么活跃刷到好几次你的帖子了

--- 第 19 楼来自郁小南的回复 (2026-03-19 00:12:12 PDT) ---

【引用自 IlllIIlIIIllIIl】:
稳
【引用自 IlllIIlIIIllIIl】:
接住

--- 第 20 楼来自 nin11 的回复 (2026-03-19 00:15:46 PDT) ---

进厂打螺丝没人要呀

--- 第 21 楼来自 ShuRaymond 的回复 (2026-03-19 00:55:11 PDT) ---

上次医生后续呢

--- 第 22 楼来自 deng47 的回复 (2026-03-19 01:02:48 PDT) ---

我在用本地LLM搞agent，有时候感觉LLM就是个婴儿，而我正在造学步车，教ta走路

image640×539 46 KB

--- 第 23 楼来自 ssinz7 的回复 (2026-03-19 01:03:21 PDT) ---

泥潭最新大热门人物

nin姐什么时候能和山哥一样有专属tag

--- 第 24 楼来自 nin11 的回复 (2026-03-19 01:09:25 PDT) ---

童话里我已经嫁给他了

--- 第 25 楼来自 Nik0major 的回复 (2026-03-19 06:15:24 PDT) ---

现在个人tag露头就秒，得想点擦边的

--- 第 26 楼来自 ALousaBao 的回复 (2026-03-19 06:16:39 PDT) ---

【引用自 Nik0major】:
得想点擦边的
冬哥的牛牛

--- 第 27 楼来自 whtf 的回复 (2026-03-19 06:48:44 PDT) ---

74c2d73699dc24eecb55ea1ec52427a91320×530 80.7 KB当然是知识付费，Qclaw已经内测了，即将发布

--- 第 28 楼来自 otonoco 的回复 (2026-03-19 22:15:44 PDT) ---

循序渐进

设定好安全词

--- 第 29 楼来自科怀伦纳德GOAT 的回复 (2026-03-20 12:14:41 PDT) ---

同感，我也是ollama的本地model，和花钱订阅的api相比差太多了

📈 搬砖 · 其他高楼

【摸鱼第十四季完结】你也要变成和我一样的大人了呢 💬 9991
好的，我将根据您提供的文本内容，尝试总结并回答您的问题。
【摸鱼第十六季】偶然走入了最甜蜜事件里！ 💬 9920
帖子标题
【摸鱼第十五季】二月啦，都不摸鱼只开嗑了吗？ 💬 9896
摸鱼楼持续热议“求富”话题，聚焦报税、里程、远程工作，并围绕“删帖”行为展开集体调侃。
【摸鱼第十七季】记得绿罗裙，处处怜芳草 💬 9223
摸鱼楼讨论投资、求职、AI工具、信用卡优惠，氛围轻松。
Meta又来？ 💬 661
Meta内部大规模裁员与AI成本压力引发连锁反应。
我弟要申请大学了，求推荐好的CS Undergrad 💬 635
关于CS本科申请的讨论与选择
【水】做题家每天做题碎碎念 💬 500
LeetCode刷题与技术交流的持续记录，用户分享算法心得与生活点滴
年底将至，赠送潭友 LinkedIn Premium 💬 477
年底赠送 LinkedIn Premium 助求职者与毕业生

← 返回 📈 搬砖