我如何与代理编程

本文是作者在自我教育过程中探讨如何将编程经验适应与能进行对话的计算机共存的第二部分。第一部分讨论了大型语言模型（LLM）如何被整合进现有工具中，通过自动完成功能和精准提示取代传统的网络搜索。本文则进一步探讨了使用代理（agents）进行编程的挑战与回报。

文章首先定义了“代理”在LLM上下文中的意义：代理是能够调用LLM的代码循环，具有独立执行命令及查看输出的能力，无需人工干预。本文提到，通过为LLM提供一定的反馈机制，可以大幅提高其编程能力。

接着，作者以自己在白板上编写C语言函数来验证UTF-8字符串的有效性为例，说明没有外部资源时编程的困难。与之相比，当LLM变成一个“代理”时，它不仅能调用编译器、查看编译错误，还有能力使用诸如grep和cat等工具来读取项目中的现有文件，使得编程体验大大提升。

文中详细列举了代理能够使用的一些基本工具，如bash、patch、todo等，这些工具使代理在代码库的导航和管理上表现更出色。通过使用代理，开发者可以更好地管理API调用、减少语法错误并及时根据测试结果进行反馈。

此外，作者分享了两个具体的使用案例。第一个案例涉及在项目中实现GitHub应用身份验证的过程，代理在几次反馈中成功完成了任务。尽管生成的代码存在一些安全和性能方面的问题，但在与团队合作前的早期识别和解决中，代理显示了其价值。第二个案例则涉及使用SQL处理JSON的常规，该代理在处理表结构上表现出了困难，但是通过添加注释和说明，成功改善了其表现。

文章最后探讨了代理的局限性，特别是它们处理大型代码库的能力，尽管它们在产生中间代价和响应时间上可能耗时。作者认为，尽管目前代理在某些方面尚未达到完全成熟的状态，但它们在编程行业中仍然展现出巨大的潜力。

作者还对未来的不同使用场景进行了展望，提到开发环境的容器化可能会为开发者带来更好的工作流，并重塑集成开发环境（IDE）的功能。整体而言，文章强调了在快速变化的技术领域中，持续学习和谦逊的重要性，呼吁开发者关注代理技术的潜力及其对编程流程的深远影响。

原文：https://crawshaw.io/blog/programming-with-agents

评论：https://news.ycombinator.com/item?id=44221655

我如何与代理编程

Report Page