普林斯顿大学推出首个开源AI程序员 SWE-agent,能自动修复bug

科技 2024-04-03 15:04 阅读:25

普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员。基于GPT-4技术,SWE-agent能够在GitHub仓库中自动修复bug,为软件工程领域带来了新的研究和应用前景。这个智能体-计算机接口的诞生,让人们开始思考AI在工程领域的角色和能力。

SWE-agent在SWE-bench测试集上的表现令人瞩目,成功解决了12.29%的问题,平均耗时仅为93秒,准确率与之前推出的AI程序员Devin相当。这显示出SWE-agent在自动修复bug方面的高效性和可靠性。同时,SWE-agent的开源性质也受到了开源社区的高度认可和兴趣,迅速获得了1.6k星和109个Fork。

SWE-agent的工作原理是与专门的终端交互,它可以打开、滚动和搜索文件,编辑特定行并自动进行语法检查,编写和执行测试。这种设计类似于为人类设计的UI,能够阻止错误并提供反馈。例如,在处理一个矩阵操作bug时,SWE-agent能够重现问题、定位到问题代码、进行修改并成功解决问题。

普林斯顿大学的研究人员为SWE-agent设计了简洁的指令和反馈格式,使得模型能够更轻松地浏览代码仓库、查看、编辑和运行代码文件。SWE-agent的工作流程分为推理和评估两个阶段,确保修复方案的准确性和有效性。

这项研究的核心作者John Yang和Carlos E. Jimenez,都是普林斯顿大学的研究助理和博士生,他们的工作展示了AI在软件工程领域的潜力。AI的兴起虽然还未能完全取代软件工程师,但它正在改变技术领域的面貌和未来的走向。随着技术的不断进步,我们或许将见证AI在软件工程领域扮演更加重要的角色,与人类共同创造未来。