AI软件工程师
SWE-agent
简介
- 项目仓库:https://github.com/princeton-nlp/SWE-agent
- 官方网站:https://swe-agent.com/
- demo:https://swe-agent.com/demo
- SWE-agent能够让大语言模型(比如GPT-4)变身为软件工程AI智能体,并在真实的GitHub仓库里自己修bug。
- 在SWE-bench测试集上,SWE-agent成功解决了12.29%的问题,平均耗时只有93秒,准确率堪比Devin。
- 介绍文章:https://zhuanlan.zhihu.com/p/690562277
MetaGPT
数据解释器
作用
- 能够应对数据实时变化、任务之间复杂的依赖关系、流程优化需求以及执行结果反馈的逻辑一致性等挑战
- 相关文章:开源版“Devin”AI程序员炸场:自己分析股票、做报表、建模型https://mp.weixin.qq.com/s/sxgfJf4vxvaxhO5L7-Npwg
三个关键技术:
1)基于分层图结构的动态计划,基于分层的图结构进行任务和代码规划,有效管理任务间的复杂依赖,灵活应对数据科学任务的实时数据变化;
2)工具集成与进化,通过在代码生成过程中自动集成代码片段作为工具,动态嵌入了数据科学领域所需的领域知识;
3)基于验证与经验驱动的推理,自动在反馈中增强逻辑一致性检测,通过基于置信度的验证提升执行代码的逻辑合理性,并借助经验库增强推理能力。
项目链接:
- https://docs.deepwisdom.ai/main/en/DataInterpreter/
- https://github.com/geekan/MetaGPT/tree/main/examples/di
Devika
简介
-
项目仓库:https://github.com/stitionai/devika Star:13.3K
-
Devika是一个开源的AI软件工程师,它能够理解高层次的人类指令,将这些指令分解成具体的步骤,并通过研究相关信息来编写代码,实现既定目标
主要特征
1.强大的语言模型支持:Devika能够利用Claude 3、GPT-4等先进的语言模型,为你的编程项目提供强大的自然语言理解和生成能力。
2.智能规划与推理:Devika能够将复杂的编程目标分解成一步步的行动计划,并做出基于当前上下文的最佳决策。
3.精准的关键词提取:通过上下文关键词提取,Devika能够聚焦研究,快速找到你需要的信息。
4.无缝的网络浏览:Devika能够自动浏览互联网,搜集信息,与网页元素交互,就像一个真人用户一样。
5.多语言代码编写:无论你需要Python、JavaScript还是其他语言的代码,Devika都能帮你搞定。
6.动态状态追踪:Devika能够实时追踪并可视化代理的状态,让你对项目进展了如指掌。
7.自然语言交互:通过聊天界面,你可以像和朋友聊天一样与Devika交流,简单又自然。
8.项目管理:Devika提供了基于项目的组织和管理功能,让你的代码和资料井井有条。
9.可扩展架构:Devika的架构设计允许你根据需要添加新功能和集成,让AI编程的可能性无限扩展。
系统架构
1.用户界面:一个基于Web的聊天界面,让你可以轻松与Devika互动,查看项目文件,监控代理状态。
2.代理核心:Devika的大脑,协调AI规划、推理和执行过程,与其他子代理和模块通信,完成任务。
3.大型语言模型:Devika使用最新的语言模型来理解、生成和推理自然语言。
4.规划与推理引擎:负责将高层次目标分解成可执行的步骤,并根据当前上下文做出决策。
5.研究模块:利用关键词提取和网络浏览能力,为手头的任务收集相关信息。
6.代码编写模块:根据计划、研究发现和用户需求生成代码,支持多种编程语言。
7.浏览器交互模块:使Devika能够根据需要浏览网站、提取信息和与网页元素交互。
8.知识库:存储和检索项目特定的信息、代码片段和学习到的知识,以便高效访问。
9.数据库:持久化项目数据、代理状态和配置设置。
Devin
简介
- Devin - 世界第一个全栈AI程序员https://mp.weixin.qq.com/s/MHaxWumWDG9NtBR0RakNGg
- 官网:https://preview.devin.ai/
- Devin在SWE-bench上的测评表现卓越。它不仅能够自动完成任务,甚至在几分钟内就能自行编写整个应用程序,自动正确解决问题的比例高达13.86%,远超Claude 2(4.80%)、Llama以及GPT-4(1.74%,3.5测试结果为0%)
OpenDevin
- 项目仓库:https://github.com/OpenDevin/OpenDevin
- Devin的开源翻版——OpenDevin