全球首位 AI 程序员正式上线,这个月薪只要三千的同事能干什么?
说到「编程」,很多人第一反应就是那个经典的程序员笑话——虚假的程序员从零开始写代码,勤勤恳恳改 bug、优化注释;真正的程序员嘛,靠的是「Ctrl+C」和「Ctrl+V」这两门绝活。

图源:Lara vel
不过,Cognition Labs 推出的全球首位 AI 程序员「Devin AI」,可能连「复制粘贴」这一步都替你省了。你完全可以把它当成一位真正的程序员同事,让 TA 直接动手干活。
既然是「程序员」,自然不能白干活。Devin AI 的服务起价是每月 500 美元(约合 3624 元),确实不便宜。但换个角度看,这个价格比国内一线大厂程序员的平均月薪还是低了不少。

图源:COGNITION
Devin AI 本质上是一个由人工智能驱动的编码平台,内置了命令行、代码编辑器、浏览器等常见的开发者工具。它能在编写代码片段、检测错误、提出改进建议等方面协助开发人员,几乎覆盖了编程工作的全流程。
更值得一提的是,Devin AI 会通过机器学习算法分析代码模式,从过去的经验中持续学习。这既提升了编码效率,也能让它始终跟得上最新的编程趋势。
作为一位「编程助理」,Devin AI 能做的具体工作包括:
代码补全:分析上下文和语法,预测下一行代码,加速编码节奏;
错误检测:自动扫描常见错误和问题,帮助开发者定位和修复 bug;
代码重构:提供重构建议,助力写出更简洁、更高效的代码;
代码优化:分析性能,给出优化方向,提升速度和效率;
多人协作:它甚至可以充当协作工具,让多个开发者同时在同一项目上工作。
官方建议,Devin AI 在小前端错误处理、针对性代码重构,以及为待办列表中的任务创建初稿 PR(Pull Request)等场景下,最能发挥价值。
当然,作为名副其实的「AI 程序员」,它不光能辅助开发,还能独立完成任务,供开发者审核。官方描述它为「一位不知疲倦且技术娴熟的团队成员」。
据官方介绍,Devin AI 可以自主规划和执行需要数千个决策的复杂工程任务。换句话说,开发者可以化身「产品经理」,直接把开发需求和任务「告诉」Devin AI,然后等着验收成果。
针对这项功能,官方还贴心地给了一份「使用指南」,跟平时叮嘱同事差不多:
分配给 TA 的任务,最好是你自己知道怎么做的;
告诉 TA 怎么测试或检查自己的工作;
会话时间控制在 3 小时以内,尽量把大任务拆小;
提前把详细需求说清楚;
通过对话给反馈、采纳建议,或者手动补充知识,强化对 TA 的训练。
官方还展示了几个有趣的用例,可以一窥这位「程序员」到底有多厉害。
Devin AI 能够学习和使用「不熟悉」的技术。比如,它读完一篇博客文章后,现学现卖,自主编写代码,在 Modal 上运行 ControlNet,生成了一张带有隐藏文字「SARA」的图片:


它还可以端到端构建并部署应用。演示中,它根据需求制作了一个模拟「Game of Life」的交互式网站,逐步添加用户提出的功能,最后将应用部署到 Netlify:


Devin AI 甚至能训练和微调自己的 AI 模型。演示人员只给了它一个 GitHub 研究仓库的链接,它就完成了对某个大语言模型的「微调」:

除此之外,Devin AI 还能自动查找和修复代码库中的错误,处理开源仓库里的 bug 和功能请求等。
在「SWE-bench」这项颇具挑战性的基准测试中,Devin AI 正确解决了 13.86% 的问题,远超之前 1.96% 的最佳水平。即便明确给出了需要编辑的文件,之前最强的模型 Claude 2 也只能解决 4.8% 的问题。
更令人惊叹的是,Devin AI 已经通过了现实世界的工程师面试,还在流行的自由职业平台「Upwork」上接到了活儿。
它成为「自由职业者」的消息曾引起不小争议。一位有几十年软件工程师经验的 YouTube 博主质疑演示视频造假,称其「自导自演」「无用功」,对实际能力提出质疑。
无论是不是商业炒作,Devin AI 目前已经全面推向市场。它真正的编程表现如何,不妨再等等看,让时间和用户来评判。

图源:COGNITION
在 Devin AI 正式推出后不久,OpenAI 也宣布了 ChatGPT Canvas 的多项更新,其中就包括直接运行 Python 代码的能力。更新后的 Canvas 可以搜索 API 文档,指导模型编写并执行代码,甚至能开发小工具和游戏。
可以看到,连 OpenAI 这样的巨头也在不断加注「AI 编程」。在这样的背景下,那个终极问题自然再次浮现:
TA 离取代真正的程序员,还有多远?