首页 > 教程攻略 > ai资讯 >烧了2000美金在AI写代码上,我发现了一个残酷真相

烧了2000美金在AI写代码上,我发现了一个残酷真相

来源:互联网 时间:2026-07-04 14:07:05

烧了2000美金测试AI代码工具之后,作者揭开了AI编程体验的真实面貌:其中既有令人惊艳的高光时刻,也藏着致命的短板。

核心看点:

  • AI代码工具在代码阅读、多文件协同和快速原型开发上的表现,确实让人眼前一亮
  • 但需求理解偏差、多轮交互噩梦和代码质量等问题,又实实在在地摆在面前
  • 作者对AI编程工具的最终判断:它像极了一个有天赋但经验不足的初级开发者

烧了2000美金在AI写代码上,我发现了一个残酷真相

前言

从Cursor爆火到现在,其实还不到一年时间。这段时间里,市面上能找到的AI代码工具,基本上都深度用了个遍。

作为AI Agent方向的创业者和全栈工程师,对这个赛道的关注几乎是一种本能。尤其是Devin出来那会儿——号称"首个能干活的工程师",春节前体验之后带来的冲击感,至今记忆犹新,不亚于GPT时刻的震撼。从最早的百度Comate、Continue、FittenCode这类代码补全插件,到后来爆火的Cursor、Windsurf,再到传说中的Devin,还有cline、roo-cline、kilocode、kiro,以及个人最偏爱的Claude Code和Augment等等。该花的钱一分没少,该踩的坑一个没落。

粗略算下来,光是各种订阅费、Token消耗、测试成本,已经烧掉将近2000美金。但这笔钱没白花——透过这些工具,看到了一些非常有意思的东西。

AI写代码,真香还是真坑?

先说结论:

现阶段的AI Coding工具,像极了一个很有天赋但经验不足的初级开发者。

真香的部分

必须承认,在某些场景下,这些工具确实让人刮目相看:

代码阅读和理解

:这个最让人服气。扔给它一个几万行的项目,它能快速理解整体架构,精准定位关键函数,比自己翻文档效率高太多了。接手别人的烂摊子时,先让AI梳理一遍整体结构,几乎成了习惯性操作。

多文件协同开发

:当需求涉及多个文件同时修改,AI的全局视野确实强过人类。它能同时兼顾各个文件之间的依赖关系,这点没话说。说到这儿,整个行业都得感谢Windsurf Cascade的贡献——它第一次让Agent在coding领域变得真正可用。

MVP和POC开发

:这才是真香的核心。想快速验证一个想法,从0到1搭个小工具或者原型,一天之内基本搞定。之前用Cursor写过一个任务管理的Todo小工具,从想法诞生到可用版本,真的就几个小时。

真坑的部分

但问题同样多,而且是大问题:

需求理解偏差

:这个最要命。你说东它理解成西,然后一本正经地写出一堆看起来很专业、但实际上根本不是你想要的东西。尤其在涉及业务逻辑的时候,AI经常会自作聪明,而且自以为是。

多轮交互的噩梦

:发现它理解错了,想纠正过来?往往要好几轮对话。每一轮都可能产生新的偏差,到最后你会发现,还不如自己从头写。

Lint和代码质量

:AI写的代码经常不符合项目已有的编码规范,各种lint错误层出不穷,需要大量人工修复。有时候修复时间比重写还长——它好像开了个雷达,专挑你薄弱的技术栈下手。

死循环问题

:这个真的很崩溃。AI发现有问题,然后修复,修复完又产生新问题,再修,无限循环。见过最夸张的情况,一个简单的函数被改了20多轮,最后依然有问题。Claude Code出来之后情况有所好转,因为它上下文处理能力更强,不用拆东墙补西墙了。

复杂项目的熵增爆炸

:项目越复杂,每次新增需求就越可能打破现有的平衡。AI缺乏对整体架构的把控能力,也缺乏对现有项目规范的掌握,代码很容易变得越来越混乱。更糟糕的是,二次开发本身就意味着项目有诸多历史包袱——就像一辆破车加了个高速马达,开得越快,散得越快。

Devin的成与败

说到Devin,它的设计思路确实是正确的,但执行上还有很长一段路要走。

成也沙盒

:独立的开发环境确实是个好主意。可以避免污染本地环境,也让AI有更自由的空间去试错。这种"给AI一个独立工作空间"的思路,值得所有后来者学习。Manus出来第一眼,用过Devin的人就能看出来,它借鉴了前者的GUI设计思路。

败也沙盒

:沙盒并没有解决最核心的问题。死循环依然存在,简单需求复杂化的老毛病也没改。你会发现,给它一个简单的需求,它可能会搭建一套极其复杂的架构,然后把自己绕进去。

特别关注Devin提出的几个概念:

  • 自我学习和成长性知识库

    :理念很好,现实很骨感。AI确实需要能从之前的错误中学习,建立起自己的经验库。
  • 像人一样解决问题

    :这个认同。真正的程序员会去查资料、看文档、参考别人的代码,而不是凭空想象。
  • 注意力托管

    :这个概念很有意思,让AI能脱机持续专注在一个任务上,而不是分散人的注意力。

但问题是,

距离一个合格的实习生,还差得很远。

为什么单纯依靠模型还不够?

经过这么长时间的深度体验,问题的根源其实很清晰:

编程本质上不只是一个语言任务,它是一个复杂的工程问题。

模型的局限性

  1. 上下文窗口限制

    :虽然现在的模型上下文越来越长,但真实项目的复杂度往往超出模型的处理范围。
  2. 缺乏持续学习能力

    :模型无法从项目中积累经验,每次都是"从零开始"的状态。
  3. 没有真正的理解能力

    :模型只是在做模式匹配,对业务逻辑的理解依然非常表面。
  4. 缺乏工程思维

    :真正的程序员会考虑可维护性、可扩展性、性能等工程问题,还要处理外部沟通带来的需求变更——大厂程序员只有不到1/5的时间在写代码,大部分时间在开会。而AI往往只关注功能的实现。

需要的不只是更好的模型

要真正解决这些问题,需要的是一套完整的系统:

  • 持续学习的知识库

    :能够积累项目经验,形成专属的编程规范和最佳实践。
  • 多模态的交互方式

    :不只是文字,还需要图像、语音,甚至是直接操作界面。
  • 强化学习机制

    :能够从反馈中改进,而不是每次都重新开始。
  • 工程化的思维模式

    :考虑代码的长期维护和演进,而不是一次性的功能实现。

一些思考

作为在这个领域深度实践的人,有几个不成熟的判断:

1. 不要指望AI完全替代程序员

至少在可预见的未来,AI更应该被定位为"超级助手"而不是"替代者"。最好的使用方式是让AI处理繁琐的基础工作,让人专注于架构设计、业务逻辑和创新。

2. 垂直化可能是突破口

通用的AI coding工具很难做到面面俱到,但在特定领域做到专业化,是有可能实现的。比如专门做React组件的AI、专门做数据处理脚本的AI,这种垂直化的路径也许更靠谱。

3. 工具链的重要性

单纯的代码生成远远不够,需要与现有的开发工具链深度集成。测试、部署、监控、调试,这些环节都需要AI能够参与进来。

4. 数据和反馈机制是关键

AI需要能够从真实的项目实践中学习,而不只是从训练数据中学习。如何建立有效的反馈机制,让AI不断进化,这是一个值得深入研究的方向。

写在最后

2000美金换来的最大启发是:

AI写代码这件事,我们还处在非常早期但PMF已经比较确定的阶段。现在产品迭代的开发习惯,基本已经离不开AI工具了。

但是,AI写代码距离完全替代一个程序员这件事,还有很长的路要走呢。

相关下载