AI写代码：效率倒退19%背后的真相与启示

最近美国METR研究所完成了一项针对AI编程工具影响的实验研究。在任务开始前，他们预测AI能让自己提速24%。可现实数据冷冷地指出：AI让他们“看似飞快，实则拖慢”。

人工智能（AI）工具被广泛宣传为开发者提升效率的“神器”，但美国METR研究所的最新实验却揭示了一个令人意外的事实：经验丰富的开源开发者在使用AI编程工具时，完成任务的平均时间反而增加了19%。这一结果与开发者的主观感知形成鲜明对比——他们普遍认为AI能提速24%，而实验后仍有开发者坚信自己“节省了20%的时间”。这一矛盾现象不仅挑战了人们对AI工具的既有认知，也暴露出当前技术应用中隐藏的深层问题。

实验设计：严谨的随机对照，真实的开发场景

METR研究所的实验采用随机对照实验（RCT）这一科学界公认的严格方法，直接在开发者的真实工作中展开。

参与者：16名资深开源开发者，覆盖246个实际任务（如复杂模块开发、代码修复）。
对比条件：每个任务被随机分配至“使用AI组”或“无AI组”。AI组主要使用Cursor Pro工具，集成Claude 3.5等大模型。
数据收集：全程录屏记录时间，并引入开发者对任务的预估时间作为参考，以排除任务难度差异的干扰。

这一设计确保了实验的客观性，避免了理想化测试的局限性。

结果：效率下降与“快感错觉”的冲突

核心数据：

使用AI的开发者耗时增加19%，而非提速。
开发者主观感知与客观结果背道而驰：他们认为效率提升了20%，但实际进度滞后。

“快感错觉”的成因：

注意力的再分配：AI并未加速核心编码环节，反而让开发者将更多时间投入提示设计、AI输出审查、等待响应等辅助性工作。例如，开发者从“写代码”转变为“教AI如何写代码”，流程看似高效，实则陷入低效循环。
碎片化的工作节奏：频繁切换任务（如生成提示、修正错误、重复尝试）导致心理上的“忙碌感”，但实际产出进展有限。
认知偏差：人类倾向于高估自身行动的有效性，尤其在多任务并行时，容易误判时间与成果的关联性。