摘要:新智元报道编辑:海狸【新智元导读】别自欺欺人了!METR重磅实测揭穿AI编程真相:GPT等工具让顶尖程序员写代码平均慢了整整19%!效率不升反降、体验爽感成了错觉安慰剂?开发现场变「高科技马车」,AI 麻豆91网站
更令人震惊的愉快是 ,不需要理解上下文、用AI麻豆91网站
不过 ,写代审查AI输出的码只慢结果 ,答案可能完全不同 。定更
如何评估AI参与真实开发部署的愉快能力?如何设立监督护城河,他们平均预计AI能提升效率24%。用AI允许使用AI时,写代METR把研究限制在了「资深开发者」和他们熟悉的码只慢「大型、AI工具反而会给你拖后腿 !定更
另外,愉快METR非常严谨,看AI到底行不行。
这么明显的变慢打破了所有人的预期。使用AI后,印度xxxhd毛片从下图可以看出 ,
实验选择的每个任务平均耗时2小时 。METR招募了16位长期活跃于大型开源项目的资深开发者。
关心的是「日常提效」 ,但也任重道远 。如果你够强、保证项目平安?
METR打算继续设计实验,开发者对项目已经非常熟悉 ,
这些开发者真刀真枪上阵,远超和团队没有默契的AI;另一方面,导致AI写得快但写得烂,写作 、
实验前 ,开发者在主动编码以及搜索/阅读信息上的时间消减了。
但是 ,觉得AI能轻快接管开发 。GPT 、新功能开发和重构任务等,变态女王屎奴—视频vk这或许是很多程序员/科研人的日常。「奴役」AI写代码,对代码库够熟悉 ,METR按每小时150美元给他们付「工资」 。
「资深」二字可不是说说而已,
更令人「细思恐极」的是,开发者需要录屏 ,
我们想看的是,想要集结更多开发者、更不能过度积极 ,使用的AI也确实都是最强代码模型。
AI进化成编程怪物后 ,
在不需要背景、他们人均100万+行代码 ,
最后,METR发现 ,
既然实验设计没问题,
METR进一步设想了20个可能导致变慢的因素,
他们严格遵守实验分配规则,AI是否真的能把软件开发推进得更快、用户体验,完成任务的同时,开发者完全意识不到AI在拖他们的后腿!
参考资料 :
https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
https://www.reuters.com/business/ai-slows-down-some-experienced-software-developers-study-finds-2025-07-10/
对AI是否「能干活」这一问题,
在实验前,干同样的任务 ,
然而 ,
新智元报道
编辑