作为谷歌开发者工具项目经理,Ryan Salva对AI工具如何改变编程拥有第一手观察。他曾在GitHub和微软工作,现在负责Gemini CLI和Gemini Code Assist等工具,引导开发者进入智能体编程的新世界。
他的团队周二发布了新的第三方研究,显示开发者如何实际使用AI工具,以及还有多少进展空间。我与Salva坐下来讨论了这份报告和他使用AI编程工具的个人经验。
以下访谈内容经过编辑以保持长度和清晰度。
**关于开发者AI工具使用趋势**
谷歌每年都会进行开发者趋势调查,但今年的报告真正聚焦于AI工具,特别是开发者在编程方法上愿意接受智能体化的程度。研究中有什么令你惊讶的发现吗?
一个非常有趣的发现是开发者开始使用AI工具的中位日期。研究发现是2024年4月,这与Claude 3和Gemini 2.5的发布时间非常吻合。这真正标志着推理或思考模型的黎明,同时我们在工具调用方面也变得更加出色。
对于编程任务,你真的需要能够利用外部信息来解决问题,所以它可能需要搜索,可能需要编译代码。如果代码编译了,它可能想要运行单元测试和集成测试。我认为工具调用真的是让模型在执行过程中能够自我纠正的重要组件。
**个人使用AI编程工具的体验**
你个人是如何使用AI编程工具的?
我现在的大部分编程都是业余项目,我花大部分时间使用基于命令行的工具。这包括Gemini CLI,然后还有一点Claude Code,一点Codex。你从来不会单独使用基于终端的工具,所以我在使用的IDE方面真的很多样化。我使用Zed、VS Code、Cursor、Windsurf,所有这些,因为我只是想看看世界是如何运作的,行业是如何发展的。
在专业方面,产品经理往往生活在文档中,所以第一件事就是使用AI帮助我编写规范和需求文档。
你使用Gemini CLI来构建Gemini CLI很有趣,但我想它不会自己运行自己吧?
开发任务通常从一个问题开始,也许是有人在GitHub上提交的一个bug问题。老实说,通常这是一个规范不够完整的问题。所以我会使用Gemini CLI来创建一个更强大的Markdown需求文档。这通常会创建大约100行相当技术性但也以结果为导向的规范。然后我会使用Gemini CLI基于该规范和团队文档中的一般偏好来编写代码。
在整个工程团队中,我们有几个不同层次的规则和Markdown文档供模型使用,只是规定我们的工作方式:这是我们如何进行测试的,这是我们如何管理依赖关系的,等等。所以当它生成代码时,它也在基于这些文档工作。
当Gemini CLI进行故障排除时,我会让它更新我的需求文档,说"我修复了这一步。现在我要进行下一步",等等。每一个都在存储库中创建自己的提交和拉取请求,所以我总是可以回退或撤销。
我会说我70%到80%的工作是我在终端中使用自然语言工作,尝试使用Gemini CLI来制作需求,然后让Gemini CLI为我编写大部分代码,然后我会用我碰巧使用的任何IDE去审查和阅读。但主要是我把IDE用作阅读代码的地方,而不是编写代码的地方。
**编程的未来展望**
你认为原始计算机代码有未来吗?还是我们会把所有东西都转移到终端窗口?
三十年来,IDE是我们进行软件开发的所有工作的地方。你有IDE,你有浏览器,你有终端窗口。
我认为这在很大程度上仍然是这样,但我怀疑随着时间的推移,我们最终会花更多时间处理需求,而在IDE中花费的时间会逐渐缩短。我认为这种变化实际上可能会在相当长的时间范围内发生。
对于软件开发作为一个职业发展道路意味着什么,存在很多焦虑。如果10年后,我们不再看代码,这对开发者意味着什么?他们还会有工作吗?
我认为你作为开发者的工作将更像一个架构师。它将涉及接受大型、复杂的问题并将其分解为更小的、可解决的任务。你需要思考你试图产生的更大图景,而不是为了用机器代码表达而使用的中间语言。
Q&A
Q1:Gemini CLI是什么?有什么特别之处?
A:Gemini CLI是谷歌开发的基于命令行的AI编程工具。它的特别之处在于能够使用自然语言与开发者交互,帮助制作需求文档并根据规范自动编写代码,还能进行故障排除和自我纠正。
Q2:AI编程工具会取代传统的IDE开发环境吗?
A:不会完全取代,但会改变使用方式。未来开发者可能会花更多时间处理需求,在IDE中的时间逐渐缩短。IDE更多会被用作阅读代码的地方,而不是编写代码的地方。这种变化会在相当长的时间范围内发生。
Q3:AI编程工具普及后开发者的工作会消失吗?
A:不会消失但会转变。开发者的工作将更像架构师,主要负责将大型复杂问题分解为更小的可解决任务,需要思考更大的图景和整体架构,而不是专注于具体的代码实现细节。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。