在伦敦举办的Unscripted活动上,DevOps公司Harness展示了其最新的AI驱动模块,包括AI管道构建器、AI测试自动化、构建失败时的自主代码修复、AI应用安全(AppSec),甚至还有AI驱动的混沌测试,通过引入随机故障来测试系统弹性。
根据Harness的数据,软件团队只有30-40%的时间用于规划和编码,其余时间都被测试、安全、部署和应用优化所占用。这意味着通过将AI辅助扩展到这些编码后的流程中,可以实现巨大的生产力提升。
考虑到AI的非确定性以及容易出现幻觉和提示注入等问题,将安全关键的DevOps流程委托给这项技术是否安全?
首席执行官兼联合创始人Jyoti Bansal告诉我们,与通用大语言模型相比,Harness AI智能体出现幻觉的可能性更小。对于创建构建和部署管道等任务,"我们的智能体会将任务分解为更小的任务,我们为这些更小的任务配备了专门构建的智能体,这些智能体还会相互验证彼此的输出。"
他说,另一个关键因素是上下文,即对组织的了解,以及"你过去做过的事情、你的构建、你的安全测试、你的代码更改、你的服务及其依赖关系的知识。智能体会使用这些信息,这样就不会出现不准确和幻觉。"
此外,他向我们保证,"这一切都不是在没有人类输入的情况下完成的...我们的AI不会直接进行生产部署。我们的AI是在创建用于生产部署的确定性管道。"他说,虽然无法完全消除非确定性,但在AI创建自动化之后,"你要审核它,检查它的合规性和治理...我们不是通过AI进行部署,而是通过AI创建部署管道和自动化。然后它就是确定性和可重复的,因为在运行时没有AI参与。"
不过,人工检查的问题,有时被称为"人在环路中",是困难的。在活动主题演讲中,Bansal描述了以前无法创建用户界面测试的非专家现在如何通过用简单的英语描述需求来完成测试。他还说,使用AI生成的代码意味着代码量可能是以前的四倍,这使得人类很难检查每一行代码。Bansal告诉我们:"这就是为什么你需要更加稳健的检查和平衡流程。整个过程都必须显著改善,包括所有的测试、部署、回滚、治理、合规等各个方面。"
考虑到在Harness平台上,所有这些流程本身都可能包含AI,这是否意味着我们在要求AI检查自己的输出?
"你可以让AI检查AI做了什么,但我总是建议你需要两个不同的AI。不要相信一个AI既做会计又做审计,就像你不会相信一个人既做账又做审计一样。"
一个相关的问题是,如果人们越来越依赖AI,那么验证代码或复杂流程所需的人类技能本身可能更难找到。
Bansal告诉我们:"我认为工程师需要AI任务管理者类型的技能。优秀的工程师必须了解向AI询问什么,以及如何更好、更恰当地做到这一点...这些正在成为顶级技能。"
他说,使用AI是"一个迭代过程。你问AI某件事,你审查它,然后你让它做某件事,然后你审查它。这成为了你的技能,我认为这将是软件工程完成方式的核心。"
这让人想起最新Google DORA(DevOps研究与评估)报告中的结论,实际上DORA研究也在Unscripted主题演讲中被引用。
对于AI怀疑论者来说,有一个好消息。Harness平台中的AI是可选的。Bansal说:"你可以关闭AI中的所有功能,也可以分段开启。你可以说,我接受AI用于测试,但不希望AI用于我的安全运行时保护。你也可以为不同的团队和应用程序进行设置...存在不同程度的舒适度和怀疑态度,我们允许这种情况。"
Harness DevOps平台运行在Kubernetes上,控制平面可以在云端或本地部署(根据Bansal的说法,80%在云端),以及始终在本地或组织虚拟私有云上运行的Delegate工作节点。小团队有免费计划,最多500用户的基础版每用户每月30美元,企业版通常每年10-20万美元。
Q&A
Q1:Harness的AI智能体如何避免AI幻觉问题?
A:Harness通过将复杂任务分解为更小的任务,为每个小任务配备专门的智能体,并让这些智能体相互验证输出来减少幻觉。同时利用组织的历史数据、构建信息、安全测试和代码更改等上下文信息,提高AI输出的准确性。
Q2:使用AI生成代码后,人类如何有效检查四倍增长的代码量?
A:Bansal建议建立更加稳健的检查和平衡流程,包括改善测试、部署、回滚、治理、合规等各个环节。同时强调这是一个迭代过程,需要工程师具备AI任务管理技能,学会如何正确地询问和审查AI的输出。
Q3:Harness DevOps平台的AI功能是强制使用的吗?
A:不是强制的。用户可以完全关闭AI功能,也可以选择性地开启部分功能。比如可以接受AI用于测试但拒绝用于安全运行时保护,还可以为不同团队和应用程序分别设置,满足不同程度的接受度和需求。
好文章,需要你的鼓励
英国宠物慈善机构PDSA数据显示,超过半数宠物主担心无法承担兽医费用。科技公司正通过AI和物联网技术解决这一市场需求。在伦敦兽医展上,多家初创公司展示了创新技术:AI for Pet利用视觉AI分析宠物眼部、皮肤等图像提供健康洞察;Sylvester.ai开发AI模型识别猫咪疼痛表情;VEA整合患者数据自动化诊断。此外,智能项圈等物联网设备可追踪宠物健康症状。这些技术有助于宠物主采取预防措施,降低兽医费用。
蚂蚁集团等机构联合提出IGPO方法,解决多轮AI智能体训练中的奖励稀疏问题。该方法通过信息增益为每个交互轮次提供密集反馈,避免传统方法中的"优势坍塌"现象。在七个数据集上的实验表明,IGPO显著超越现有方法,平均提升4.8分,对小型模型改进尤为显著。该研究为多轮推理AI训练提供了新思路。
北欧国家启动统一人工智能产业计划,旨在通过合作在全球舞台上竞争,获得微软和谷歌支持。10月成立的新北欧AI中心获得350万英镑初始预算,但谷歌和微软是唯一提供资金支持的科技公司,具体金额保密。该中心将开发生成式AI系统并建设应用AI服务的系统。北欧教育部长承诺追加资金开发大型北欧语言生成AI模型。尽管资金有限,但北欧国家希望通过联合力量在AI竞赛中提升地位。
ETH苏黎世大学和Google联合开发的VIST3A技术,通过巧妙拼接视频生成模型和3D重建模型,实现了仅用文字描述就能生成高质量3D场景的突破。该技术采用模型拼接和直接奖励微调两大核心创新,在多个基准测试中显著超越现有方法,为3D内容创作的民主化开辟了新路径,有望推动游戏、教育、设计等领域的变革。