亚太地区的企业正越来越多地为了追求速度而牺牲软件质量,Tricentis亚太区高级副总裁Damien Wong将这一趋势形容为"令人担忧"。
在新加坡接受Computer Weekly采访时,Wong引用了公司最近关于软件质量转型的研究,发现接受调查的企业中,近一半承认在未经测试的情况下就发布代码。
Wong表示:"快速交付的压力有时会驱动这种走捷径的行为,在软件得到充分测试之前就将其推出。企业对速度的要求非常强烈。"
未经测试的代码带来的财务影响可能十分严重。据Wong透露,由于软件缺陷和系统故障,企业可能面临50万至500万美元的平均损失。
为了解决这一问题,Tricentis一直在智能体测试自动化领域大力投资。与早期版本更像副驾驶的AI辅助软件测试工具不同,智能体具有一定的自主性,能够生成测试资产、执行测试并分析结果,几乎无需人工干预。
Wong说:"想象一下,你现在有一个虚拟性能工程师,你可以用自然语言指导它。你可以说'用最多1000个并发用户测试系统,返回结果,并提供一些改善性能的建议'。"
Wong指出,使用自动化软件测试工具并不意味着人工测试员会失业。相反,他们将更加高效,价值也会比以前更高。"想象一下,一个具备AI能力的高水平测试工程师,他们将能够完成10到20个工程师的工作,以应对不断增长的代码开发速度。"
对自动化软件测试工具的需求反映在公司的区域表现上。Wong透露,Tricentis亚太业务在2024财年同比增长42%,超过公司全球28%的增长率。
公司的增长得益于该地区的两个关键趋势:应用程序现代化和生成式AI驱动的数字创新。随着传统的"单体化且脆弱"应用程序更新为云原生技术栈,测试的复杂性呈指数级增长。
Wong说:"你的企业可能有数百、数千甚至数万个应用程序在运行。你对一个系统或应用程序做出一个改动,就可能对上游或下游的其他系统和应用程序产生潜在影响。"
Wong指出,智能体测试以及更广泛的软件质量保证领域也关乎可见性。谈到公司收购AI驱动的软件质量智能平台SeaLights时,他解释了AI如何预防类似2024年CrowdStrike故障的灾难,该故障是由未完全测试的内容配置更新引起的。
Wong表示,SeaLights平台可以持续监控应用程序元数据的代码变更,并将其与测试活动相关联。"例如,如果你更改了一个API并检入了代码,你运行了哪些类型的测试?如果没有进行任何测试,它会智能地告诉你这是一个问题。如果出现问题,你永远不会措手不及。"
随着企业急于将生成式AI集成到他们的产品中,他们也在努力解决如何验证非确定性大语言模型的问题,这些模型从相同输入产生不同输出,使传统验证方法变得不足。
Wong说:"没有对错的结果,但可能有完全不可接受的情况。所以,你要确保能够定义护栏并确保在其范围内。"
虽然这一领域的市场仍在成熟中,但Wong表示,Tricentis最近在新加坡举办的智能系统测试大师班报名人数超额,表明企业对AI风险和合规性感到担忧。不过,Wong表示,目前大多数客户仍在使用AI测试传统的确定性系统。
Tricentis的工具可以通过公有云和本地部署使用。虽然公司已在澳大利亚和日本建立了云区域,并计划在新加坡这样做,但许多受监管行业仍然偏好本地或混合解决方案。
Wong说:"在亚太地区,趋势是混合的。曾经有一个向完全公有云发展的巨大趋势,但现在有所回撤。我们合作的许多受严格监管的客户出于安全考虑选择在本地部署我们的软件。"
尽管如此,Wong向使用Tricentis云平台的客户保证,公司无法访问他们的源代码。"我们可以看到与你的软件构建相关的元数据,以确定哪些模块已被更改。但我们不确切知道其中的代码,这样可以消除人们对代码可能被获取或盗用的担忧。"
Q&A
Q1:智能体测试自动化与传统AI测试工具有什么区别?
A:智能体测试自动化具有更高的自主性,能够生成测试资产、执行测试并分析结果,几乎无需人工干预。而早期版本的AI辅助测试工具更像副驾驶,需要更多人工参与。
Q2:使用自动化测试工具会让测试工程师失业吗?
A:不会。测试工程师不会失业,反而会更加高效和有价值。一个具备AI能力的高水平测试工程师将能够完成10到20个工程师的工作,以应对不断增长的代码开发速度。
Q3:企业发布未测试代码会造成多大损失?
A:据Tricentis调查,近一半企业承认在未经测试的情况下发布代码。由于软件缺陷和系统故障,企业可能面临50万至500万美元的平均损失,财务风险相当严重。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。