Momentic Inc.是一个由人工智能驱动的软件测试和质量保证平台,今天宣布在早期阶段融资中筹集了1500万美元。
Standard Capital领投了这轮A轮融资,Dropbox Ventures以及现有投资者Y Combinator、FCVC、Transpose Platform和Karman Ventures参与了投资。这次融资使该公司的总融资额达到1920万美元,此前Momentic在仅仅8个月前完成了370万美元的种子轮融资。
许多公司,包括大型企业,都在运行极其繁重的质量保证生命周期。这些流程可能涉及大量自动化测试工具,这些工具严重依赖手写或生成的测试脚本,在功能上线前对其进行测试。
联合创始人兼首席执行官Wei-Wei Wu在接受SiliconANGLE采访时表示:"测试技术已经有20多年的历史,但所有完全自动化的工具仍然需要大量人工干预来编写和维护。"
根据外包软件质量保证服务领先提供商QASource Inc.的一份报告,AI驱动的测试自动化正在增长。手动生成综合测试用例是质量保证过程中最费力且容易出错的部分之一,通常每个功能要花费两到三周时间。即便如此,大多数团队也只能覆盖大约60%到70%的场景,这让软件容易出现漏洞。
除此之外,为前端用户界面预生成的测试用例是脆弱的——这意味着用户界面结构的微小变化就可能破坏测试。
AI编码工具的日益普及,如Anysphere Inc.的Cursor和Anthropic PBC的Claude Code,大大加速了软件功能创建和部署的步伐。根据AI原生软件交付平台Harness Inc.最近的一项调查,67%的开发者表示他们花费更多时间调试AI生成的代码。令人震惊的是,92%的开发者报告说,AI增加了坏代码进入生产环境的"爆炸半径"。
Momentic通过提供一个工具来解决这个问题,该工具可以从完全自然语言语句生成自动化测试用例,描述软件应该如何工作。AI然后规划行动,开发测试用例,并执行测试以揭示是否有什么地方工作不正常。如果用户界面的底层结构发生变化,平台可以自动修复测试,使它们在新范式下继续运行。
Wu补充说:"工程团队正在被破损的Selenium、Cypress和Playwright测试所淹没。质量保证团队开始成为瓶颈。有了Momentic,你可以让你的工程师拥有质量控制权。"
该公司已经发展为各种规模公司质量保证团队信赖的伙伴,从大型技术团队如Notion Labs Inc.和Xero Ltd.,到AI公司如Runway AI Inc.和Reducto Inc.,以及类别领导者如Quora Inc.和Bilt Technologies Inc.。
Notion开发者体验主管Erdem Alparslan说:"在使用Momentic之前,我们的Selenium套件给了我们良好的信号,但维护成本很高。如今,每个工程师都会在每次拉取请求、合并和部署时运行Momentic测试,这是他们正常工作流程的一部分。"
根据该公司统计,Momentic在过去一个月执行了超过2亿个步骤,自动化了相当于近30万小时的手动测试。在同一时期,该平台阻止了超过39万个漏洞进入生产环境。
自3月以来,Momentic已经从仅限网页自动化扩展为多平台测试系统,覆盖移动端——包括Android和iOS——以及即将推出的桌面应用程序,反映了现代团队发布平台的多样性。Wu还强调了基础设施增强功能,如用于大规模管理不稳定测试的"扩大隔离区域"。
在重大更新中,该公司推出了与AI工具的集成和原生模型上下文协议服务器,使AI编码智能体能够直接在Momentic内生成或优化测试。
Wu说:"Momentic不仅仅是一个测试工具。我们将Momentic视为客户如何思考其产品的真相之源。"
Momentic计划利用新资金通过扩展平台覆盖、整合可访问性测试等功能以及加强与AI编码工具和编辑器的集成来增强其工程努力。该公司还将通过增加销售和营销努力来扩大其市场推广运营,以推广其在AI时代软件质量方面的愿景。
Q&A
Q1:Momentic平台有什么特殊功能?
A:Momentic可以从自然语言语句生成自动化测试用例,AI会规划行动、开发测试用例并执行测试。当用户界面结构变化时,平台还能自动修复测试,让测试在新环境下继续运行。
Q2:使用Momentic能带来什么实际效果?
A:根据公司数据,Momentic在过去一个月执行了超过2亿个步骤,自动化了相当于近30万小时的手动测试工作,并阻止了超过39万个漏洞进入生产环境。
Q3:哪些知名公司在使用Momentic?
A:Momentic已被各种规模的公司采用,包括大型技术公司如Notion Labs和Xero,AI公司如Runway AI和Reducto,以及行业领导者如Quora和Bilt Technologies等。
好文章,需要你的鼓励
Anthropic周一发布了旗舰模型Opus 4.5,这是4.5系列的最后一个模型。新版本在编程、工具使用和问题解决等基准测试中表现出色,是首个在SWE-Bench验证测试中得分超过80%的模型。同时推出Claude for Chrome和Claude for Excel产品,分别面向不同用户群体。Opus 4.5还改进了长文本处理的内存管理,支持付费用户的"无限聊天"功能,并针对智能体应用场景进行了优化,将与OpenAI的GPT 5.1和谷歌的Gemini 3展开竞争。
南洋理工大学团队开发了Uni-MMMU基准测试,专门评估AI模型的理解与生成协同能力。该基准包含八个精心设计的任务,要求AI像人类一样"边看边想边画"来解决复杂问题。研究发现当前AI模型在这种协同任务上表现不平衡,生成能力是主要瓶颈,但协同工作确实能提升问题解决效果,为开发更智能的AI助手指明了方向。
总部位于圣地亚哥的AI公司耐能发布新一代KL1140芯片,这是首款能在边缘端运行完整变换器网络的神经处理单元。该芯片可将大语言模型从云数据中心转移到便携式本地设备中,四颗芯片组合可实现类似GPU的性能,支持1200亿参数模型运行,功耗降低三分之一至一半,硬件成本减少十倍。
360 AI Research团队发布的FG-CLIP 2是一个突破性的双语精细视觉语言对齐模型,能够同时处理中英文并进行精细的图像理解。该模型通过两阶段训练策略和多目标联合优化,在29个数据集的8类任务中均达到最先进性能,特别创新了文本内模态对比损失机制。团队还构建了首个中文多模态评测基准,填补了该领域空白,为智能商务、安防监控、医疗影像等应用开辟新可能。