美国运通公司正在深化与网站可靠性工程初创公司Traversal Inc.的合作关系,通过美国运通风投进行战略投资,同时在其全球技术基础设施中部署Traversal的人工智能驱动网站可靠性工程平台。
这一合作伙伴关系反映了大型金融机构对使用AI自动化诊断和解决技术故障复杂工作的日益关注。传统上,这项任务需要工程师团队手动梳理系统日志和监控仪表板。
Traversal由来自麻省理工学院、哥伦比亚大学和康奈尔大学的研究人员创立,正在构建其所描述的AI驱动网站可靠性工程师。该软件分析大量运营遥测数据,如日志、指标和跟踪信息,以识别事故的根本原因并帮助工程团队更快地恢复服务。
与美国运通的合作包括商业部署和信用卡公司风险投资部门的500万美元战略投资。
美国运通风投董事总经理Kevin Weber表示:"美国运通运营规模庞大,可靠性和性能是提供无缝客户体验的基础。在如此复杂的分布式基础设施环境中,重点始终是推进运营事件的检测、理解和解决方式。"
大型金融机构往往面临特别困难的运营挑战,因为其技术环境跨越数千个应用程序和多个基础设施平台。故障排除可能需要来自不同团队的数十名工程师在有时被称为"作战室"的环境中协作。
Traversal表示其技术旨在自动化大部分此类工作。联合创始人兼首席执行官Anish Agarwal说,挑战不在于收集数据,因为大多数大型企业已经拥有广泛的可观测性工具来完成这项工作,而在于足够快地解释数据以找到问题的根本原因。
Agarwal说:"可观测性帮助你可视化数据,但找到根本原因仍然非常劳动密集。在财富100强企业中,你可能有50或100名工程师跳入作战室来弄清楚发生了什么。"
部分困难来自可观测性市场的碎片化。大型组织通常同时运行多个监控平台,这些平台彼此集成度不高。
Agarwal说:"Splunk永远不会为你提供存储在Datadog上的数据洞察,Datadog也永远不会为你提供存储在Splunk上的数据洞察。你需要能够查看所有数据,才能为你提供事故的深层根本原因。"
Traversal的系统使用大语言模型、AI智能体和因果机器学习技术来分析这些系统中的遥测数据。该平台不是试图关联性能数据中的不规律性,而是推断复杂软件环境中的因果关系。
Agarwal说:"典型的关联引擎捕获的是峰值。但理解哪个是根本原因与因为其他东西坏了而发生的事情需要因果推理。"
Weber说,因果推理、AI智能体和专为高度监管行业设计的以安全为重点的架构是使Traversal脱颖而出的因素之一。
他说:"Traversal的方法反映了可观测性的演进——从检测模式转向以更高精度理解根本原因。"
这项投资还反映了探索AI如何改善大规模技术环境中运营弹性的更广泛努力。
Weber说:"对Traversal的兴趣是由通过下一代能力增强基础设施运营的前瞻性机会驱动的。随着AI驱动的SRI变得越来越关键,业界越来越认识到传统的可观测性方法可以进一步加强。"
Traversal迄今已筹集了大约5300万美元的资金,并将其平台定位为Agarwal所称的"智能体事故响应"的基础层,其中AI智能体与工程师合作,自动诊断并最终修复系统故障。
Q&A
Q1:Traversal公司是做什么的?
A:Traversal是一家由麻省理工学院、哥伦比亚大学和康奈尔大学研究人员创立的网站可靠性工程初创公司。该公司构建AI驱动的网站可靠性工程师,其软件能够分析大量运营遥测数据,识别事故根本原因,帮助工程团队更快恢复服务。
Q2:美国运通为什么要投资Traversal?
A:美国运通运营规模庞大,面临复杂的分布式基础设施环境挑战。传统的故障排除需要数十名工程师协作,而Traversal的AI技术能够自动化这些工作,提高运营事件的检测、理解和解决效率,这对提供无缝客户体验至关重要。
Q3:Traversal的技术有什么独特之处?
A:Traversal使用大语言模型、AI智能体和因果机器学习技术,能够跨多个监控平台分析数据。与传统关联引擎不同,它通过因果推理来理解根本原因,而不仅仅是检测性能峰值,并且具有专为高度监管行业设计的安全架构。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。