Respan公司(原Keywords AI Inc.)今日宣布完成500万美元种子轮融资,推出一款主动式人工智能可观测平台。该平台集成了自动化评估智能体,可协助提示更新、发送警报并推荐修复方案。
随着AI智能体在人工智能领域成为常态,可观测性和评估变得越来越重要,以保持智能体的稳定性和正确运行方向。传统工具提供追踪、指标和基于AI的评估来帮助团队检查故障并衡量质量。
联合创始人Andy Li在接受采访时指出:"AI智能体以出现幻觉而闻名。"
Respan正在进入不断增长的AI可观测性和评估工具市场。Li认为,许多现有平台仅停留在回顾性追踪和评分,而非帮助团队主动识别回归、根本原因和后续步骤。
要长期管理智能体并实现全面可见性,团队需要紧密结合的可观测性、评估和决策,基于对能够处理非确定性的智能体行为的理解。
Li表示:"评估智能体可以分析不同试验中的故障,找出智能体做出特定决策的根本原因,并推荐下一步应添加的评估。"
客户通常在使用Respan时已经拥有框架、原始模型、智能体设置或开发环境。该平台仅需几行代码即可直接集成到现有系统中,然后在几分钟内在平台中显示智能体行为轨迹。
Li表示,公司希望将自己定位为模型、供应商、框架和语言无关的平台。从Respan的观察角度来看,无论运行什么模型或代码,平台都能够识别和追踪智能体行为,并提供可行的主动警报和建议。
该公司使用现成的第三方模型而非专有基础模型作为底层AI。客户也可以选择自己的模型。不过Li指出,在评估智能体方面,最好选择与被评估智能体不同的模型系列,否则观察者的偏见可能会干扰被观察对象。
同样,他指出客户应将评估模型设置为"低温度"模式。这意味着配置模型产生更保守、可预测和确定性的输出。低温度迫使模型选择最安全的选项,使其行为更接近训练数据,从而让指令遵循模型变得更严格。
平台连接后,可以建议下一步评估、推荐更改、采样生产流量,并通过Slack、邮件或短信发送警报。它还可以针对开发、测试或生产环境,让团队在将智能体部署到客户环境之前观察和评估其行为。
本轮融资由Gradient、Y Combinator、Hat-Trick Capital、小小基金、Antigravity Capital和Alpen Capital支持,还有知名天使投资人和AI创始人参与。
完成此轮融资后,Respan计划专注于招聘和基础设施可靠性。过去一年中,公司已扩展至100多家初创公司和企业团队,为其智能体系统提供主动式AI可观测性洞察。
Q&A
Q1:Respan是什么公司?它的主要产品功能是什么?
A:Respan(原Keywords AI Inc.)是一家AI可观测性平台公司,主要产品是主动式人工智能可观测平台,集成了自动化评估智能体,可协助提示更新、发送警报并推荐修复方案,帮助团队管理和监控AI智能体的行为。
Q2:Respan平台如何解决AI智能体的幻觉问题?
A:Respan通过评估智能体分析不同试验中的故障,找出智能体做出特定决策的根本原因,并推荐下一步应添加的评估。平台能够主动识别回归、根本原因和后续步骤,而不仅仅是回顾性追踪和评分。
Q3:企业如何集成和使用Respan平台?
A:Respan平台仅需几行代码即可直接集成到客户现有的框架、模型、智能体设置或开发环境中,几分钟内就能显示智能体行为轨迹。平台支持模型、供应商、框架和语言无关,可以通过Slack、邮件或短信发送警报和建议。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。