Respan公司(原Keywords AI Inc.)今日宣布完成500万美元种子轮融资,推出一款主动式人工智能可观测平台。该平台集成了自动化评估智能体,可协助提示更新、发送警报并推荐修复方案。
随着AI智能体在人工智能领域成为常态,可观测性和评估变得越来越重要,以保持智能体的稳定性和正确运行方向。传统工具提供追踪、指标和基于AI的评估来帮助团队检查故障并衡量质量。
联合创始人Andy Li在接受采访时指出:"AI智能体以出现幻觉而闻名。"
Respan正在进入不断增长的AI可观测性和评估工具市场。Li认为,许多现有平台仅停留在回顾性追踪和评分,而非帮助团队主动识别回归、根本原因和后续步骤。
要长期管理智能体并实现全面可见性,团队需要紧密结合的可观测性、评估和决策,基于对能够处理非确定性的智能体行为的理解。
Li表示:"评估智能体可以分析不同试验中的故障,找出智能体做出特定决策的根本原因,并推荐下一步应添加的评估。"
客户通常在使用Respan时已经拥有框架、原始模型、智能体设置或开发环境。该平台仅需几行代码即可直接集成到现有系统中,然后在几分钟内在平台中显示智能体行为轨迹。
Li表示,公司希望将自己定位为模型、供应商、框架和语言无关的平台。从Respan的观察角度来看,无论运行什么模型或代码,平台都能够识别和追踪智能体行为,并提供可行的主动警报和建议。
该公司使用现成的第三方模型而非专有基础模型作为底层AI。客户也可以选择自己的模型。不过Li指出,在评估智能体方面,最好选择与被评估智能体不同的模型系列,否则观察者的偏见可能会干扰被观察对象。
同样,他指出客户应将评估模型设置为"低温度"模式。这意味着配置模型产生更保守、可预测和确定性的输出。低温度迫使模型选择最安全的选项,使其行为更接近训练数据,从而让指令遵循模型变得更严格。
平台连接后,可以建议下一步评估、推荐更改、采样生产流量,并通过Slack、邮件或短信发送警报。它还可以针对开发、测试或生产环境,让团队在将智能体部署到客户环境之前观察和评估其行为。
本轮融资由Gradient、Y Combinator、Hat-Trick Capital、小小基金、Antigravity Capital和Alpen Capital支持,还有知名天使投资人和AI创始人参与。
完成此轮融资后,Respan计划专注于招聘和基础设施可靠性。过去一年中,公司已扩展至100多家初创公司和企业团队,为其智能体系统提供主动式AI可观测性洞察。
Q&A
Q1:Respan是什么公司?它的主要产品功能是什么?
A:Respan(原Keywords AI Inc.)是一家AI可观测性平台公司,主要产品是主动式人工智能可观测平台,集成了自动化评估智能体,可协助提示更新、发送警报并推荐修复方案,帮助团队管理和监控AI智能体的行为。
Q2:Respan平台如何解决AI智能体的幻觉问题?
A:Respan通过评估智能体分析不同试验中的故障,找出智能体做出特定决策的根本原因,并推荐下一步应添加的评估。平台能够主动识别回归、根本原因和后续步骤,而不仅仅是回顾性追踪和评分。
Q3:企业如何集成和使用Respan平台?
A:Respan平台仅需几行代码即可直接集成到客户现有的框架、模型、智能体设置或开发环境中,几分钟内就能显示智能体行为轨迹。平台支持模型、供应商、框架和语言无关,可以通过Slack、邮件或短信发送警报和建议。
好文章,需要你的鼓励
ecobee正式启动2026年阵亡将士纪念日促销活动,涵盖HomeKit智能温控器、摄像头及传感器等多款产品,套装最高优惠120美元。此次折扣力度与亚马逊春季大促基本持平。对于希望升级或扩展智能家居系统的用户而言,这类节日促销是入手ecobee产品的少数优惠时机之一,捆绑套装性价比尤为突出。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
无人机食品配送服务商Flytrex与全球知名披萨连锁品牌Little Caesars宣布合作,推出全新Sky2无人机,最大载重达4公斤,可一次配送两个大披萨及饮料,满足全家用餐需求。Sky2支持最远6.4公里的配送范围,平均从起飞到送达仅需4.5分钟。首个试点门店已在德克萨斯州怀利市上线,并实现与Little Caesars订单系统的直接集成。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。