Respan公司(原Keywords AI Inc.)今日宣布完成500万美元种子轮融资,推出一款主动式人工智能可观测平台。该平台集成了自动化评估智能体,可协助提示更新、发送警报并推荐修复方案。
随着AI智能体在人工智能领域成为常态,可观测性和评估变得越来越重要,以保持智能体的稳定性和正确运行方向。传统工具提供追踪、指标和基于AI的评估来帮助团队检查故障并衡量质量。
联合创始人Andy Li在接受采访时指出:"AI智能体以出现幻觉而闻名。"
Respan正在进入不断增长的AI可观测性和评估工具市场。Li认为,许多现有平台仅停留在回顾性追踪和评分,而非帮助团队主动识别回归、根本原因和后续步骤。
要长期管理智能体并实现全面可见性,团队需要紧密结合的可观测性、评估和决策,基于对能够处理非确定性的智能体行为的理解。
Li表示:"评估智能体可以分析不同试验中的故障,找出智能体做出特定决策的根本原因,并推荐下一步应添加的评估。"
客户通常在使用Respan时已经拥有框架、原始模型、智能体设置或开发环境。该平台仅需几行代码即可直接集成到现有系统中,然后在几分钟内在平台中显示智能体行为轨迹。
Li表示,公司希望将自己定位为模型、供应商、框架和语言无关的平台。从Respan的观察角度来看,无论运行什么模型或代码,平台都能够识别和追踪智能体行为,并提供可行的主动警报和建议。
该公司使用现成的第三方模型而非专有基础模型作为底层AI。客户也可以选择自己的模型。不过Li指出,在评估智能体方面,最好选择与被评估智能体不同的模型系列,否则观察者的偏见可能会干扰被观察对象。
同样,他指出客户应将评估模型设置为"低温度"模式。这意味着配置模型产生更保守、可预测和确定性的输出。低温度迫使模型选择最安全的选项,使其行为更接近训练数据,从而让指令遵循模型变得更严格。
平台连接后,可以建议下一步评估、推荐更改、采样生产流量,并通过Slack、邮件或短信发送警报。它还可以针对开发、测试或生产环境,让团队在将智能体部署到客户环境之前观察和评估其行为。
本轮融资由Gradient、Y Combinator、Hat-Trick Capital、小小基金、Antigravity Capital和Alpen Capital支持,还有知名天使投资人和AI创始人参与。
完成此轮融资后,Respan计划专注于招聘和基础设施可靠性。过去一年中,公司已扩展至100多家初创公司和企业团队,为其智能体系统提供主动式AI可观测性洞察。
Q&A
Q1:Respan是什么公司?它的主要产品功能是什么?
A:Respan(原Keywords AI Inc.)是一家AI可观测性平台公司,主要产品是主动式人工智能可观测平台,集成了自动化评估智能体,可协助提示更新、发送警报并推荐修复方案,帮助团队管理和监控AI智能体的行为。
Q2:Respan平台如何解决AI智能体的幻觉问题?
A:Respan通过评估智能体分析不同试验中的故障,找出智能体做出特定决策的根本原因,并推荐下一步应添加的评估。平台能够主动识别回归、根本原因和后续步骤,而不仅仅是回顾性追踪和评分。
Q3:企业如何集成和使用Respan平台?
A:Respan平台仅需几行代码即可直接集成到客户现有的框架、模型、智能体设置或开发环境中,几分钟内就能显示智能体行为轨迹。平台支持模型、供应商、框架和语言无关,可以通过Slack、邮件或短信发送警报和建议。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。