LaunchDarkly是一家专注于功能控制的平台公司,致力于帮助开发者和软件工程师发布并管理产品。近日,该公司正式宣布推出AgentControl——一项为生产环境中的AI智能体提供实时管理能力的全新解决方案。
随着越来越多的智能体被部署到生产环境中,企业逐渐发现,与普通代码不同,生成式AI具有概率性特征,其表现并不总与测试阶段完全一致。
模型虽然可以持续更新和迭代实验,但在面对意料之外的用户交互时,即便代码没有任何改动,输出质量也可能悄然下滑。一旦投入使用,智能体通常被赋予较大的自主空间,人工监督相对减少,目的是让它们能够高效完成任务。然而,这也使得异常状况不断累积时,智能体容易偏离预定任务轨道,而这一过程的发展速度往往超出团队的反应能力。
LaunchDarkly首席技术官Cameron Etezadi表示:"AI领域最棘手的问题,比如模型漂移、输出不稳定以及干预响应不够及时,恰恰正是我们平台所擅长解决的。我们不需要重新构建平台,只需将其延伸扩展,以适应AI软件开发生命周期和智能体驱动工作流的新需求。"
据LaunchDarkly介绍,其平台将即时运行时干预能力与团队可靠运行AI智能体所需的操作层深度融合。平台能够支持跨团队、跨框架的智能体行为配置,在变更影响线上流量之前完成质量基准评估,并通过渐进式发布实现受控上线。
上述功能均配备精细化的追踪级可见性,使团队能够基于真实生产数据持续迭代优化。这意味着IT团队、软件工程师、AI工程师,乃至使用无代码工具构建AI智能体的业务用户,都可以在无需重新部署的情况下,从容推进智能体的维护工作。
LaunchDarkly强调,在生产环境中管理智能体所需的控制能力,对响应速度有着极高要求。平台的配置变更可在200毫秒内完成传播,这一速度足以在对话进行过程中实时调整智能体行为、切换至备用模型或触发降级策略——全程在用户察觉到任何异常之前便已完成。
Cursor AI代码编辑器的开发商Anysphere Inc.全球营收与现场运营总裁Brian McCarthy表示:"随着越来越多的AI驱动产品和智能体能力进入生产阶段,运行时控制已成为与开发工作流和团队所信赖的管控机制同等重要的基础设施。"
LaunchDarkly在为软件工程团队构建强大的控制与管理界面方面积累了丰富经验。其核心用户群体主要集中在开发与运维(DevOps)领域,应用功能配置的调整一直是该公司业务发展的重要组成部分。
AgentControl正是将这些积累的专业能力延伸至智能体AI新时代,为企业提供了一种有效掌控智能体行为的强大手段。随着开发团队持续部署更多以机器速度运行、编写和交互的智能体,LaunchDarkly认为,相应的管控系统同样需要具备与之匹配的快速响应能力。
Q&A
Q1:AgentControl是什么?它能解决什么问题?
A:AgentControl是LaunchDarkly推出的一项新解决方案,专为生产环境中的AI智能体提供实时管理能力。它主要解决智能体在生产环境中面临的模型漂移、输出不稳定以及人工干预响应不及时等问题,支持跨团队配置智能体行为、发布前质量基准评估,以及渐进式受控上线,全程无需重新部署代码。
Q2:AgentControl的配置变更响应速度有多快?
A:AgentControl的配置变更可在200毫秒内完成传播。这意味着在一次对话进行的过程中,平台就能实时调整智能体行为、切换至不同模型或触发降级策略,整个过程在用户察觉到任何异常之前便已完成,极大保障了线上服务的稳定性与用户体验。
Q3:AgentControl适合哪些用户使用?
A:AgentControl面向广泛的用户群体,包括IT团队、软件工程师、AI工程师,以及使用无代码工具构建AI智能体的业务用户。无论技术背景深浅,用户都可以借助该平台在无需重新部署的情况下,对智能体进行维护和管理,降低了智能体运营的技术门槛。
好文章,需要你的鼓励
Locus Robotics宣布收购加拿大温哥华机器人公司Nexera Robotics,将其专有的NeuraGrasp末端执行器技术整合至Locus Array平台。NeuraGrasp融合AI抓取智能、计算机视觉及专利软膜结构,可动态适应不同形状、材质、重量的商品,显著扩大了可自主拣选的SKU类型范围。此次收购将加速Locus Robotics在移动操控领域的技术路线图,推动仓储全流程自动化履约能力迈上新台阶。
ServiceNow研究团队构建的EVA-Bench框架,通过AI对AI的音频通话测试,量化评估语音客服系统在准确性和对话体验两个维度的真实表现,揭示现有系统普遍存在的可靠性缺口。
人形机器人正从原型验证迈向早期商业部署,汽车制造与物流领域预计成为未来十年核心需求市场。IDTechEx预测,相关市场规模将于2030年代初达到约250亿美元,2036年年出货量接近180万台。硬件成本持续下降,均价有望从2024年的约11.47万美元降至2030年的约3.7万美元。高利用率场景下运营成本有望低于5美元/小时,投资回收期可缩短至约6个月。但大规模商业化的关键,仍在于软件能力、任务泛化与系统集成的持续突破。
AWS AI Labs研究团队发布EvalAgent,这是一套通过"评估技能"自动生成AI智能体评测方案的系统,将首次运行成功率从17.5%提升至65%,并在人类专家评测中获得79.5%的偏好选择。