随着人工智能技术的快速发展,智能体AI凭借其在机器速度下进行推理、适应和自主行动的能力,正在深刻改变企业维护数字韧性的方式。这项技术重新定义了企业如何保护和提供可靠的数字生态系统性能,特别是在需要实时和机器速度进行数据模式识别和决策的场景中。
智能体AI为企业带来了大语言模型推理和适应的对话式分析体验,以及智能体框架的任务执行自动化优势。这些能力的结合使IT团队从被动的救火模式转向主动的规划模式。
**智能体AI在数字韧性方面的应用价值**
**1. 几乎瞬时定位根本原因**
智能体AI能够跨越孤立的应用程序边界,整合数据洞察以提供更完整的可视性。例如,智能体AI可以使用大语言模型分析日志、指标、事件和跟踪数据,调用生态系统中的不同监控系统,对数据进行推理,并推荐或采取修复措施。几分钟内,智能体AI就能完成过去需要站点可靠性工程师数小时才能定位和排查的潜在问题。
在安全威胁方面,智能体AI可以实时分析数据流以识别威胁,包括零日漏洞或内部威胁;自动化来自多个安全应用程序的多步骤调查工作流程;并执行适当的修复响应以遏制威胁并防止横向移动。过去需要安全运营中心分析师数小时完成的调查现在可以在几分钟内完成。
**2. 预防中断和停机**
智能体AI的强大功能可以更主动地预防事件和中断。通过研究历史数据和当前趋势,智能体AI可以在漏洞被利用之前预测它们,如未修补的软件或弱加密。它可以检测细微的用户行为异常,在损害发生之前标记可疑活动。它还可以分析来自多个源的实时数据流,如日志、指标和跟踪,提供系统健康状况的全面视图,并在资源瓶颈或延迟峰值等问题升级之前检测到它们。
简而言之,智能体AI进行根本原因分析的速度和规模意味着可以在更多警报成为更大问题之前分析和解决它们。
**3. 通过上下文实时洞察做出更好的决策**
智能体AI具有处理环境中新信息并实时调整其推理和行动方案的能力。上下文数据是指关于用户、设备、应用程序和环境的丰富多维信息,如用户行为模式、设备状态、网络条件和数据流。智能体AI可以处理上下文数据和模式,做出快速、明智的决策来检测和修复事件,并优化运营性能。
**4. 提升和优化劳动力技能**
通过智能体AI,您可以获得自然语言界面和通过代理框架的自动化任务执行。各级员工都可以使用它来提升跨领域的知识技能,无论是识别安全威胁向量还是在可观测性中导航复杂的应用程序堆栈。
**智能体AI的关键部署考虑因素**
**1. 保持人类参与和监督**
人类最终负责管理AI代理。随着更多AI代理增强分析师和管理者的工作,组织需要技术分析师学习新技能来管理代理并将其纳入企业工作流程中。
自动化完整的检测-调查-响应工作流程很有吸引力,但随着工作流程变得更加复杂,涉及多个代理和步骤,复合错误和幻觉的风险也会增加。在自动化分析工作流程的关键点插入人类参与,能够确保代理在正确的轨道上,提供实时反馈并使用强化学习来改进模型性能。
**2. 通过特定领域的专业代理避免幻觉**
模型幻觉存在真实成本。麦肯锡AI报告估计,全球因AI幻觉输出损失了674亿美元。OpenAI的o3和o4-mini在推理任务上显示出51%到79%的幻觉率。
缩小代理的目的范围,结合微调和使用特定领域数据的RAG模型增强,可以提高输出准确性。针对安全和可观测性等领域的专业代理,甚至更有针对性的检测、调查和响应代理,将提供更高的精确度。与更大的通用LLM相比,这些代理还将受益于更低的推理计算成本和延迟。
**3. 确保智能体生态系统中的无缝集成和兼容性**
将智能体AI集成到IT环境中需要重新思考数据流、流程和安全协议,并调整用户交互模型以在利用AI潜力的同时保持系统完整性。三个新兴协议将有助于加速这一过程:模型上下文协议(MCP)用于LLM与其他应用程序和数据集成;代理到代理(A2A)允许代理之间相互通信和协作;代理协议(AGNTCY)用于跨企业的供应商中立标准化代理编排。
**4. 代理访问控制和数据隐私治理**
代理访问管理的数量和速度将远远超过传统的人类访问管理。定义维护合规性的自主代理的明确访问级别,并建立审计和治理记录计划至关重要。目标是在不引入风险的情况下提高运营效率,使AI在IT生态系统中充当安全的增强力量。
作为思科公司旗下品牌,Splunk正在以AI为核心重新定义企业安全和可观测性,以加速洞察、自动化关键工作流程并提高分析师生产力。基于机器学习能力的悠久历史,Splunk正在其行业领先的安全和可观测性解决方案中嵌入生成式和智能体AI。凭借统一的运营数据平台,Splunk正在构建一个AI就绪平台,以推动企业安全和可观测性成果的实现。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。