AI智能体遭遇责任壁垒，Mixus推出人工监督解决方案

企业在关键应用中部署AI代理人面临挑战，Mixus平台推出"同事在环"模式应对。研究显示当前AI代理人单步任务成功率仅58%，多步任务仅35%。该模式将人工监督嵌入自动化工作流程，对高风险决策要求人工审批。通过整合Google Drive、Slack等工具，让AI处理90-95%常规任务，人工专注于5-10%的关键决策，实现效率与可靠性平衡。

企业在关键应用中部署AI智能体面临挑战时，一种更加务实的新模式正在兴起，该模式将人类重新置于控制地位，作为防范AI故障的战略保障。

Mixus平台就是这样一个例子，它采用"同事参与式"方法，使AI智能体在关键任务中变得可靠。

这种方法是对越来越多证据表明完全自主智能体是高风险赌博的回应。

不受控制的AI成本高昂

随着企业探索AI应用，AI幻觉问题已成为实实在在的风险。在最近的一起事件中，AI驱动的代码编辑器Cursor的支持机器人虚构了一项限制订阅的假政策，引发了公众客户取消订阅的浪潮。

同样，金融科技公司Klarna在承认用AI替代客服代理导致服务质量下降后，著名地逆转了这一决定。在一个更令人担忧的案例中，纽约市的AI商务聊天机器人建议企业家从事非法活动，凸显了无监督智能体带来的灾难性合规风险。

这些事件反映了更大的能力差距。根据2025年5月Salesforce的研究论文，当今领先的智能体在单步任务上成功率仅为58%，在多步任务上仅为35%，突显了"当前大语言模型能力与现实企业场景多元化需求之间的显著差距"。

同事参与式模式

为了弥合这一差距，新方法专注于结构化的人工监督。Mixus联合创始人Elliot Katz告诉VentureBeat："AI智能体应该按照你的指示并代表你行动。但没有内置组织监督的完全自主智能体往往会制造更多问题而非解决问题。"

这一理念支撑着Mixus的同事参与式模式，该模式将人工验证直接嵌入自动化工作流程中。例如，大型零售商可能每周收到来自数千家门店包含关键运营数据的报告（如销售量、工时、生产率比率、总部薪酬申请）。人工分析师必须花费数小时手动审查数据并基于启发式方法做决策。使用Mixus，AI智能体自动化繁重工作，分析复杂模式并标记异常情况，如异常高的薪资申请或生产率异常值。

对于支付授权或政策违规等高风险决策——用户定义为"高风险"的工作流程——智能体会暂停并要求人工批准后才能继续。AI与人类之间的分工已集成到智能体创建过程中。

"这种方法意味着人类仅在其专业知识真正增加价值时才参与——通常是可能产生重大影响的关键5-10%的决策——而其余90-95%的常规任务自动流转，"Katz说。"你在标准操作中获得全自动化的速度，但当上下文、判断和责任最重要时，人工监督会精确介入。"

在Mixus团队向VentureBeat展示的演示中，创建智能体是一个可以用纯文本指令完成的直观过程。例如，为记者构建事实核查智能体时，联合创始人Shai Magzimof简单地用自然语言描述多步骤过程，并指示平台在特定阈值处嵌入人工验证步骤，如当声明为高风险且可能导致声誉损害或法律后果时。

该平台的核心优势之一是与Google Drive、电子邮件和Slack等工具的集成，允许企业用户将自己的数据源引入工作流程，并直接从他们选择的通信平台与智能体交互，无需切换上下文或学习新界面。

平台的集成能力进一步扩展以满足特定企业需求。Mixus支持模型上下文协议(MCP)，使企业能够将智能体连接到他们的定制工具和API，避免为现有内部系统重新造轮子。结合与Jira和Salesforce等其他企业软件的集成，这允许智能体执行复杂的跨平台任务。

人工监督作为战略倍增器

随着企业从实验转向生产，企业AI领域目前正在经历现实检验。许多行业领导者的共识是，人机协作对于智能体可靠执行是实际必要的。

Mixus的协作模式改变了扩展AI的经济学。该公司预测，到2030年，智能体部署可能增长1000倍，每个人工监督员将变得更高效50倍，但对人工监督的总需求仍将增长。

"随着时间推移，每个人工监督员管理的AI工作呈指数级增长，但随着AI在组织中爆炸式部署，你仍然需要更多总体监督，"Katz说。

对于企业领导者来说，这意味着人类技能将演进而非消失。专家们不会被AI取代，而是被提升到协调AI智能体舰队并处理标记给他们审查的高风险决策的角色。

在这个框架中，建立强大的人工监督功能成为竞争优势，允许公司比竞争对手更积极、更安全地部署AI。

"掌握这种倍增效应的公司将主导其行业，而追求完全自动化的公司将在可靠性、合规性和信任方面苦苦挣扎，"Katz说。

来源：VentureBeat

0赞

好文章，需要你的鼓励

AI智能体遭遇责任壁垒，Mixus推出人工监督解决方案

来源：VentureBeat

2025

06/30

08:10

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

量子计算、摩尔定律与AI的未来发展

人工智能投资激增正在重塑网络安全格局

我们如何测试AI

云服务商如何吞噬你的AI利润：推理陷阱解析

企业AI战略为何需要开源与闭源模型并举：TCO现实考量

OpenAI收购电商AI推荐创业公司Crossing Minds全体员工

IT部门面临的十大挑战与应对策略

CIO放弃散弹枪式做法，采用更具战略性的AI试点

CISO如何成为3090亿美元AI基础设施支出的守门人

企业智能体扩展面临的隐形挑战与解决方案

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会