AI智能体仍需人类传授技能才能有效运作

最新研究表明，AI智能体需要特定的程序化知识技能才能良好执行任务，但无法自主学习这些技能。研究人员开发了SkillsBench基准测试，评估AI在医疗、制造、网络安全和软件工程等11个领域84项任务中的表现。测试显示，配备人工策划技能的智能体比无技能智能体平均得分高16.2个百分点，而自主生成技能的智能体性能无提升，证明AI仍需人类干预指导。

AI智能体需要技能——特定的程序性知识——才能良好地执行任务，但它们无法自我学习，一项新研究表明。

研究作者开发了一个新的基准测试工具SkillsBench，该工具在11个领域的84项任务上评估智能体AI的表现，包括医疗保健、制造业、网络安全和软件工程等领域。研究人员在三种条件下观察每项任务：无技能（智能体仅接收指令）、有策划技能（提供目录、代码片段和资源来帮助它）以及自生成技能（智能体没有技能但被提示开发它们）。

典型任务包括对npm依赖项进行安全审计以查找漏洞，或分析癌细胞系数据中的差异蛋白质表达。

最佳表现来自具有策划技能的智能体，其得分平均比无技能智能体高16.2个百分点，这表明AI目前还无法摆脱人类干预。即便如此，在84项任务中的16项任务里，人类指导对结果产生了负面影响。

不同行业领域的表现差异很大，策划技能在医疗保健任务中影响最大，但在软件工程方面影响很小。

被要求生成自己技能的智能体表现没有提升，显示AI仍然需要一些人类提示才能完成工作。

Q&A

Q1：SkillsBench是什么？它能做什么？

A：SkillsBench是研究人员开发的新基准测试工具，用于评估智能体AI在84项任务上的表现，涵盖医疗保健、制造业、网络安全和软件工程等11个领域。

Q2：AI智能体在哪种条件下表现最好？

A：具有策划技能的智能体表现最佳，其得分平均比无技能智能体高16.2个百分点，这表明人类提供的技能指导对AI表现至关重要。

Q3：AI智能体能否自己学会新技能？

A：研究显示不能。被要求生成自己技能的智能体表现没有任何提升，证明AI仍然需要人类的提示和指导才能有效完成工作。

来源：Computerworld

0赞

好文章，需要你的鼓励

AI智能体仍需人类传授技能才能有效运作

来源：Computerworld

2026

02/25

13:25

分享

点赞

特斯拉疑似删除FSD证据，卡特彼勒加速电动化布局，高压系统技术培训刻不容缓

智能体网络流量首超真人访问，"死亡互联网"理论引发新争议

Mentium Technologies Luna-R1 AI芯片入选ET-01星座任务，完成多星部署里程碑

汤道生×姚顺雨：腾讯AI下半场，拼的是“模型×产品”系统能力

AI驱动网络犯罪数量飙升，勒索软件受害者年增389%：Fortinet 发布2026年全球威胁态势研究报告

Inbolt将在Automate展会发布视觉驱动机器人编程新功能

笔记本电脑深度清洁指南：内外兼修焕然一新

加利福尼亚州城市通过全美首个由选民投票决定的数据中心禁令

柴油替代方案：AI数据中心如何利用燃气引擎与蒸汽涡轮供电

AI定义汽车时代，车载以太网可靠性面临全新挑战

安全算法的持续更新正变得愈发困难

轨道数据中心本质上是功能强化的卫星

Anthropic揭露Claude遭遇大规模AI模型蒸馏攻击

OpenAI COO：AI尚未真正渗透企业业务流程

Meta签署千亿美元AMD芯片订单，加速"个人超级智能"布局

红帽推出金属到智能体AI基础设施堆栈，专为混合云部署优化

HPE扩展AI原生网络与计算产品组合服务提供商

英杰华提前预告CIO退休安排 新任首席信息官将引领数字化转型

智能体金融AI的部署策略与投资回报优化

Basware推出智能体技术实现发票处理全自动化

AWS为Kiro增加设计优先和错误修复工作流程

Google发布Gemini 3.1 Pro：复杂问题求解能力大幅提升

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

英杰华提前预告CIO退休安排新任首席信息官将引领数字化转型