尽管企业对AI准确性、可靠性和可信度仍存担忧,亚马逊相信,只要让普通员工更容易构建智能体,他们很快就能自动化工作中的乏味部分。
周四,这家贝佐斯创建的公司发布了名为Quick Suite的新软件平台,旨在简化AI智能体和企业聊天机器人的创建。这些智能体能够从各种内外部数据源检索信息、可视化数据、生成报告并自动化日常任务。
该产品让人联想到许多智能体AI工作流平台,如Google Gemini Enterprise(最近从AgentSpace重新品牌化)和n8n,提供类似无代码的环境来连接内部文档、维基、论坛、内网和其他数据源,同时利用它们创建能够执行邮件摘要、发送消息或更新Jira工单等任务的智能体。
发布时,该软件套件支持50个流行的企业平台,如Office 365、Slack和SalesForce。亚马逊表示,用户可以通过使用MCP服务器来扩展Quick Suite的功能,这是我们今年早些时候深入研究的技术。
然而,AWS不仅仅是制作了另一个拖拽式智能体构建器。这家电商巨头还使用生成式AI模型来帮助用户在几分钟内规划和创建利用大语言模型等工具的自动化工作流。
例如,亚马逊的Quick Flows设计用于自动化日常任务,允许用户解释他们想要完成的任务以及期望的结果应该是什么样子。与此同时,亚马逊的Quick Automate概念类似,但设计用于支持更复杂的项目。
该套件的许多其他组件对于使用过OpenAI的ChatGPT或Anthropic的Claude等流行聊天机器人服务的用户来说都很熟悉。
其中较为熟悉的功能之一是亚马逊的Quick Research工具,据我们了解,它的工作原理就像OpenAI的Deep Research,但可以定制为除了网络之外,还能从企业平台和数据库中获取数据。
Quick还包括数据可视化功能,亚马逊表示该功能从各种数据源提取信息,然后代表用户制作图表和分析。这与Anthropic在其Artifacts功能中所做的类似。
构建AI智能体从未如此简单,但我能信任它们吗
亚马逊的最新平台可能为希望利用AI自动化低价值任务、简化操作和/或缩减员工队伍的企业降低了准入门槛,但挑战仍然存在,特别是在信任和安全领域。
卡内基梅隆大学和Salesforce今年夏天早些时候发布的研究发现,AI智能体在办公任务中的错误率大约为70%。
为了激发对Quick Suite的信心,亚马逊员工显然一直在内部测试其各种功能。例如,这家电商巨头正在使用Quick Automate来核对数千张发票并交叉引用内部数据,以预测现金流并进行根本原因分析。
亚马逊副总法律顾问Jessica Gibson显然正在使用Quick Research来帮助这家电商的法务、公共政策和合规部门调查监管变化对各地区的影响等事项。
亚马逊可能愿意承担AI智能体产生幻觉数据并启发某人相应行动的风险——但许多企业并不愿意。虽然AI智能体的成功率无疑会随着时间的推移而提高,随着企业对其能力更有信心,意外后果的可能性也会增加。
Gartner最近一份报告调查的企业中,大约四分之三表示他们正在以某种形式试点或部署AI智能体。然而,很少有智能体被允许自主运行,原因显而易见。
即使不允许生成式AI为自己做决定,幻觉的风险仍然是一个持续的担忧,今年早些时候一名律师被发现使用ChatGPT后它产生了一系列不存在的法律案例的高度公开丑闻使情况变得更糟。
尽管如此,Gartner仍然看到价值,预测到2028年,大约15%的日常工作决策将由AI智能体做出。
Q&A
Q1:亚马逊Quick Suite是什么?它有什么功能?
A:Quick Suite是亚马逊推出的软件平台,旨在简化AI智能体和企业聊天机器人的创建。它能够从内外部数据源检索信息、可视化数据、生成报告并自动化日常任务,支持50个流行企业平台如Office 365、Slack和SalesForce。
Q2:AI智能体在企业办公任务中的准确率如何?
A:根据卡内基梅隆大学和Salesforce的研究,AI智能体在办公任务中的错误率大约为70%。这是企业在部署AI智能体时面临的主要挑战之一,也是为什么很少有智能体被允许完全自主运行的原因。
Q3:Quick Suite包含哪些主要工具?
A:Quick Suite包含多个工具:Quick Flows用于自动化日常任务,Quick Automate支持更复杂项目,Quick Research类似OpenAI的Deep Research但可从企业平台获取数据,还有数据可视化功能用于提取信息并制作图表分析。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。