尽管企业对AI准确性、可靠性和可信度仍存担忧,亚马逊相信,只要让普通员工更容易构建智能体,他们很快就能自动化工作中的乏味部分。
周四,这家贝佐斯创建的公司发布了名为Quick Suite的新软件平台,旨在简化AI智能体和企业聊天机器人的创建。这些智能体能够从各种内外部数据源检索信息、可视化数据、生成报告并自动化日常任务。
该产品让人联想到许多智能体AI工作流平台,如Google Gemini Enterprise(最近从AgentSpace重新品牌化)和n8n,提供类似无代码的环境来连接内部文档、维基、论坛、内网和其他数据源,同时利用它们创建能够执行邮件摘要、发送消息或更新Jira工单等任务的智能体。
发布时,该软件套件支持50个流行的企业平台,如Office 365、Slack和SalesForce。亚马逊表示,用户可以通过使用MCP服务器来扩展Quick Suite的功能,这是我们今年早些时候深入研究的技术。
然而,AWS不仅仅是制作了另一个拖拽式智能体构建器。这家电商巨头还使用生成式AI模型来帮助用户在几分钟内规划和创建利用大语言模型等工具的自动化工作流。
例如,亚马逊的Quick Flows设计用于自动化日常任务,允许用户解释他们想要完成的任务以及期望的结果应该是什么样子。与此同时,亚马逊的Quick Automate概念类似,但设计用于支持更复杂的项目。
该套件的许多其他组件对于使用过OpenAI的ChatGPT或Anthropic的Claude等流行聊天机器人服务的用户来说都很熟悉。
其中较为熟悉的功能之一是亚马逊的Quick Research工具,据我们了解,它的工作原理就像OpenAI的Deep Research,但可以定制为除了网络之外,还能从企业平台和数据库中获取数据。
Quick还包括数据可视化功能,亚马逊表示该功能从各种数据源提取信息,然后代表用户制作图表和分析。这与Anthropic在其Artifacts功能中所做的类似。
构建AI智能体从未如此简单,但我能信任它们吗
亚马逊的最新平台可能为希望利用AI自动化低价值任务、简化操作和/或缩减员工队伍的企业降低了准入门槛,但挑战仍然存在,特别是在信任和安全领域。
卡内基梅隆大学和Salesforce今年夏天早些时候发布的研究发现,AI智能体在办公任务中的错误率大约为70%。
为了激发对Quick Suite的信心,亚马逊员工显然一直在内部测试其各种功能。例如,这家电商巨头正在使用Quick Automate来核对数千张发票并交叉引用内部数据,以预测现金流并进行根本原因分析。
亚马逊副总法律顾问Jessica Gibson显然正在使用Quick Research来帮助这家电商的法务、公共政策和合规部门调查监管变化对各地区的影响等事项。
亚马逊可能愿意承担AI智能体产生幻觉数据并启发某人相应行动的风险——但许多企业并不愿意。虽然AI智能体的成功率无疑会随着时间的推移而提高,随着企业对其能力更有信心,意外后果的可能性也会增加。
Gartner最近一份报告调查的企业中,大约四分之三表示他们正在以某种形式试点或部署AI智能体。然而,很少有智能体被允许自主运行,原因显而易见。
即使不允许生成式AI为自己做决定,幻觉的风险仍然是一个持续的担忧,今年早些时候一名律师被发现使用ChatGPT后它产生了一系列不存在的法律案例的高度公开丑闻使情况变得更糟。
尽管如此,Gartner仍然看到价值,预测到2028年,大约15%的日常工作决策将由AI智能体做出。
Q&A
Q1:亚马逊Quick Suite是什么?它有什么功能?
A:Quick Suite是亚马逊推出的软件平台,旨在简化AI智能体和企业聊天机器人的创建。它能够从内外部数据源检索信息、可视化数据、生成报告并自动化日常任务,支持50个流行企业平台如Office 365、Slack和SalesForce。
Q2:AI智能体在企业办公任务中的准确率如何?
A:根据卡内基梅隆大学和Salesforce的研究,AI智能体在办公任务中的错误率大约为70%。这是企业在部署AI智能体时面临的主要挑战之一,也是为什么很少有智能体被允许完全自主运行的原因。
Q3:Quick Suite包含哪些主要工具?
A:Quick Suite包含多个工具:Quick Flows用于自动化日常任务,Quick Automate支持更复杂项目,Quick Research类似OpenAI的Deep Research但可从企业平台获取数据,还有数据可视化功能用于提取信息并制作图表分析。
好文章,需要你的鼓励
研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。