Amazon 已推出一款名为 Nova Act 的新型 AI 模型,旨在帮助用户在浏览器中完成网上购物等任务。目前该模型仅向开发者提供"研究预览"版本。同时,Amazon 正通过网络门户扩大其他 Nova AI 模型的使用范围,使这些模型更易于查找和使用。
Nova Act 是一款新型模型,其功能与 OpenAI 的 Operator 代理类似。据 Amazon 称,Act 可以执行网络搜索、进行购物或回答屏幕上的问题,还可以按计划执行任务。它能够识别更详细的指令——比如在购物时告诉它"不要接受保险追加销售"。目前 Act 仅对开发者开放,但 Amazon 表示它已在升级版的 Alexa Plus 助手中被用于执行某些在线任务。
Act 是 Amazon 人工通用智能 (AGI) 实验室推出的首个产品。该实验室表示,他们的"梦想"是让 AI 代理能够"执行广泛、复杂、多步骤的任务,如组织婚礼或处理复杂的 IT 任务以提高业务生产力"。除了 Amazon 和 OpenAI,现在还有许多公司都在追逐 AI 代理技术,他们希望用户愿意为能够执行实际任务(而不仅仅是回答问题或生成吉卜力风格的艺术作品)的 AI 助手付费。
Act 加入了 2024 年 12 月首次公布的其他五个 Nova 模型,包括三个"理解"模型以及图像和视频生成器。Amazon 并未宣称提供最强大的 AI 模型,而是强调了 Nova 系列的速度和价值,称其"至少比同类竞品便宜 75%"。
Amazon 现在为美国的开发者和其他用户提供了一个更直接访问这些模型的方式:一个允许用户使用模型来回答查询或生成内容的网站。这些模型此前只能通过 Amazon Bedrock(Amazon Web Services 中的一个 AI 模型平台)访问,该平台除了提供 Nova 外,还提供来自 DeepSeek、Anthropic、Meta 等第三方的模型。Amazon AGI 高级副总裁 Rohit Prasad 表示,该网站旨在让开发者"能够快速测试他们的 Nova 模型想法,然后在 Amazon Bedrock 中大规模实施"。
好文章,需要你的鼓励
Meta联合滑铁卢大学开发的MoCha系统实现重大突破,仅需语音和文字描述就能生成电影级会说话的虚拟角色视频。该技术突破传统局限,无需参考图片等辅助条件,还能实现多角色对话场景,在唇音同步、表情自然度等方面显著超越现有方法,为内容创作、教育、娱乐等领域带来革命性变化。
联合健康集团首席数字与技术官Sandeep Dadlani正领导着医疗行业最雄心勃勃的数字化转型之一。作为年收入近3000亿美元的巨头企业,该公司通过United AI Studio平台大规模部署AI解决方案,每年处理1亿通客服电话。Dadlani强调"速度是最大的知识产权",通过数字优先策略服务5500万用户,利用AI技术帮助临床医生专注于护理而非行政工作,推动医疗系统效率提升。
阿联酋和中国研究团队联合开发prima.cpp系统,成功实现70B大模型在普通家庭设备集群上运行。该系统通过创新的管道环形并行技术和Halda调度算法,将响应速度提升15倍至600毫秒,内存压力控制在6%以下,为AI技术民主化提供了新路径。