"这确实是消费者首次能够自然地看到和使用的大规模生成式 AI 实践应用," Amazon CEO Andy Jassy 表示。
即将推出的配套设备只是 Jassy 认为 Alexa 自身"可持续"商业模式的一部分。
"我们有机会在各种界面提供新产品和广告服务,比如即将在 Alexa 中推出的移动端和桌面端界面,此外还有订阅服务," Jassy 说道。
作为 Amazon 对标 Google Gemini 的产品,Alexa Plus 将于下月开始在部分 Amazon 设备上推出。对于 Amazon Prime 会员来说,该服务是免费的,非 Prime 用户则需支付每月 19.99 美元。
通过 Alexa Plus 以及公司在云计算部门 Amazon Web Services 中对生成式 AI 能力的持续投入,Amazon 正全力押注 AI 技术。
"我们正在投入相当可观的资本支出,其中大部分用于生成式 AI," Jassy 表示。
去年,当前员工向《财富》杂志透露公司在将现有 Alexa 技术与生成式 AI 融合方面遇到困难时,Alexa Plus 产品曾引发投资者担忧。当时,Amazon 声称这些员工的说法是错误的。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。