"这确实是消费者首次能够自然地看到和使用的大规模生成式 AI 实践应用," Amazon CEO Andy Jassy 表示。
即将推出的配套设备只是 Jassy 认为 Alexa 自身"可持续"商业模式的一部分。
"我们有机会在各种界面提供新产品和广告服务,比如即将在 Alexa 中推出的移动端和桌面端界面,此外还有订阅服务," Jassy 说道。
作为 Amazon 对标 Google Gemini 的产品,Alexa Plus 将于下月开始在部分 Amazon 设备上推出。对于 Amazon Prime 会员来说,该服务是免费的,非 Prime 用户则需支付每月 19.99 美元。
通过 Alexa Plus 以及公司在云计算部门 Amazon Web Services 中对生成式 AI 能力的持续投入,Amazon 正全力押注 AI 技术。
"我们正在投入相当可观的资本支出,其中大部分用于生成式 AI," Jassy 表示。
去年,当前员工向《财富》杂志透露公司在将现有 Alexa 技术与生成式 AI 融合方面遇到困难时,Alexa Plus 产品曾引发投资者担忧。当时,Amazon 声称这些员工的说法是错误的。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。