生成式视频领域的先驱Runway刚刚发布了其最新AI模型Runway Aleph,旨在重新定义人们创建和编辑视频内容的方式。
Aleph基于Runway在通用世界模型和仿真模型方面的研究成果,为用户提供了一个对话式AI工具,能够对视频素材(无论是生成的还是现有的)进行即时复杂编辑。例如,想要从镜头中移除一辆汽车?更换背景?重新设计整个场景?据Runway介绍,Aleph让用户只需通过简单的提示词就能实现这些功能。
与以往主要专注于文本生成视频的模型不同,Aleph强调"流畅编辑"功能。它可以添加或删除物体、调整动作、改变光照,并在帧间保持连续性,而这些正是历来困扰AI视频工具的挑战。该公司表示,Aleph的局部和全局编辑能力能够保持场景、角色和环境的一致性,让创作者无需修复逐帧故障。
"Runway Aleph不仅仅是一个新模型——它代表了对视频的全新思考方式,"Runway在其发布公告中写道。
此次发布正值AI视频创作领域竞争白热化之际。OpenAI、谷歌、微软和Meta等科技巨头今年都展示了各自的AI视频模型。但Runway作为通过其早期Gen-1和Gen-2模型推广AI视频的公司,声称Aleph通过结合高保真生成和实时对话式编辑将技术推向了新高度——这对希望加快工作流程的电影制作人、工作室和广告商来说可能意义重大。
Runway表示,Aleph已经被主要电影工作室、广告代理商、建筑公司、游戏公司和电商团队使用。该公司目前正在向企业客户和创意合作伙伴提供早期访问权限,更广泛的可用性将在未来几天内推出。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
JETSPEC是由UC San Diego等机构联合提出的推测解码框架,通过树形因果掩码让草稿头在一次前向传播中生成分支一致的候选树,在MATH-500上实现最高9.64倍端到端加速。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
本文介绍了中国科学院自动化所的研究,揭示了大型语言模型在多轮工具调用强化学习中崩溃的根本原因,并系统评估了五种监督信号对训练稳定性和泛化能力的影响。