生成式视频领域的先驱Runway刚刚发布了其最新AI模型Runway Aleph,旨在重新定义人们创建和编辑视频内容的方式。
Aleph基于Runway在通用世界模型和仿真模型方面的研究成果,为用户提供了一个对话式AI工具,能够对视频素材(无论是生成的还是现有的)进行即时复杂编辑。例如,想要从镜头中移除一辆汽车?更换背景?重新设计整个场景?据Runway介绍,Aleph让用户只需通过简单的提示词就能实现这些功能。
与以往主要专注于文本生成视频的模型不同,Aleph强调"流畅编辑"功能。它可以添加或删除物体、调整动作、改变光照,并在帧间保持连续性,而这些正是历来困扰AI视频工具的挑战。该公司表示,Aleph的局部和全局编辑能力能够保持场景、角色和环境的一致性,让创作者无需修复逐帧故障。
"Runway Aleph不仅仅是一个新模型——它代表了对视频的全新思考方式,"Runway在其发布公告中写道。
此次发布正值AI视频创作领域竞争白热化之际。OpenAI、谷歌、微软和Meta等科技巨头今年都展示了各自的AI视频模型。但Runway作为通过其早期Gen-1和Gen-2模型推广AI视频的公司,声称Aleph通过结合高保真生成和实时对话式编辑将技术推向了新高度——这对希望加快工作流程的电影制作人、工作室和广告商来说可能意义重大。
Runway表示,Aleph已经被主要电影工作室、广告代理商、建筑公司、游戏公司和电商团队使用。该公司目前正在向企业客户和创意合作伙伴提供早期访问权限,更广泛的可用性将在未来几天内推出。
好文章,需要你的鼓励
TechCrunch Disrupt 2025 AI舞台将汇聚塑造科技未来的领军人物,顶尖风投将揭示在快速变化的AI领域获得融资的关键。来自Apptronik、ElevenLabs、Hugging Face、Runway等创新企业的领导者将分享前沿洞见,探讨AI如何重塑创意过程、改变物理世界、变革国防安全和重新定义人际关系。10月27-29日,五大主题舞台将在旧金山呈现科技创新的未来图景。
西班牙研究团队提出了一种创新的AI自我纠错方法SSC,让人工智能学会识别和修正规则中的漏洞。当AI发现自己在钻空子获得高分时,它会反思规则的合理性并主动改进。实验显示这种方法将AI的"钻空子"行为从50-70%降低到3%以下,同时提升了回答质量。这项技术有望让AI从被动执行指令转变为能够质疑和改进指令的智能协作伙伴。
英超联赛与微软达成五年战略合作伙伴关系,推出AI驱动的Premier League Companion服务,为全球球迷提供个性化体验。该服务利用Azure OpenAI技术,整合30多个赛季的统计数据、30万篇文章和9000个视频,帮助球迷发现和了解更多内容。未来还将为Fantasy Premier League引入个人助理经理功能,并通过Azure AI优化比赛直播体验和赛后分析。
这篇文章详细解析了Long、Shelhamer和Darrell在2015年CVPR会议上发表的开创性研究"全卷积网络用于语义分割"。文章以通俗易懂的方式,将这项复杂的技术比作艺术家的绘画过程,解释了如何让计算机不仅识别图像中有什么物体,还能精确标出每个物体的位置和边界。研究团队通过将传统分类网络改造为全卷积形式,并巧妙运用上采样和跳跃连接技术,实现了高效准确的像素级图像理解。这一突破为自动驾驶、医学影像和增强现实等领域带来了革命性变化,奠定了现代计算机视觉的重要基础。