生成式视频领域的先驱Runway刚刚发布了其最新AI模型Runway Aleph,旨在重新定义人们创建和编辑视频内容的方式。
Aleph基于Runway在通用世界模型和仿真模型方面的研究成果,为用户提供了一个对话式AI工具,能够对视频素材(无论是生成的还是现有的)进行即时复杂编辑。例如,想要从镜头中移除一辆汽车?更换背景?重新设计整个场景?据Runway介绍,Aleph让用户只需通过简单的提示词就能实现这些功能。
与以往主要专注于文本生成视频的模型不同,Aleph强调"流畅编辑"功能。它可以添加或删除物体、调整动作、改变光照,并在帧间保持连续性,而这些正是历来困扰AI视频工具的挑战。该公司表示,Aleph的局部和全局编辑能力能够保持场景、角色和环境的一致性,让创作者无需修复逐帧故障。
"Runway Aleph不仅仅是一个新模型——它代表了对视频的全新思考方式,"Runway在其发布公告中写道。
此次发布正值AI视频创作领域竞争白热化之际。OpenAI、谷歌、微软和Meta等科技巨头今年都展示了各自的AI视频模型。但Runway作为通过其早期Gen-1和Gen-2模型推广AI视频的公司,声称Aleph通过结合高保真生成和实时对话式编辑将技术推向了新高度——这对希望加快工作流程的电影制作人、工作室和广告商来说可能意义重大。
Runway表示,Aleph已经被主要电影工作室、广告代理商、建筑公司、游戏公司和电商团队使用。该公司目前正在向企业客户和创意合作伙伴提供早期访问权限,更广泛的可用性将在未来几天内推出。
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。