前 Snap 公司高管 Alex Mashrabov 推出了新的生成式视频平台 Higgsfield AI,该平台专注于在 AI 视频中实现电影级的摄像机运动效果。Mashrabov 此前曾负责领导 Snap 的生成式 AI 项目。他表示,Higgsfield 的灵感来源于他们早期开发的病毒式应用 Diffuse,该应用让用户能够创建个性化的 AI 短片。尽管 Diffuse 很受欢迎,但也暴露出短视频、搞笑内容在创意和技术上的局限性。因此,Mashrabov 的团队将重心转向了 AI 生成的叙事内容,特别是面向 TikTok 和 YouTube Shorts 等平台的系列短剧,这一领域预计到 2032 年将增长至 240 亿美元。
"我们不断听到创作者反馈同样的问题:AI 视频虽然看起来更好了,但缺少电影感," Mashrabov 说,"摄像机背后缺乏创作意图。" Higgsfield 的解决方案是一个全新的控制引擎,用户只需提供一张图片和简单的文字提示,就能指导复杂的摄像机运动效果,比如推轨、快速变焦、空中俯拍和机身固定装置等。据该公司介绍,这些预设效果模仿了通常需要专业设备和经验丰富的团队才能实现的拍摄技巧,让个人创作者和小型工作室也能掌握电影级的视觉语言。
该平台还解决了生成式视频中长期存在的问题,包括角色和场景在较长序列中的一致性。"我们不仅解决了风格问题,还解决了结构问题," Higgsfield 首席研究官 Yerzat Dulat 表示。
以《Take This Lollipop》闻名,并曾为 Intel 和 Lexus 创作品牌体验的电影制作人和创意技术专家 Jason Zada,制作了一个名为《Night Out》的演示视频。这个视频完全通过 Higgsfield 的界面生成,展示了独特的霓虹视觉效果和快速流畅的摄像机运动。
"像 Snorricam 这样传统上需要复杂装备和编排的工具,现在只需点击一下就能实现," Zada 说。"这些镜头向来都很难拍摄,而现在能作为预设使用,开启了一个全新的视觉叙事层面,既自由又富有启发性。Higgsfield 让创作者能在生成式作品中实现流畅、风格化的摄像机运动。这解锁了此前无法企及的全新视觉表现力。"
该平台还得到了奥斯卡获奖视觉效果艺术家 John Gaeta 的赞赏。作为《黑客帝国》的视效创作者和沉浸式与 AI 驱动媒体的长期开拓者,Gaeta 表示:"虚拟摄影的未来没有限制。这让我们更接近拥有'上帝视角'——对摄像机和场景的完全创意控制。"
当 Runway、Pika Labs 和 OpenAI 等公司继续推进视觉保真度的提升时,Higgsfield 通过专注于电影语法——即通过运动和视角而不仅仅是像素来讲述故事的方式,开辟了一个独特的市场领域。
专业创作者现在可以在 www.higgsfield.ai 申请早期访问权限。虽然 Higgsfield 能否在竞争激烈的市场中脱颖而出还有待观察,但其对摄影语言的重视表明生成式视频已经进入了一个新阶段。
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。