前 Snap 公司高管 Alex Mashrabov 推出了新的生成式视频平台 Higgsfield AI,该平台专注于在 AI 视频中实现电影级的摄像机运动效果。Mashrabov 此前曾负责领导 Snap 的生成式 AI 项目。他表示,Higgsfield 的灵感来源于他们早期开发的病毒式应用 Diffuse,该应用让用户能够创建个性化的 AI 短片。尽管 Diffuse 很受欢迎,但也暴露出短视频、搞笑内容在创意和技术上的局限性。因此,Mashrabov 的团队将重心转向了 AI 生成的叙事内容,特别是面向 TikTok 和 YouTube Shorts 等平台的系列短剧,这一领域预计到 2032 年将增长至 240 亿美元。
"我们不断听到创作者反馈同样的问题:AI 视频虽然看起来更好了,但缺少电影感," Mashrabov 说,"摄像机背后缺乏创作意图。" Higgsfield 的解决方案是一个全新的控制引擎,用户只需提供一张图片和简单的文字提示,就能指导复杂的摄像机运动效果,比如推轨、快速变焦、空中俯拍和机身固定装置等。据该公司介绍,这些预设效果模仿了通常需要专业设备和经验丰富的团队才能实现的拍摄技巧,让个人创作者和小型工作室也能掌握电影级的视觉语言。
该平台还解决了生成式视频中长期存在的问题,包括角色和场景在较长序列中的一致性。"我们不仅解决了风格问题,还解决了结构问题," Higgsfield 首席研究官 Yerzat Dulat 表示。
以《Take This Lollipop》闻名,并曾为 Intel 和 Lexus 创作品牌体验的电影制作人和创意技术专家 Jason Zada,制作了一个名为《Night Out》的演示视频。这个视频完全通过 Higgsfield 的界面生成,展示了独特的霓虹视觉效果和快速流畅的摄像机运动。
"像 Snorricam 这样传统上需要复杂装备和编排的工具,现在只需点击一下就能实现," Zada 说。"这些镜头向来都很难拍摄,而现在能作为预设使用,开启了一个全新的视觉叙事层面,既自由又富有启发性。Higgsfield 让创作者能在生成式作品中实现流畅、风格化的摄像机运动。这解锁了此前无法企及的全新视觉表现力。"
该平台还得到了奥斯卡获奖视觉效果艺术家 John Gaeta 的赞赏。作为《黑客帝国》的视效创作者和沉浸式与 AI 驱动媒体的长期开拓者,Gaeta 表示:"虚拟摄影的未来没有限制。这让我们更接近拥有'上帝视角'——对摄像机和场景的完全创意控制。"
当 Runway、Pika Labs 和 OpenAI 等公司继续推进视觉保真度的提升时,Higgsfield 通过专注于电影语法——即通过运动和视角而不仅仅是像素来讲述故事的方式,开辟了一个独特的市场领域。
专业创作者现在可以在 www.higgsfield.ai 申请早期访问权限。虽然 Higgsfield 能否在竞争激烈的市场中脱颖而出还有待观察,但其对摄影语言的重视表明生成式视频已经进入了一个新阶段。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。