前 Snap 公司高管 Alex Mashrabov 推出了新的生成式视频平台 Higgsfield AI,该平台专注于在 AI 视频中实现电影级的摄像机运动效果。Mashrabov 此前曾负责领导 Snap 的生成式 AI 项目。他表示,Higgsfield 的灵感来源于他们早期开发的病毒式应用 Diffuse,该应用让用户能够创建个性化的 AI 短片。尽管 Diffuse 很受欢迎,但也暴露出短视频、搞笑内容在创意和技术上的局限性。因此,Mashrabov 的团队将重心转向了 AI 生成的叙事内容,特别是面向 TikTok 和 YouTube Shorts 等平台的系列短剧,这一领域预计到 2032 年将增长至 240 亿美元。
"我们不断听到创作者反馈同样的问题:AI 视频虽然看起来更好了,但缺少电影感," Mashrabov 说,"摄像机背后缺乏创作意图。" Higgsfield 的解决方案是一个全新的控制引擎,用户只需提供一张图片和简单的文字提示,就能指导复杂的摄像机运动效果,比如推轨、快速变焦、空中俯拍和机身固定装置等。据该公司介绍,这些预设效果模仿了通常需要专业设备和经验丰富的团队才能实现的拍摄技巧,让个人创作者和小型工作室也能掌握电影级的视觉语言。
该平台还解决了生成式视频中长期存在的问题,包括角色和场景在较长序列中的一致性。"我们不仅解决了风格问题,还解决了结构问题," Higgsfield 首席研究官 Yerzat Dulat 表示。
以《Take This Lollipop》闻名,并曾为 Intel 和 Lexus 创作品牌体验的电影制作人和创意技术专家 Jason Zada,制作了一个名为《Night Out》的演示视频。这个视频完全通过 Higgsfield 的界面生成,展示了独特的霓虹视觉效果和快速流畅的摄像机运动。
"像 Snorricam 这样传统上需要复杂装备和编排的工具,现在只需点击一下就能实现," Zada 说。"这些镜头向来都很难拍摄,而现在能作为预设使用,开启了一个全新的视觉叙事层面,既自由又富有启发性。Higgsfield 让创作者能在生成式作品中实现流畅、风格化的摄像机运动。这解锁了此前无法企及的全新视觉表现力。"
该平台还得到了奥斯卡获奖视觉效果艺术家 John Gaeta 的赞赏。作为《黑客帝国》的视效创作者和沉浸式与 AI 驱动媒体的长期开拓者,Gaeta 表示:"虚拟摄影的未来没有限制。这让我们更接近拥有'上帝视角'——对摄像机和场景的完全创意控制。"
当 Runway、Pika Labs 和 OpenAI 等公司继续推进视觉保真度的提升时,Higgsfield 通过专注于电影语法——即通过运动和视角而不仅仅是像素来讲述故事的方式,开辟了一个独特的市场领域。
专业创作者现在可以在 www.higgsfield.ai 申请早期访问权限。虽然 Higgsfield 能否在竞争激烈的市场中脱颖而出还有待观察,但其对摄影语言的重视表明生成式视频已经进入了一个新阶段。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。