前 Snap 公司高管 Alex Mashrabov 推出了新的生成式视频平台 Higgsfield AI,该平台专注于在 AI 视频中实现电影级的摄像机运动效果。Mashrabov 此前曾负责领导 Snap 的生成式 AI 项目。他表示,Higgsfield 的灵感来源于他们早期开发的病毒式应用 Diffuse,该应用让用户能够创建个性化的 AI 短片。尽管 Diffuse 很受欢迎,但也暴露出短视频、搞笑内容在创意和技术上的局限性。因此,Mashrabov 的团队将重心转向了 AI 生成的叙事内容,特别是面向 TikTok 和 YouTube Shorts 等平台的系列短剧,这一领域预计到 2032 年将增长至 240 亿美元。
"我们不断听到创作者反馈同样的问题:AI 视频虽然看起来更好了,但缺少电影感," Mashrabov 说,"摄像机背后缺乏创作意图。" Higgsfield 的解决方案是一个全新的控制引擎,用户只需提供一张图片和简单的文字提示,就能指导复杂的摄像机运动效果,比如推轨、快速变焦、空中俯拍和机身固定装置等。据该公司介绍,这些预设效果模仿了通常需要专业设备和经验丰富的团队才能实现的拍摄技巧,让个人创作者和小型工作室也能掌握电影级的视觉语言。
该平台还解决了生成式视频中长期存在的问题,包括角色和场景在较长序列中的一致性。"我们不仅解决了风格问题,还解决了结构问题," Higgsfield 首席研究官 Yerzat Dulat 表示。
以《Take This Lollipop》闻名,并曾为 Intel 和 Lexus 创作品牌体验的电影制作人和创意技术专家 Jason Zada,制作了一个名为《Night Out》的演示视频。这个视频完全通过 Higgsfield 的界面生成,展示了独特的霓虹视觉效果和快速流畅的摄像机运动。
"像 Snorricam 这样传统上需要复杂装备和编排的工具,现在只需点击一下就能实现," Zada 说。"这些镜头向来都很难拍摄,而现在能作为预设使用,开启了一个全新的视觉叙事层面,既自由又富有启发性。Higgsfield 让创作者能在生成式作品中实现流畅、风格化的摄像机运动。这解锁了此前无法企及的全新视觉表现力。"
该平台还得到了奥斯卡获奖视觉效果艺术家 John Gaeta 的赞赏。作为《黑客帝国》的视效创作者和沉浸式与 AI 驱动媒体的长期开拓者,Gaeta 表示:"虚拟摄影的未来没有限制。这让我们更接近拥有'上帝视角'——对摄像机和场景的完全创意控制。"
当 Runway、Pika Labs 和 OpenAI 等公司继续推进视觉保真度的提升时,Higgsfield 通过专注于电影语法——即通过运动和视角而不仅仅是像素来讲述故事的方式,开辟了一个独特的市场领域。
专业创作者现在可以在 www.higgsfield.ai 申请早期访问权限。虽然 Higgsfield 能否在竞争激烈的市场中脱颖而出还有待观察,但其对摄影语言的重视表明生成式视频已经进入了一个新阶段。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。