游戏开发者和艺术家正在构建电影级世界和标志性角色,为NVIDIA RTX AI PC上的沉浸式体验提升标准。
在本周旧金山举行的游戏开发者大会(GDC)上,NVIDIA宣布了一系列更新,旨在为RTX GPU和NVIDIA DGX Spark桌面超级计算机上的概念开发和故事版制作简化AI视频生成流程。
这些公告包括:
ComfyUI推出全新App View简化界面,降低这一热门生成式AI工具的使用门槛。
RTX Video Super Resolution功能现已支持ComfyUI,这是一个实时4K升频器,专为视频生成而设计,同时也为开发者提供Python Wheel版本。
NVFP4和FP8模型变体现已支持FLUX.2 Klein,LTX-2.3的NVFP4支持即将推出,两个模型的性能提升高达2.5倍,内存使用量减少60%。
简化界面降低使用门槛
当今许多热门AI应用正让初学者更容易在笔记本电脑或台式机上直接尝试最先进的模型。
对于不熟悉节点图的艺术家,ComfyUI的新App View以简化界面呈现工作流程。用户只需输入提示词,调整简单参数并点击生成即可。完整的节点体验仍可通过Node View使用,用户可以在两种模式之间无缝切换。
App View与ComfyUI中的RTX优化兼容。自9月以来,RTX GPU的性能提升了40%,ComfyUI现在原生支持NVFP4和FP8数据格式。综合来看,在NVIDIA GeForce RTX 50系列GPU的NVFP4格式下,性能提升2.5倍,显存减少60%;使用FP8时,性能提升1.7倍,显存减少40%。
在1月的CES大会上,NVIDIA宣布了几个支持NVFP4和FP8的模型。现在更多NVFP4和FP8模型已可用——LTX-2.3(NVFP4支持即将推出)、FLUX.2 Klein 4B和FLUX.2 Klein 9B——直接在ComfyUI中使用。用户可从Hugging Face直接下载NVFP4和FP8检查点,通过Template Browser在ComfyUI中加载默认工作流程,并用新下载的检查点替换默认模型检查点。
App View模式现已推出。
实时4K升频技术突破
获得高质量视频输出通常意味着在速度、显存和控制之间取得平衡。虽然大多数艺术家最终希望获得4K质量,但他们更愿意先生成更小、更快的预览,然后进行升频。目前的升频器需要几分钟才能将10秒的片段升频到4K分辨率。
现在,用户可以使用NVIDIA RTX Video Super Resolution快速将生成的视频升频到4K,该功能作为ComfyUI的节点提供。RTX Video可作为独立节点访问,用于从头构建视频工作流程。
对于AI开发者,NVIDIA发布了一个免费的Python包,可通过PyPI存储库获取,同时提供GitHub上的示例代码和VFX Python绑定指南,帮助快速入门。该包提供对支持RTX Video的相同AI升频技术的编程访问,直接在RTX GPU Tensor Core上运行,4K升频速度比其他热门本地升频器快30倍,显存成本仅为其一小部分。该包由NVIDIA视频效果软件开发套件提供支持。
Q&A
Q1:ComfyUI的App View有什么新特性?
A:ComfyUI的App View是一个全新的简化界面,专为不熟悉节点图的艺术家设计。用户只需输入提示词、调整简单参数并点击生成即可使用,大大降低了这一生成式AI工具的使用门槛。同时用户仍可通过Node View使用完整的节点体验,并可在两种模式间无缝切换。
Q2:NVFP4和FP8格式能带来多大的性能提升?
A:使用NVIDIA GeForce RTX 50系列GPU的NVFP4格式,性能可提升2.5倍,显存使用量减少60%。而使用FP8格式时,性能提升1.7倍,显存减少40%。这些优化让AI视频生成更加高效,特别适合游戏开发者和内容创作者使用。
Q3:RTX Video Super Resolution相比其他升频器有什么优势?
A:RTX Video Super Resolution是专为ComfyUI设计的实时4K升频器,运行在RTX GPU Tensor Core上,升频速度比其他热门本地升频器快30倍,显存成本仅为其一小部分。它可以快速将生成的视频升频到4K质量,大大提高了工作效率。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。