更便宜、更快速、更懂本土文化:Avataar AI视频模型专为印度规模化场景而生

印度初创公司Avataar AI在印度AI使命计划支持下,推出视频生成模型Varya。该模型基于阿里巴巴开源模型Wan 2.2进行蒸馏优化,生成速度提升10倍,仅需4步完成推理。在NVIDIA H200上生成5秒720p视频仅需45秒,定价约0.005美元/秒,远低于Veo、Kling等竞品。Varya还针对印度本土文化进行专项训练,能识别节日、服饰、美食等元素,已作为开放权重模型发布。

与美国、欧洲和中国相比,印度的AI模型产出一直相对滞后。目前仅有少数初创企业在发布模型,且大多集中在大语言模型或语音模型领域。为推动更多创新,印度政府启动了"印度AI使命"计划,这是一项规模约12亿美元的举措,核心内容之一是为入选的初创企业提供补贴算力资源,条件是企业须将其模型公开发布。Avataar AI是12家入选企业之一,近日推出了一款名为Varya的视频模型,该模型专为理解本地语境而设计,能够识别不同节日、食物及服饰等文化元素。

Avataar AI由知名投资机构Peak XV支持,专注于为电商场景提供视频创作工具。Varya并非从零构建,而是以阿里巴巴公开发布的视频生成模型Wan 2.2为基础,通过"知识蒸馏"技术——即将模型能力压缩为更精简、更快速的版本——针对Avataar的具体使用场景进行优化。最终成果是一个仅需四步即可完成推理的模型,而Wan 2.2需要50步,Varya的生成速度提升了10倍,成本也大幅降低。

以具体数据为例:使用NVIDIA H200 GPU时,Varya生成一段5秒720p视频仅需45秒,而Wan 2.2则需要1230秒。

Varya最引人注目的或许是其定价。该公司计划在托管服务上以每秒0.48印度卢比(约合0.005美元)的价格提供服务,远低于Veo、Kling、Luma、Runway等模型通常每秒0.10美元以上的收费标准,价格差距约达20倍。

"印度是一个视频优先的市场。纵观印度所有头部消费互联网产品,视频的表现始终优于文字。当前的AI视频模型对于印度规模化应用而言成本过高。如果视频AI要真正触达学生、教师、中小微企业、创作者、企业及公共服务,成本必须大幅下降。成本是推动AI在印度普及的最关键突破口。"Peak XV董事总经理Rajan Anandan在接受TechCrunch采访时表示。

图像和视频生成模型往往忽视文化细节,输出结果容易流于刻板印象或过于泛化——这一问题此前TechCrunch已有报道。Avataar AI表示,已通过精心筛选的数据对Varya进行训练,使其能够识别包括食物、服饰、建筑和节日在内的文化细节。

Varya将作为开放权重模型发布于印度政府搭建的AI Kosh平台——这是印度政府集中托管公开AI模型与数据集的统一平台——同时附带训练数据,开发者可自行部署或按需修改。Avataar还计划向企业客户开放该模型,并表示欢迎与Higgsfield、Adobe Firefly等视频工具展开合作。目前任何人均可通过官网,使用文字提示或参考图像进行体验。

Varya的发布折射出印度AI雄心背后的深层取舍。业界资深人士指出,印度在AI领域的优势路径在于打造应用产品与完善的开发者生态,而非与他国在基础模型层面正面竞争。这一务实选择背后有其现实原因:受限于算力不足与高质量数据匮乏,印度的模型研发进展明显慢于全球竞争对手。

"印度AI使命"也是政府弥合这一差距的更宏观战略布局的组成部分。去年,该计划遴选了包括Avataar AI在内的12家初创企业开展AI模型研发,并为其提供低成本算力支持。今年早些时候,印度信息技术部长Ashwini Vaishnaw表示,印度的目标是到2028年吸引2000亿美元的AI投资,并在六个月内将GPU算力容量翻倍以上。

Q&A

Q1:Varya视频模型是怎么做到比其他模型便宜这么多的?

A:Varya并非从头训练,而是基于阿里巴巴开源的Wan 2.2模型,通过知识蒸馏技术进行压缩和优化,将推理步骤从50步缩减至4步,生成速度提升10倍,成本大幅降低。托管服务定价为每秒0.48印度卢比(约0.005美元),而Veo、Runway等模型通常每秒收费0.10美元以上,价格差距约20倍。

Q2:Varya是如何处理印度本土文化识别的?

A:Avataar AI通过精心筛选的本土数据对Varya进行专项训练,使模型能够识别印度特有的文化元素,包括本地节日、传统服饰、特色食物和建筑风格等,从而避免通用视频生成模型常见的文化失真或刻板化输出问题。

Q3:Varya模型是否对外开放,普通开发者能用吗?

A:可以。Varya将作为开放权重模型发布在印度政府的AI Kosh平台上,并附带训练数据,开发者可以自行部署或二次修改。目前任何人都可以在Avataar官网通过文字提示或参考图像直接体验该模型。

来源:TechCrunch - AI

0赞

好文章,需要你的鼓励

2026

06/15

16:12

分享

点赞

邮件订阅