与美国、欧洲和中国相比,印度的AI模型产出一直相对滞后。目前仅有少数初创企业在发布模型,且大多集中在大语言模型或语音模型领域。为推动更多创新,印度政府启动了"印度AI使命"计划,这是一项规模约12亿美元的举措,核心内容之一是为入选的初创企业提供补贴算力资源,条件是企业须将其模型公开发布。Avataar AI是12家入选企业之一,近日推出了一款名为Varya的视频模型,该模型专为理解本地语境而设计,能够识别不同节日、食物及服饰等文化元素。
Avataar AI由知名投资机构Peak XV支持,专注于为电商场景提供视频创作工具。Varya并非从零构建,而是以阿里巴巴公开发布的视频生成模型Wan 2.2为基础,通过"知识蒸馏"技术——即将模型能力压缩为更精简、更快速的版本——针对Avataar的具体使用场景进行优化。最终成果是一个仅需四步即可完成推理的模型,而Wan 2.2需要50步,Varya的生成速度提升了10倍,成本也大幅降低。
以具体数据为例:使用NVIDIA H200 GPU时,Varya生成一段5秒720p视频仅需45秒,而Wan 2.2则需要1230秒。
Varya最引人注目的或许是其定价。该公司计划在托管服务上以每秒0.48印度卢比(约合0.005美元)的价格提供服务,远低于Veo、Kling、Luma、Runway等模型通常每秒0.10美元以上的收费标准,价格差距约达20倍。
"印度是一个视频优先的市场。纵观印度所有头部消费互联网产品,视频的表现始终优于文字。当前的AI视频模型对于印度规模化应用而言成本过高。如果视频AI要真正触达学生、教师、中小微企业、创作者、企业及公共服务,成本必须大幅下降。成本是推动AI在印度普及的最关键突破口。"Peak XV董事总经理Rajan Anandan在接受TechCrunch采访时表示。
图像和视频生成模型往往忽视文化细节,输出结果容易流于刻板印象或过于泛化——这一问题此前TechCrunch已有报道。Avataar AI表示,已通过精心筛选的数据对Varya进行训练,使其能够识别包括食物、服饰、建筑和节日在内的文化细节。
Varya将作为开放权重模型发布于印度政府搭建的AI Kosh平台——这是印度政府集中托管公开AI模型与数据集的统一平台——同时附带训练数据,开发者可自行部署或按需修改。Avataar还计划向企业客户开放该模型,并表示欢迎与Higgsfield、Adobe Firefly等视频工具展开合作。目前任何人均可通过官网,使用文字提示或参考图像进行体验。
Varya的发布折射出印度AI雄心背后的深层取舍。业界资深人士指出,印度在AI领域的优势路径在于打造应用产品与完善的开发者生态,而非与他国在基础模型层面正面竞争。这一务实选择背后有其现实原因:受限于算力不足与高质量数据匮乏,印度的模型研发进展明显慢于全球竞争对手。
"印度AI使命"也是政府弥合这一差距的更宏观战略布局的组成部分。去年,该计划遴选了包括Avataar AI在内的12家初创企业开展AI模型研发,并为其提供低成本算力支持。今年早些时候,印度信息技术部长Ashwini Vaishnaw表示,印度的目标是到2028年吸引2000亿美元的AI投资,并在六个月内将GPU算力容量翻倍以上。
Q&A
Q1:Varya视频模型是怎么做到比其他模型便宜这么多的?
A:Varya并非从头训练,而是基于阿里巴巴开源的Wan 2.2模型,通过知识蒸馏技术进行压缩和优化,将推理步骤从50步缩减至4步,生成速度提升10倍,成本大幅降低。托管服务定价为每秒0.48印度卢比(约0.005美元),而Veo、Runway等模型通常每秒收费0.10美元以上,价格差距约20倍。
Q2:Varya是如何处理印度本土文化识别的?
A:Avataar AI通过精心筛选的本土数据对Varya进行专项训练,使模型能够识别印度特有的文化元素,包括本地节日、传统服饰、特色食物和建筑风格等,从而避免通用视频生成模型常见的文化失真或刻板化输出问题。
Q3:Varya模型是否对外开放,普通开发者能用吗?
A:可以。Varya将作为开放权重模型发布在印度政府的AI Kosh平台上,并附带训练数据,开发者可以自行部署或二次修改。目前任何人都可以在Avataar官网通过文字提示或参考图像直接体验该模型。
好文章,需要你的鼓励
就在Insta360发布旗舰新品Luna Ultra相机的同一天,大疆DJI随即提起两项专利侵权诉讼,指控其抄袭Osmo Pocket系列核心技术。Insta360在24小时内迅速反击,同样提出两项诉讼,指控DJI侵犯其云台稳定、位置成像等专利。这场四起诉讼的法律战,折射出两家公司产品线不断交叉、争夺同一创作者市场的深层竞争现实。
香港理工大学提出"光学推理",将AI推理步骤渲染为图片代替文字,在五款顶级AI模型测试中平均节省28%令牌,效率近两倍。
谷歌母公司Alphabet CEO桑达尔·皮查伊在斯坦福大学2026届毕业典礼上发表演讲。他分享了三条人生建议:选择乐观主义,以"加州黄金视角"重构对世界的认知;勇于挑战难事,以Chrome浏览器从"四舍五入的误差"到全球主流浏览器的逆袭经历为例;以及在条件相当时,选择令自己兴奋的事情。他同时强调,人生中真正关键的抉择并不多,无需对每个时刻都施加过多压力。
卡内基梅隆大学等机构发现,16%的主流AI评测任务存在可被绕过的漏洞,并提出三智能体自动防御方案,将KernelBench攻击成功率从76%降至0%。