印度视频AI模型Varya实现20倍成本优势

印度AI初创公司Avataar AI近日发布了名为Varya的视频生成模型，该模型专为印度市场设计，在成本、速度和文化适应性方面展现出显著优势。作为印度AI使命（India AI Mission）资助的12家初创公司之一，Avataar AI获得了政府补贴的GPU算力支持，并承诺将模型开源。

Varya并非从零开始构建，而是基于阿里巴巴开源的Wan 2.2模型进行蒸馏优化。蒸馏技术将大型模型的复杂能力压缩至更轻量、更快速的版本，使Varya仅需4步即可完成视频生成，而Wan 2.2需要50步。这一改进使Varya的生成速度提升了10倍，同时大幅降低了计算成本。具体而言，在NVIDIA H200 GPU上，Varya生成一段5秒的720p视频仅需45秒，而Wan 2.2需要1230秒。

最引人注目的是Varya的定价策略。该公司计划对其托管服务收取每秒钟视频0.48印度卢比（约0.005美元），远低于Veo、Kling、Luma和Runway等模型通常每秒钟0.10美元以上的价格，价格差距约达20倍。Peak XV的董事总经理Rajan Anandan表示：“印度是一个视频优先的市场。当前AI视频模型对于印度的人口规模使用来说过于昂贵。如果视频AI要惠及学生、教师、中小微企业、创作者、企业和公共服务，成本必须大幅下降。成本是印度AI采用的最大解锁因素。”

Varya在文化适应性方面也进行了专门优化。图像和视频生成模型常常忽略文化细微差异，产生刻板或通用的输出。Avataar AI表示，他们使用精心策划的数据训练Varya识别文化细微差异，包括食物、服装、建筑和节日。这使得Varya能够更准确地生成符合印度本地语境的内容，例如识别不同的节日、食物和服装。

Varya将作为开放权重模型发布在印度政府的AI Kosh门户上，该门户是印度政府用于公开AI模型和数据集的集中存储库。开发者可以自行托管或根据自身需求修改模型。Avataar还计划向企业客户提供该模型，并表示愿意与Higgsfield和Adobe Firefly等视频工具建立合作伙伴关系。用户现在可以通过文本提示或参考图像在其网站上试用Varya。

Varya的发布反映了印度AI雄心中的基本权衡。行业资深人士指出，印度可以通过创建应用程序和生态系统在AI领域留下印记，而Varya正是这一战略的体现。通过提供低成本、高速度且文化适配的视频生成工具，Avataar AI有望推动印度视频AI的普及，尤其是在教育、商业和创意领域。