印度视频AI模型Varya实现20倍成本优势
「印度初创公司Avataar AI推出视频生成模型Varya,通过蒸馏技术将生成速度提升10倍,成本降至0.005美元/秒,并支持印度文化语境识别。」
印度AI初创公司Avataar AI近日发布了名为Varya的视频生成模型,该模型专为印度市场设计,在成本、速度和文化适应性方面展现出显著优势。作为印度AI使命(India AI Mission)资助的12家初创公司之一,Avataar AI获得了政府补贴的GPU算力支持,并承诺将模型开源。
Varya并非从零开始构建,而是基于阿里巴巴开源的Wan 2.2模型进行蒸馏优化。蒸馏技术将大型模型的复杂能力压缩至更轻量、更快速的版本,使Varya仅需4步即可完成视频生成,而Wan 2.2需要50步。这一改进使Varya的生成速度提升了10倍,同时大幅降低了计算成本。具体而言,在NVIDIA H200 GPU上,Varya生成一段5秒的720p视频仅需45秒,而Wan 2.2需要1230秒。
最引人注目的是Varya的定价策略。该公司计划对其托管服务收取每秒钟视频0.48印度卢比(约0.005美元),远低于Veo、Kling、Luma和Runway等模型通常每秒钟0.10美元以上的价格,价格差距约达20倍。Peak XV的董事总经理Rajan Anandan表示:“印度是一个视频优先的市场。当前AI视频模型对于印度的人口规模使用来说过于昂贵。如果视频AI要惠及学生、教师、中小微企业、创作者、企业和公共服务,成本必须大幅下降。成本是印度AI采用的最大解锁因素。”
Varya在文化适应性方面也进行了专门优化。图像和视频生成模型常常忽略文化细微差异,产生刻板或通用的输出。Avataar AI表示,他们使用精心策划的数据训练Varya识别文化细微差异,包括食物、服装、建筑和节日。这使得Varya能够更准确地生成符合印度本地语境的内容,例如识别不同的节日、食物和服装。
Varya将作为开放权重模型发布在印度政府的AI Kosh门户上,该门户是印度政府用于公开AI模型和数据集的集中存储库。开发者可以自行托管或根据自身需求修改模型。Avataar还计划向企业客户提供该模型,并表示愿意与Higgsfield和Adobe Firefly等视频工具建立合作伙伴关系。用户现在可以通过文本提示或参考图像在其网站上试用Varya。
Varya的发布反映了印度AI雄心中的基本权衡。行业资深人士指出,印度可以通过创建应用程序和生态系统在AI领域留下印记,而Varya正是这一战略的体现。通过提供低成本、高速度且文化适配的视频生成工具,Avataar AI有望推动印度视频AI的普及,尤其是在教育、商业和创意领域。
来源:Heooo AI工具导航