Grok Imagine Video 1.5正式上线:25秒生成720P视频
「xAI发布Grok Imagine Video 1.5模型,支持静态图生成带音频的短视频,生成速度提升至25秒,音画同步与运动表现大幅优化。」
马斯克旗下xAI公司今日正式发布Grok Imagine Video 1.5模型,该模型已在xAI API中结束预览并全面上线。作为Grok Imagine系列的最新版本,1.5模型在音画同步、运动真实性和生成速度三大核心维度实现了显著升级,为开发者提供了更高效的AI视频生成能力。
在音画同步方面,Grok Imagine Video 1.5实现了单次生成中同时输出音效、环境音和对话的能力,音频与画面动作的精准对齐成为其突出亮点。模型大幅提升了语音清晰度,口型同步效果更加自然,尤其适用于需要人物配音的短片创作场景。这一改进使得AI生成的视频不再仅仅是视觉内容的堆砌,而是具备了完整的视听叙事能力。
运动与物理表现是本次升级的另一大重点。Grok Imagine Video 1.5增强了视频内的运动连贯性,显著减少了此前常见的人物肢体扭曲、物体飘浮等不自然现象。模型能够更好地模拟重量感与动量,例如人物走路时衣摆的自然晃动、下落物体的加速轨迹等细节,整体观感更接近真实物理世界。这种对物理规律的尊重,让AI生成的视频在视觉可信度上迈出了重要一步。
生成速度的提升是开发者最直观感受到的进步。在Fast模式下,Grok Imagine Video 1.5生成一段6秒、分辨率为720p的视频仅需约25秒,而前代产品需要40秒以上。这意味着效率提升了近40%,对于需要批量生成视频内容的应用场景而言,这一速度优势将带来显著的开发体验改善。
目前,Grok Imagine Video 1.5已在xAI API中以grok-imagine-video-1.5模型名称提供。开发者可以通过上传起始图片、描述运动方式,并选择分辨率和时长来调用该模型。这一接口设计降低了视频生成的技术门槛,使得更多开发者能够将AI视频能力集成到自己的应用中。随着模型的正式上线,xAI在AI视频生成领域的布局进一步深化,为行业提供了更具实用性的工具选择。
来源:Heooo AI工具导航