Grok Imagine Video 1.5正式上线：25秒生成720P视频

马斯克旗下xAI公司今日正式发布Grok Imagine Video 1.5模型，该模型已在xAI API中结束预览并全面上线。作为Grok Imagine系列的最新版本，1.5模型在音画同步、运动真实性和生成速度三大核心维度实现了显著升级，为开发者提供了更高效的AI视频生成能力。

在音画同步方面，Grok Imagine Video 1.5实现了单次生成中同时输出音效、环境音和对话的能力，音频与画面动作的精准对齐成为其突出亮点。模型大幅提升了语音清晰度，口型同步效果更加自然，尤其适用于需要人物配音的短片创作场景。这一改进使得AI生成的视频不再仅仅是视觉内容的堆砌，而是具备了完整的视听叙事能力。

运动与物理表现是本次升级的另一大重点。Grok Imagine Video 1.5增强了视频内的运动连贯性，显著减少了此前常见的人物肢体扭曲、物体飘浮等不自然现象。模型能够更好地模拟重量感与动量，例如人物走路时衣摆的自然晃动、下落物体的加速轨迹等细节，整体观感更接近真实物理世界。这种对物理规律的尊重，让AI生成的视频在视觉可信度上迈出了重要一步。

生成速度的提升是开发者最直观感受到的进步。在Fast模式下，Grok Imagine Video 1.5生成一段6秒、分辨率为720p的视频仅需约25秒，而前代产品需要40秒以上。这意味着效率提升了近40%，对于需要批量生成视频内容的应用场景而言，这一速度优势将带来显著的开发体验改善。

目前，Grok Imagine Video 1.5已在xAI API中以grok-imagine-video-1.5模型名称提供。开发者可以通过上传起始图片、描述运动方式，并选择分辨率和时长来调用该模型。这一接口设计降低了视频生成的技术门槛，使得更多开发者能够将AI视频能力集成到自己的应用中。随着模型的正式上线，xAI在AI视频生成领域的布局进一步深化，为行业提供了更具实用性的工具选择。