提交/推广产品 —

技术进展

智谱GLM-5.1高速版刷新全球大模型速度纪录

Heooo 05月22日18时00分 15 阅读

「智谱发布GLM-5.1高速版API，输出速度达400 tokens/s，打破速度与能力不可兼得的行业惯例，通过三大层面系统级优化实现旗舰性能与低延迟兼顾。」

国内知名人工智能团队智谱近日正式宣布，面向部分企业客户推出全新的 GLM-5.1 高速版 API。这款代号为“GLM-5.1-highspeed”的模型一经发布便震撼业界，其输出速度成功达到了惊人的 400 tokens/s。这一数据直接刷新了当前全球大模型厂商的 API 速度上限，展现出极强的技术统治力。

在过去的人工智能行业认知中，模型的运行速度与体积往往不可兼得，高速度通常意味着需要牺牲模型的能力。然而，GLM-5.1 高速版彻底打破了“快等于小”的行业惯例。该模型首次在国产大模型中实现了突破，成功将旗舰级的技术能力与极低的延迟体验同时带入到了实际生产环境中。

据悉，该模型由智谱 GLM 团队与 TileRT 团队联合打造。双方通过抛弃传统的动态调度，在推理引擎、调度系统以及底层基础设施三个层面进行了深度且彻底的系统级优化。在技术细节上，研发团队不仅针对模型架构重写了核心推理路径以提升单卡吞吐，还通过动态批处理等手段降低了高并发场景下的延迟。同时，围绕基础设施的协同优化，确保了 400 TPS 成为稳定可用的生产级能力。

这款高速模型拥有极其广泛的应用前景，特别适用于对响应延迟要求严苛的场景。无论是 AI 编程、实时语音交互，还是高频的商业决策，该模型目前均已在智谱 MaaS 平台面向部分企业开放服务。GLM-5.1 高速版的推出，不仅标志着国产大模型在推理效率上的重大突破，也为企业级 AI 应用提供了更高效、更可靠的底层能力支撑。

# 智谱 # GLM-5.1 # 高速模型 # API # 推理优化

来源：Heooo AI工具导航

热门工具

起号兽

# 生产力工具

起号兽

起号兽，你的AI短视频运营助手。智能规划内容、生成脚本、指导拍摄、优化发布，一站式帮你打造个人IP。支持抖音、快手、小红书、视频号多平台运营。

# 生产力工具访问官网

豆包

# 对话机器人

豆包

豆包是你的 AI 聊天智能对话问答助手，写作文案翻译编程全能工具。豆包为你答疑解惑，提供灵感，辅助创作，也可以和你畅聊任何你感兴趣的话题。

# 对话机器人访问官网

TRAE - IDE

TRAE - IDE

TRAE AI IDE | 国内首款 AI 原生集成开发环境，深度集成 Doubao-1.5-pro 与 DeepSeek 模型，支持中文自然语言一键生成完整代码框架，实时预览前端效果并智能修复 BUG。首创 Builder 模式实现需求到代码的自动化开发，兼容 Windows/macOS 系统，官网下载即用。

# 代码助手访问官网

剪映

剪映

字节跳动旗下AI视频剪辑工具，支持智能抠图、自动字幕等。

# Ai大模型访问官网

智谱AI

智谱AI

智谱AI推出的GLM大模型系列，支持多场景智能应用。

# Ai大模型访问官网

Qoder

Qoder

Qoder 是一个由 AI 驱动的智能体编码平台，用于真正的软件开发。Experience 提供智能代码生成、基于对话的编程和高级开发者工具。

# 代码助手访问官网

巨量创意（字节跳动）

巨量创意（字节跳动）

抖音/巨量引擎官方AI创意平台，支持图文/视频广告自动生成、A/B测试与智能优化。

# 视频生成访问官网

度加剪辑

度加剪辑

百度推出的AI视频编辑工具，主打语音转字幕和智能成片。

# 视频生成访问官网

Coze

Coze

字节跳动推出的AI Bot开发平台，支持多场景应用。

# Ai大模型访问官网

WebTerm

# 生产力工具

WebTerm

一个用于无忧学习CLI的浏览器终端沙箱

# 生产力工具访问官网

不知道选什么工具？3步搞定

AI帮你精准匹配