技术进展

OpenAI筹备GPT-Bidi-1模型,ChatGPT语音将迎巨变

Heooo 06月17日17时46分 2 阅读

「OpenAI正筹备推出GPT-Bidi-1模型,采用双向架构实现同时听与说,将大幅提升ChatGPT语音模式的实时交互能力。」

科技媒体testingcatalog最新报道显示,OpenAI公司正在紧锣密鼓地筹备推出GPT-Bidi-1模型。这款模型被视为ChatGPT语音模式迄今为止最大规模的升级,有望彻底改变用户与AI语音助手的交互体验。

据此前报道,OpenAI于2026年年初开始研发“双向”(BiDi)架构。与传统语音模型只能单向处理音频输入或输出不同,双向架构能够同时进行听和说,这意味着AI可以实时吸收用户的打断,并在对话中途即时调整回应。这种能力使得语音交互更接近人类自然对话的节奏与流畅度。

当前,OpenAI的文本模型已快速进化至GPT-5.5,展现出强大的语言理解与生成能力。然而,语音功能仍停留在相对较旧的音频技术栈上,导致口语对话能力明显落后于文字表现。GPT-Bidi-1模型的推出,正是为了弥合这一差距,让语音交互也能享受到最新AI技术的红利。

报道还透露,GPT-Bidi-1模型上线后,ChatGPT用户将能够根据自身需求在双向模式和现有的高级语音模式之间自由切换。系统还将支持High、Medium以及Instant三种智能等级,方便用户根据具体任务调整响应速度与对话深度。例如,在需要快速问答的场景下,用户可以选择Instant模式获得即时反馈;而在复杂讨论或创意协作时,High模式则能提供更深入、更细致的交互体验。

这一升级不仅提升了语音助手的实用性,也为未来更自然的人机交互奠定了基础。随着GPT-Bidi-1的推出,AI语音助手有望在客服、教育、内容创作等场景中发挥更大作用,真正实现“边说边想”的实时协作。

# OpenAI # GPT-Bidi-1 # 语音模式 # 双向架构 # ChatGPT

来源:Heooo AI工具导航