OpenAI被曝正筹备发布新一代双向语音模型“GPT-Bidi-1”
来源:互联网
时间:2026-06-18 14:59:05
OpenAI最近被爆出正在悄悄筹备一款名为“GPT-Bidi-1”的下一代双向音频模型——说白了,就是给ChatGPT的语音模式来一次大升级。这次的核心突破,在于采用了双向(Bidirectional)架构,彻底打破了以往AI语音交互那种“你一句我一句、谁先说完谁先停”的单工对讲模式。简单讲,就是系统可以一边听一边说,你中途插话、打断,它都能实时捕捉,不会卡顿也不会死机,动态调整语义输出,整个对话的流畅度和自然感大幅提升。

这次技术迭代可不只是音质或者语调的小修小补,而是OpenAI在多模态战略上的关键一环。要知道,之前OpenAI的文本大模型已经迭代到了GPT-5.5,推理能力越来越强,但语音大模型一直有点跟不上节奏,这就导致多模态体验出现了断层。GPT-Bidi-1的出现,不仅补齐了推理能力上的差距,更传递出一个清晰信号:OpenAI已经把语音看作下一代AI的核心入口。这个判断背后,是为后续全面布局语音优先(Audio-first)的硬件设备和企业级语音支持工具,提前夯实技术地基。