【TechWeb】7 月 31 日消息,据国外媒体报道,OpenAI 公司宣布,已开始向少量付费订阅 ChatGPT 用户推出高级语音模式 (Advanced Voice Mode),让他们可以测试更自然的实时对话。
ChatGPT 的高级语音模式能够理解并回应情绪和非语言暗示,让我们更接近与 AI 进行实时、自然的对话。OpenAI 在 5 月份首次展示了 GPT-4o,以及这种超现实的 「高级语音模式」。
GPT-4o 能在 232 毫秒内对音频输入做出反应,平均反应时间为 320 毫秒,这与人类在对话中的反应时间相近。
高级语音模式不需要像当前的 ChatGPT 语音模式那样将语音转换为文本,再转换成语音,从而降低了交互延迟。
OpenAI 表示,自从演示了 「高级语音模式 」 之后,一直在努力提高语音对话的安全性和质量。OpenAI 还 「实施了防护措施」,以阻止对暴力或受版权保护内容的请求。
OpenAI 原计划 6 月底推出此功能,但因为需要更多时间来准备,推迟了一个月发布。OpenAI 表示,高级语音模式将于今年秋季逐步推广至所有 ChatGPT Plus 订阅用户。