OpenAI开辟双向语音模子,被打断也能秒回 让通话更天然顺畅
时间:2026-03-07 11:45:27
小编:china
阅读:
3月7日消息,据报道,OpenAI正在研发一种全新的语音模型,旨在让用户与ChatGPT的对话更加自然流畅。这项技术的核心突破在于,当用户在AI说话过程中打断系统时,AI能够实时调整回应,而不是像现在这样突然停止。
目前ChatGPT的高级语音模式采用的是回合式对话机制,用户必须先说完话,AI才会处理语音并生成回答。如果用户在AI发言时插入okay或mm-hm等简短回应,系统通常会直接停止,无法像正常对话那样继续推进交流。

为解决这一问题,OpenAI正在开发的BiDi(双向语音模型)能够持续处理说话者的语音输入,因此在被打断时可以立即调整回应。相比之下,现有的语音模型一旦开始生成回答,输出内容就基本固定,无法再根据新的输入进行变化。
这项技术目前仍处于开发阶段。据知情人士透露,原型模型在持续对话几分钟后容易出现故障,有时甚至会发出不自然的声音。OpenAI研究人员原本希望今年第一季度发布BiDi,但目前最新的发布时间可能推迟到第二季度或更晚。
OpenAI认为,如果语音模型能够在性能上接近文本模型,AI的使用范围将进一步扩大,因为大多数人更习惯与AI进行语音交流,而不是输入文字。BiDi模型在客服场景中可能尤其有价值。
例如,当顾客与零售商的AI客服通话时,如果顾客在对话过程中临时决定选择换货而非退货,BiDi模型理论上可以让AI客服顺畅调整对话,而不会突然停止或出现混乱。
知情人士还透露,BiDi模型在调用外部工具和应用方面也更灵活。OpenAI此前表示,公司计划为未来一款主要通过语音交互的AI设备改进语音模型,并考虑开发一款智能音箱,通过语音指令即可查看邮件或预订服务。
-
OpenAI开辟双向语音模子,被打断也能秒回 让通话更天然顺畅3月7日消息,据报道,OpenAI正在研发一种全新的语音模型,旨在让用户与ChatGPT的对话更加自然流畅。这项技术的核心突破在于,当用户在AI说时间:2026-03-07 -
苹果回应MacBook Neo设计,毫不向便宜塑料让步3月7日消息,苹果正式推出全新入门级笔记本MacBook Neo,3月11日正式发售,国行版本起售价4599元。苹果工业设计副总裁莫莉安德森在接受采时间:2026-03-07 -
中兴通信2025年报发布,营收1339亿元创汗青新高3月7日消息,中兴通讯发布2025年年报,全年营收达1339亿元,同比增长10 4%,创历史新高。归母净利润56 2亿元,扣非归母净利润33 7亿元,拟时间:2026-03-07 - 大爷骑自行车高架上逆行,致多车连环追尾3月7日消息,人能闯多大祸?一己之力可引发多车连环追尾!近日一段行车记录仪拍摄的视频在网络上流传,引发网友关注和讨论,之所以如此,是时间:2026-03-07
-
AI 搜刮时期:跨境电商的流量命门与 GEO 实操指南传统 SEO 已死,SGE 正在“打劫”你的订单。作为一名深耕海外市场的跨境电商 GEO 专家,我必须向所有卖家发出预警:如果你发现近半年的时间:2026-03-07
热门阅读
-
哥哥抚慰腮腺炎弟弟 得知传染秒变脸
阅读:44
-
999元起,联想moto g100s开售,LCD护眼屏、支撑微信/抖音6开
阅读:31
-
王自若称买超薄手机苹果必然是选,安卓都是缝合怪 不如苹果
阅读:29
-
从理光到大疆,年青人在追逐什么样的新相机
阅读:26
-
电力除冰“小黄人”爆火 刷屏海内外社交平台
阅读:23










