新闻详情

OpenAI发布GPT-Realtime,AI Agent进入超逼真对话时代

OpenAI发布语音模型GPT-realtime。GPT-realtime是一个专用于语音AIAgent的多模态模型,可以生成愈加天然流通的语音,完美仿照人类丰厚多样的语调、情感以及语速,支撑图画了解并将其与语音或文本对话相结合运用,十分适用于客服、教育、金融、医疗等范畴打造语音智能体。

gpt-realtime选用端到端架构,直接处理并生成音频,明显下降推迟。GPT-realtime还新增了Marin与Cedar两种极具特征的语音,一起对原有的8种语音也进行了全面晋级。

来历:

新浪网

← 返回新闻列表