OpenAI发布语音模型GPT-realtime。GPT-realtime是一个专用于语音AIAgent的多模态模型,可以生成愈加天然流通的语音,完美仿照人类丰厚多样的语调、情感以及语速,支撑图画了解并将其与语音或文本对话相结合运用,十分适用于客服、教育、金融、医疗等范畴打造语音智能体。
gpt-realtime选用端到端架构,直接处理并生成音频,明显下降推迟。GPT-realtime还新增了Marin与Cedar两种极具特征的语音,一起对原有的8种语音也进行了全面晋级。
来历:
新浪网
OpenAI发布语音模型GPT-realtime。GPT-realtime是一个专用于语音AIAgent的多模态模型,可以生成愈加天然流通的语音,完美仿照人类丰厚多样的语调、情感以及语速,支撑图画了解并将其与语音或文本对话相结合运用,十分适用于客服、教育、金融、医疗等范畴打造语音智能体。
gpt-realtime选用端到端架构,直接处理并生成音频,明显下降推迟。GPT-realtime还新增了Marin与Cedar两种极具特征的语音,一起对原有的8种语音也进行了全面晋级。
来历:
新浪网