新芒xAI 4月9日消息 亚马逊本周展示了新的人工智能技术,包括其更具对话性的语音模型,以便更好地与 Gemini Live 和 OpenAI 的高级语音模式等竞争,以及对其可以生成视频的模型的更新。
亚马逊表示,全新的 Nova Sonic 语音模型可处理对话应用的实时语音处理和 AI 语音生成。Nova Sonic 采用“统一模型架构”,亚马逊声称其优于其他将独立模型互连以处理语音识别、语音转文本、响应生成以及文本转音频的方法。亚马逊表示,Nova Sonic 还能更好地检测说话者的语调,并提供更自然的响应。
Nova Sonic 现已通过亚马逊的 Bedrock 开发者平台开放试用,该公司表示,它可以用于开发客服机器人等产品,或为旅游、教育、医疗保健和其他各行各业构建 AI 代理。