m360传赢 - OpenAI 首次展示音频模型可根据15秒语音片段创建逼真声音

BY 媒介360

OpenAI 在其官网博客上公布了语音生成模型— Voice Engine，该模型可以根据某人的 15 秒语音片段创建情感丰富且逼真的声音。

该模型于 2022 年底首次开发，并且已经对教育技术公司 Age of Learning、视觉故事平台 HeyGen、健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespan 等公司开放访问。

Voice Engine 的用途十分广泛，可用于提供阅读帮助、改善偏远地区的基本服务交付，以及为患有影响言语的人士提供治疗应用。

OpenAI 还在博客中表示，「通过开放小规模部署，有助于我们按照现有方法、保障措施等推进产品落地，并在不断磨合、探索过程中思考，如何将 Voice Engine 用于各行各业」。