04.01.24 | 21:38 PM
OpenAI 首次展示音频模型 可根据15秒语音片段创建逼真声音
BY 媒介360

OpenAI 在其官网博客上公布了语音生成模型— Voice Engine,该模型可以根据某人的 15 秒语音片段创建情感丰富且逼真的声音。

该模型于 2022 年底首次开发,并且已经对教育技术公司 Age of Learning、视觉故事平台 HeyGen、健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespan 等公司开放访问。

Voice Engine 的用途十分广泛,可用于提供阅读帮助、改善偏远地区的基本服务交付,以及为患有影响言语的人士提供治疗应用。

OpenAI 还在博客中表示,「通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业」。

advertisement