BY 媒介360
OpenAI 在其官网博客上公布了语音生成模型— Voice Engine,该模型可以根据某人的 15 秒语音片段创建情感丰富且逼真的声音。
该模型于 2022 年底首次开发,并且已经对教育技术公司 Age of Learning、视觉故事平台 HeyGen、健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespan 等公司开放访问。
Voice Engine 的用途十分广泛,可用于提供阅读帮助、改善偏远地区的基本服务交付,以及为患有影响言语的人士提供治疗应用。
OpenAI 还在博客中表示,「通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业」。