OpenAI首次展示音频模型Voice Engine,生成的声音太逼真了!
添加书签专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
3月30日凌晨,OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。
用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。
除了能合成音频之外,OpenAI还展示了Voice Engine很多其他际商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。
Voice Engine功能展示
OpenAI并非展示了一些简单的demo,而是一些实际场景化用例,这也就是说Voice Engine的技术已经非常成熟。
Age of Learning 是一家儿童教育公司,他们一直在使用Voice Engine生成各种有声读物。同时还通过与GPT-4的相结合使用,创建实时、个性化的回答与学生互动。
例如,使用一段15秒的参考音频。
本文素材来源OpenAI官网,如有侵权请联系删除
END
本篇文章来源于微信公众号: AIGC开放社区