您现在的位置是:首页 > 科技 > 正文

使用 OPENAI 语音引擎体验更高水平的文本转语音

发布时间:2024-04-01 15:26:52黎美瑶来源:

导读 OpenAI 是一家领先的人工智能研究实验室,推出了 Voice Engine,这是一个革命性的文本转语音 (TTS) 平台,可利用仅 15 秒的音频样本

OpenAI 是一家领先的人工智能研究实验室,推出了 Voice Engine,这是一个革命性的文本转语音 (TTS) 平台,可利用仅 15 秒的音频样本来生成人声的合成副本。这项创新技术是继 OpenAI 的文本到视频人工智能模型Sora于 2024 年初成功首次亮相之后推出的。进一步巩固了他们对突破创意人工智能应用界限的承诺。

功能和应用

语音引擎使用户能够生成能够阅读各种语言(包括说话者的母语)文本提示的合成语音。这为不同行业打开了大门,潜在的应用范围从教育工具到内容创建和通信无障碍。

然而,OpenAI 承认这种强大技术固有的滥用可能性。在积极探索其建设性应用的同时,他们强调对负责任的部署策略的承诺。

开发和早期实施

语音引擎的开发于 2022 年底开始,现已集成到 OpenAI 现有的 TTS 基础设施中,包括ChatGPT语音和朗读功能。通过合作伙伴关系和小规模部署,该公司收集了对该平台实际应用的宝贵见解。

此外,以下是各个领域的一些有前景的早期用例:

阅读辅助:学习时代利用语音引擎为儿童和非阅读者提供个性化的学习体验。该技术可为预先编写的画外音内容生成听起来自然、富有感情的声音,促进理解和参与。此外,它还允许实时交互,进一步增强学习过程。

标签:

上一篇
下一篇