微软携手ProjectGutenberg,利用AI语音技术制作5000本

发布时间:2023-09-12 21:45
来源:IT之家   阅读量:19028   

,微软近日与“免费数字图书馆计划”Project Gutenberg 合作,利用 AI 为电子书库制作了超过 5000 本免费有声书。

图源Project Gutenberg 网站

据悉,在这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。

IT之家经过查询得知,项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。

微软表示,此次计划已收集整理了超过 35000 小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户也可以用自己录制的少量语音,生成“用自己的声音朗读整本书”的效果,这一项目相对丰富了网站有声书的内容,同时也为视障人士提供了便利。

参考

  • Thousands of free and open audiobooks powered by Microsoft AI

  • 论文 Large Scale Intelligent Microservices

广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

标签:

更多相关文章
  • 法国卢浮宫——关于蒙娜丽莎的一切

    法国卢浮宫——关于蒙娜丽

  • 甘州科技赋能畜牧业高质量发展

    甘州科技赋能畜牧业高质量

  • 两项生物降解新国标6月1日起实施目前市场空间缺口巨大

    两项生物降解新国标6月1

  • 孙兴慜助热刺保留争四希望,有望染指英超金靴

    孙兴慜助热刺保留争四希望

  • 沙特阿美市值超苹果成全球市值最高企业

    沙特阿美市值超苹果成全球

  • 日产:将于5月20日发布纯电微型车,约合人民币10.6万元起

    日产:将于5月20日发布

  • 从“花样两米线”里读出什么

    从“花样两米线”里读出什

  • 由普通制造企业向高新技术企业迈进

    由普通制造企业向高新技术