根据站长之家于9月12日的报道,全球知名的IT巨头微软近期携手Project Gutenberg(古腾堡工程)展开合作,运用人工智能技术为该工程打造了一座包含超过5000本的高品质有声书库。在此次合作项目中,科研团队巧妙融合了机器学习、自动文本挑选以及自然语音合成等多项先进的人工智能技术,实现了电子书向语音自动转换的完整流程。
项目团队首先研发出一种高效算法,能够自动解析电子书的内容结构,准确区分正文与非关键部分如页码、表格等,进而运用WaveNet、Tacotron和FastSpeech等业界领先的文本转语音技术,生成逼真的自然朗读语音。同时,该团队还确保系统能够识别书中的叙述者、对话以及不同角色,并据此调整语音,以实现故事情节的生动再现。据悉,本次项目已搜集并整理了超过35000小时的优质有声书语音数据,内容涵盖经典文学、戏剧、传记等多种类型,并将以开源形式免费分享。
值得注意的是,古腾堡工程(Project Gutenberg)作为一个免费数字图书馆计划,用户可在其平台上免费阅读和下载超过7万本电子书。古腾堡工程自1971年发起,被誉为最早的数字图书馆。
本文链接:https://www.8btc.com/article/6832658 转载请注明文章出处
标签: