近日,清华大学电子工程系与字节跳动旗下火山语音团队强强联手,共同研发出一款开源的大语言模型——SALMONN。该模型在英语语音识别、英语至中文的语音翻译、情感分析、音频字幕制作以及音乐描述等领域表现出色。更令人惊喜的是,SALMONN还具备多种在训练过程中未曾特别学习的多语言和跨模态能力,包括非英语语音识别、英语至其他语言的语音翻译、语音内容的摘要与关键词提取、基于音频的故事创作、音频问答以及语音和音频联合推理等。
目前,该模型已正式在GitHub上发布,官方亦同步提供了项目演示链接。
本文链接:https://www.8btc.com/article/6830474,转载时请标明文章来源。
标签:
文章来源: 酷玩网
版权声明: 本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任