品玩于9月26日的报道揭示,微软的DeepSpeed团队近期推出了名为DeepSpeed-VisualChat的新框架。该框架致力于通过融合多模式功能,来进一步提升大型语言模型的表现力。
根据研究论文的阐述,DeepSpeed-VisualChat的核心目标在于增强大型语言模型在处理交错输入时的专业性。为此,它引入了革命性的多模式因果注意力机制,并通过数据混合技术在既定数据集上实现了无障碍的多轮和多图像对话交流。与现行的框架相较,DeepSpeed-VisualChat展现了惊人的可扩展性,其70B参数规模的模型展现出卓越的性能。
链接:https://www.8btc.com/article/6834034 转载时请标明文章来源
标签:
文章来源: 酷玩网
版权声明: 本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任