酷玩网

Nous Research 提出高效计算法 YaRN,可扩展大模型上下文窗口

linx
欧意最新版本

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

APP下载  官网地址

品玩于9月5日带来最新资讯,Nous Research携手EleutherAI实验室与瑞士日内瓦大学的研究团队共同发表论文,揭示了名为YaRN的创新方法。该方法能够扩展大型语言模型的上下文窗口。研究论文指出,相较于传统方法,YaRN在标记和训练步骤上有着显著的优势。通过应用YaRN,LLaMA模型能够更高效地运用并外推其原始预训练所设定的上下文长度,实现了对过去窗口扩展技术的超越。GitHub页面显示,经过YaRN微调的LLaMA 2 7B/13B模型的上下文窗口分别达到了64k和128k。

本文链接:https://www.8btc.com/article/6831948 转载时请标明文章来源

标签: