酷玩网

研究:使用微调的 Code Llama-34B 在 HumanEval 评估中击败了 GPT-4

linx
欧意最新版本

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

APP下载  官网地址

根据机器之心最新消息,Meta公司近日公开了专注于代码生成的底层模型Code Llama,该模型不仅可用于学术研究,还允许商用。研究指出,Code Llama的多个版本在HumanEval和MBPP数据集上的单次生成通过率(pass@1)均超过了GPT-3.5。

值得关注的是,Code Llama的34B「Unnatural」版本在HumanEval数据集上的pass@1率接近于GPT-4(62.2%对比67.0%)。尽管Meta尚未公开这一版本,但通过使用一小部分高质量的编码数据训练,显著提升了效果。Phind(一家致力于打造专为开发者服务的AI搜索引擎的组织)的研究人员向GPT-4发起了挑战,他们利用微调后的Code Llama-34B在HumanEval评估中击败了GPT-4。

Phind的联合创始人Michael Royzen表示:“这仅仅是一个初步的实验,目的是重现并超越Meta论文中提到的「Unnatural Code Llama」的成果。未来,我们将组合不同的CodeLlama模型,我相信这些模型在现实世界的工作流程中将会具有竞争力。”

值得一提的是,Meta之前已经开源了文本生成代码的AI编程模型Code Llama。

本文链接:https://www.8btc.com/article/6830948 转载请注明文章出处

标签: