研究：使用微调的 Code Llama-34B 在 HumanEval 评估中击败了 GPT-4

linx 2024-10-24 13:14:07

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

根据机器之心最新消息，Meta公司近日公开了专注于代码生成的底层模型Code Llama，该模型不仅可用于学术研究，还允许商用。研究指出，Code Llama的多个版本在HumanEval和MBPP数据集上的单次生成通过率（pass@1）均超过了GPT-3.5。

值得关注的是，Code Llama的34B「Unnatural」版本在HumanEval数据集上的pass@1率接近于GPT-4（62.2%对比67.0%）。尽管Meta尚未公开这一版本，但通过使用一小部分高质量的编码数据训练，显著提升了效果。Phind（一家致力于打造专为开发者服务的AI搜索引擎的组织）的研究人员向GPT-4发起了挑战，他们利用微调后的Code Llama-34B在HumanEval评估中击败了GPT-4。

Phind的联合创始人Michael Royzen表示：“这仅仅是一个初步的实验，目的是重现并超越Meta论文中提到的「Unnatural Code Llama」的成果。未来，我们将组合不同的CodeLlama模型，我相信这些模型在现实世界的工作流程中将会具有竞争力。”

值得一提的是，Meta之前已经开源了文本生成代码的AI编程模型Code Llama。

本文链接：https://www.8btc.com/article/6830948 转载请注明文章出处

标签:

本文地址: https://www.famikj.com/qkzx/24332.html

文章来源: 酷玩网