据站长之家于8月23日披露,人工智能领域的创业公司Hugging Face最新推出了名为IDEFIX的开源多模态AI模型。这款IDEFIX模型具备处理图像与文本输入,并输出连贯文本的能力。
IDEFIX是在视觉语言模型Flamingo的基础上构建的,而Flamingo则是DeepMind在去年开发的一款顶尖多模态AI模型。IDEFIX的训练过程利用了包括维基百科、公共多模态数据集以及LAION在内的众多开放数据集。此外,Hugging Face还推出了全新的多模态数据集OBELIX,该数据集由1.41亿个从互联网搜集的图像文本文档组成。
在图像文本理解评估方面,IDEFIX的表现远超专有模型。该模型提供了两个版本,基础版本拥有90亿个参数,而指导版本则高达800亿个参数。相比之下,OpenAI的ChatGPT目前尚不支持图像处理功能。
有消息称,Salesforce正积极投资Hugging Face的最新一轮融资。
本文链接:https://www.8btc.com/article/6830580 转载请注明文章出处
标签: