品玩资讯于9月5日披露,香港中文大学最近与上海AI实验室及华中科技大学携手,共同研发出一项创新的、三位一体的多模态模型——Point-Bind。该研究团队透露,Point-Bind能够将点云数据与二维图像、语言、音频以及视频进行精准对齐。在ImageBind的引领下,研究团队成功地在三维与多模态领域搭建了一个联合嵌入空间,为诸如任意三维生成、三维嵌入运算以及三维开放世界理解等众多具有广阔前景的应用提供了技术支持。
在此基础上,研究团队更进一步推出了首个基于三维多模态指令的三维大型语言模型——Point-LLM。借助高效的参数微调技术,Point-LLM将Point-Bind的语义信息融入预训练的大型语言模型(LLM)中,使其无需三维指令数据,即可展现出卓越的三维和多模态问题解决能力。
本文链接:https://www.8btc.com/article/6831944
转载时请务必注明文章来源
标签:
文章来源: 酷玩网
版权声明: 本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任