根据《都市快报》的最新报道,阿里达摩院于近日在魔搭社区(ModelScope)上发布了名为“文本生成视频大模型”的创新产品。官方资料显示,该模型由三个子网络构成,包括文本特征提取、文本特征至视频隐空间扩散模型以及视频隐空间至视频视觉空间,整体模型参数规模高达17亿。此外,该模型支持英文输入。其采用的扩散模型基于Unet3D结构,通过迭代去噪的方式,从纯高斯噪声视频中生成高质量的视频内容。
值得一提的是,早在二月份,就有消息指出阿里正在研发自己的聊天机器人ChatGPT,目前该项目已进入内测阶段。
本文链接:https://www.8btc.com/article/6810504
转载本文时,请务必注明文章来源。
标签:
文章来源: 酷玩网
版权声明: 本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任