据站长之家8月2日资讯,随着人工智能在艺术创作领域的迅猛进步,英伟达的研究团队推出了一项革命性的文本至图像个性化技术——Perfusion。值得注意的是,与市场上那些动辄价值百万的巨型模型相比,Perfusion以其小巧的体积和高效的训练时间脱颖而出。具体来说,它的文件大小仅为100KB,仅需4分钟即可完成训练,在展现个性化元素的同时,展现出卓越的创造力和灵活性。
Perfusion的诞生源于英伟达与以色列特拉维夫大学的合作研究。尽管体量不大,但在特定性能方面,它甚至超越了Stability AI的Stable Diffusion v1.5、Stable Diffusion XL (SDXL)以及MidJourney等业界领先的AI艺术创作工具。值得一提的是,Perfusion还具备一项独特功能,允许用户在推理阶段通过调整仅100KB的模型,实现对视觉保真度(图像)与文本对齐度(提示)之间平衡的控制。目前,英伟达已发布了该研究论文,并承诺将很快开源代码。
本文链接:https://www.8btc.com/article/6828256 转载请注明文章出处
标签: