在周五(16日)的一天,由创造ChatGPT的人工智能创新企业OpenAI推出了一项引人注目的技术——文本转影片模型Sora。这一技术允许用户通过简单的文字指令,生成时长可达1分钟的影片。
Sora模型具备惊人的能力,它能够创造出包含多个角色、特定动作类型,以及精确的主体和背景细节的复杂场景。在OpenAI的官方网站上,有这样的描述:
“Sora对语言的深刻理解能力使其能够精确地解读提示并生成具有生动情感的角色,同时还能在单个影片中创建多个镜头,精确地呈现角色和视觉风格。”
OpenAI已经展示了几个由Sora生成的影片,并附上了生成这些影片的文字指令。
此外,OpenAI透露,Sora还能根据现有的静态图片生成影片,使图像内容生动起来,并能够从现有影片中提取内容或填补缺失的帧。
尽管如此,OpenAI也提醒,当前模型仍存在一些局限性,比如在模拟复杂场景中的物理现象时可能不够准确,或者在理解某些特定情况下的因果关系时可能存在困难。此外,模型还可能混淆空间细节,如左右方向。
OpenAI的执行长阿特曼(Sam Altman)在X平台上表示,公司已经开始对Sora进行“红队演练”,并向有限的创作者群体开放了访问权限。阿特曼还通过X平台分享了几段使用Sora生成的影片。
标签: 比特币挖矿