Google 近期揭幕了一项令人瞩目的创新——全新的图像生成AI工具 ImageFX,它允许用户通过关键词轻松地创造出令人惊叹的图像。此外,公司还对音乐生成工具 MusicFX 和文本生成工具 TextFX 进行了显著的优化升级。尽管如此,这三项服务目前尚未对中国的用户开放。
全新力作:ImageFX——关键词驱动的图像创作ImageFX,Google的最新力作,通过简洁的文字提示,用户就能轻松构建出图像,这让人联想到ChatGPT的便捷性。
ImageFX依托于Google DeepMind的Imagen 2模型,该模型能够将文字转化为图像。据团队透露,其先进的渲染技术有效减少了传统生成式图像中常见的怪异阴影和组合,从而使得生成的图像更加逼真。
与ChatGPT需要多段完整的文字描述相比,ImageFX通过表达晶片(expressive chips)提供关键词输入功能,并附有关键词建议和替换选项,极大地提升了用户生成和实验图像的效率。
音乐与文本生成的优化:MusicFX与TextFXMusicFX,作为去年推出的文本转音乐生成式AI,凭借简单的prompt输入,用户能够创作出长达70秒的音乐作品,甚至可以循环播放。
自推出以来,全球用户已通过MusicFX创作超过1,000万首曲目。基于这些反馈数据,团队正在对MusicLM模型进行改进,以期实现更高品质的声音和更快速的音乐生成。
所有由ImageFX生成的图像以及使用MusicFX创作的音乐均带有SynthID标记,这可以将数字水印直接嵌入内容中,便于其他系统进行识别,同时不影响内容的外观,确保了内容的版权。
此外,团队还加强了与Lupe Fiasco合作的文案生成工具TextFX,改善了用户体验和使用流程界面,使得作家和编剧能够更加便捷地使用这一工具。
Google AI工具的易用性目前,生成式AI的一个主要商业挑战是用户使用上的难度。复杂的prompt输入和AI使用教程的普遍存在,给用户带来了认知负担,降低了他们的使用意愿。
Google通过简化AI的使用方式,旨在吸引更广泛的用户群体。以ImageFX为例,它区别于ChatGPT需要完整段落文字输入或Midjourney的复杂操作指令,ImageFX允许用户仅通过关键词就能完成图像的生成,极大地简化了用户的使用流程。
标签: 比特币挖矿