Google倾力打造的全新原生多模态AI模型——Gemini,其特色在于从头开始构建的多元化AI系统,正如人类借助五感感知世界一般,Gemini能够全面、流畅地处理并融合文字、代码、音频、图像、视频等多种信息形式。
在近期视频中,拥有12万订阅者的TheAIGRID深入解析了Gemini的多项功能,观众们不禁赞叹:“真是让人难以割舍!”
兼容视觉、听觉与书写,随时随地畅谈天地
Gemini不仅能够满足视听需求,还能让你如同与老友闲聊般,畅所欲言。你可以通过镜头和麦克风向Gemini提问,连续不断地进行交流,甚至可以与之互动游戏。
(视频5分20秒处)
与Gemini玩硬币猜在哪只手的游戏,体验最强AI顾问的力量
Gemini更是一位出色的AI顾问。视频中展示了Gemini如何根据“为女儿举办生日派对”的任务,结合她喜爱动物和在户外举办派对的愿望,迅速生成多种派对方案供选择。
它提供的派对主题方案,不仅包含布置、活动、食物等细节,还允许用户自行挑选喜欢的主题,深入查看细节,甚至可以直接询问关于派对杯子蛋糕的款式或制作方法等问题。这无疑让Gemini成为地表上最强大的AI顾问。
(视频13分47秒处)
最强家教,上传考题学习解题技巧
用户还可以直接上传考题,Gemini会帮你批改并指出错误,一步步指导你解题。如果你有疑问,随时可以提问,甚至请求它出类似的题目,确保你对题型有全面理解。
(视频17分15秒处)
此外,你还可以上传自己踢足球的练习视频,让Gemini指导你如何调整姿势,提高进球率。
(视频27分10秒处)
地表最强的AI模型
Google的AI聊天机器人Bard已开始使用Gemini Pro的微调版本进行更高级的推理、规划和理解。同时,Google也将Gemini引入Pixel手机,并在接下来的几个月里出现在更多产品和服务中。
从视频中可以看出,Gemini远不止是聊天机器人,它还能绘图、协助科学家整理海量数据,并将其整合成所需形式。因此,Google及Alphabet首席执行官Sundar Pichai自豪地表示:
这是我们迄今为止最强大、最通用的模型。我对未来以及Gemini将为全球各地的人们带来的机遇感到无比激动。
标签: 比特币挖矿