酷玩网

Google推出原生多模态AI模型Gemini,挑战GPT-4

linx
欧意最新版本

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

APP下载  官网地址

Google正式发布全新原生多模态AI模型——Gemini。该模型堪称Google迄今为止最强大、最全面的AI工具,具备同时处理文字、代码、音频、图像和视频等多种类型信息的能力。

不同于以往将不同功能模块拼接起来的AI模型,Gemini作为从头开始构建的多模态AI,其设计灵感源于人类的五感,能够像人类一样全面且无缝地理解、操作和整合不同类型的信息,无论是文字、代码、音频、图像还是视频,都难不倒它。其性能远超单一功能模型组合后的效果。

Google对Gemini模型进行了严格的测试,评估其在众多任务中的表现。无论是在图像、音频和视频理解,还是数学推理方面,Gemini Ultra在大型语言模型(LLM)研发中广泛使用的32个学术基准中,有30个基准的表现超过了目前最先进的结果。

其中,最高阶的Gemini Ultra在MMLU(大规模多任务语言理解)上的得分高达90.0%,成为第一个在MMLU上超越人类专家的模型。

Gemini的强大理解力在视频展示中得到了充分体现。在展示的简单手绘汽车图中,Gemini准确地判断出哪辆跑得更快,并给出了“右边跑得更快,因为它更符合空气力学”的答案。

为满足不同规模和设备的需求,Gemini共推出三个版本:

  • Ultra:功能最强大的版本,适用于处理高度复杂的任务。Google正在进行安全测试,预计明年向企业客户和开发者推出少量试用版。
  • Pro:可扩展各种任务的理想选择,已应用于英文版的聊天机器人Bard。
  • Nano:最有效的设备端任务模型,专为Pixel 8 Pro手机设计。

Gemini将全面融入Google的各项服务。AI聊天机器人Bard已开始使用Gemini Pro的微调版本进行更高级的推理、计划和理解等任务。这是Bard自推出以来的最大升级,预计将在170多个国家和地区提供英语版本,并计划扩展到更多模式和语言。

Google还将Gemini引入Pixel系列手机。Pixel 8 Pro成为首款搭载Gemini Nano的智能手机,支持Recorder应用中的Summarize等功能,无需连接网络即可在手机上整理会议录音档。明年还将推出更多应用,例如从WhatsApp开始推出的Gboard中的Smart Reply功能。

在未来几个月,Gemini将出现在更多产品和服务中,包括搜索、广告、Chrome和Duet AI。

Google及Alphabet首席执行官Sundar Pichai表示:“这是我们迄今为止最强大、最全面的模型。我对未来以及Gemini将为世界各地的人们带来的机会感到非常兴奋。”

标签: 比特币挖矿