Google推出原生多模态AI模型Gemini，挑战GPT-4

linx 2024-10-19 09:37:06 3

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

Google正式发布全新原生多模态AI模型——Gemini。该模型堪称Google迄今为止最强大、最全面的AI工具，具备同时处理文字、代码、音频、图像和视频等多种类型信息的能力。

不同于以往将不同功能模块拼接起来的AI模型，Gemini作为从头开始构建的多模态AI，其设计灵感源于人类的五感，能够像人类一样全面且无缝地理解、操作和整合不同类型的信息，无论是文字、代码、音频、图像还是视频，都难不倒它。其性能远超单一功能模型组合后的效果。

Google对Gemini模型进行了严格的测试，评估其在众多任务中的表现。无论是在图像、音频和视频理解，还是数学推理方面，Gemini Ultra在大型语言模型（LLM）研发中广泛使用的32个学术基准中，有30个基准的表现超过了目前最先进的结果。

其中，最高阶的Gemini Ultra在MMLU（大规模多任务语言理解）上的得分高达90.0%，成为第一个在MMLU上超越人类专家的模型。

Gemini的强大理解力在视频展示中得到了充分体现。在展示的简单手绘汽车图中，Gemini准确地判断出哪辆跑得更快，并给出了“右边跑得更快，因为它更符合空气力学”的答案。

为满足不同规模和设备的需求，Gemini共推出三个版本：

Ultra：功能最强大的版本，适用于处理高度复杂的任务。Google正在进行安全测试，预计明年向企业客户和开发者推出少量试用版。
Pro：可扩展各种任务的理想选择，已应用于英文版的聊天机器人Bard。
Nano：最有效的设备端任务模型，专为Pixel 8 Pro手机设计。

Gemini将全面融入Google的各项服务。AI聊天机器人Bard已开始使用Gemini Pro的微调版本进行更高级的推理、计划和理解等任务。这是Bard自推出以来的最大升级，预计将在170多个国家和地区提供英语版本，并计划扩展到更多模式和语言。

Google还将Gemini引入Pixel系列手机。Pixel 8 Pro成为首款搭载Gemini Nano的智能手机，支持Recorder应用中的Summarize等功能，无需连接网络即可在手机上整理会议录音档。明年还将推出更多应用，例如从WhatsApp开始推出的Gboard中的Smart Reply功能。

在未来几个月，Gemini将出现在更多产品和服务中，包括搜索、广告、Chrome和Duet AI。

Google及Alphabet首席执行官Sundar Pichai表示：“这是我们迄今为止最强大、最全面的模型。我对未来以及Gemini将为世界各地的人们带来的机会感到非常兴奋。”

标签: 比特币挖矿

本文地址: https://www.famikj.com/qkzx/16259.html

文章来源: 酷玩网