Anthropic正式推出了其新一代模型系列——「Claude 3」,并宣称这一系列在性能上超越了GPT-4,甚至能够与人类的理解能力相媲美。
由亚马逊和Google投资支持的Anthropic在本周发布了Claude 3系列模型,该系列被认为在包括GPT-4在内的所有对手中表现卓越,是目前市场上最快、最强大的模型,并且在某些任务上展示出接近人类的能力。
「今日,我们自豪地宣布Claude 3系列模型的发布,这一系列模型在广泛的认知任务上设定了新的产业标杆。」Anthropic在其官方网站上这样表述。
Anthropic推出了三种不同型号的Claude 3模型:Haiku、Sonnet和Opus,按性能从低到高排列,以满足不同用户的需求和预算。目前,Sonnet和Opus可在Claude.ai及Claude API中使用;Opus的使用则需要订阅每月20美元的Claude Pro服务,而Haiku也即将与大家见面。
针对不同的应用场景,Anthropic为每款模型设定了独特的定位:
Claude 3 Opus:作为Anthropic最先进的模型,具备接近人类的理解能力和流畅度,适用于处理极其复杂任务和开放式提示词。
Claude 3 Sonnet:在智能与速度之间取得平衡,提供更实惠、高性价比的解决方案,专为大规模AI应用设计,以实现高耐用性。
Claude 3 Haiku:轻巧且快速,具有即时响应能力,适用于快速回答简单问题,并在用户互动中发挥关键作用。
Anthropic声称,在多项测试中,最强大的Opus模型均优于市场上的其他AI模型,包括大学水平的专家知识(MMLU)、研究生水平的专业推理(GPQA)以及基础数学(GSM8K),并在复杂任务上展现出接近人类水准的理解能力和流畅度。
图/Anthropic
Claude 3系列模型在视觉能力上也与竞争对手相当,能够处理从照片、图表到技术图表等多种复杂的视觉内容。
Anthropic强调,许多客户的知识库中超过一半的内容都是PDF、流程图和演示文稿等视觉材料,他们很高兴能够提供这种新型模态。值得注意的是,尽管Claude 3系列模型能够处理图像,但并不生成图像内容。
图/Anthropic
根据《CNBC》的报道,Anthropic表示Claude 3能够处理约15万个单词(20万代币)的文本,相当于《白鲸记》或《哈利波特:死神的圣物》的篇幅,而之前的版本只能处理约7.5万个单词。
在Anthropic公布的数据中,最轻量的Haiku模型可以在不到3秒的时间内处理包含复杂图表、1万代币规模的研究论文。
在定价方面,Anthropic为Opus设定了15美元/每百万代币的输入费用和75美元/每百万代币的输出费用,这一价格高于GPT-4 Turbo的10美元/每百万代币输入和30美元/每百万代币输出,这也可能反映了Anthropic对自家模型的自信。
大幅降低模型「幻觉率」,Anthropic致力于让Claude 3更加安全
聊天机器人容易受到误导或对问题理解不充分,从而给出错误的答案,这种现象被称为「幻觉」(hallucination),也是假新闻产生的潜在原因。
Anthropic试图通过Claude 3来解决这一问题,声称在测试一系列特别复杂和困难的问题时,Opus模型回答的正确率已达到旧模型的两倍以上,大幅降低了错误回答的比例。然而,他们也坦诚地表示,要完全解决这个问题是非常困难的,「幻觉率降至零几乎是不可能的。」Anthropic总裁阿莫戴(Daniela Amodei)这样说道。
「没有一个模型是完美的,我认为我们应该事先明确这一点。」阿莫戴强调,「我们正尽全力使模型更加安全和强大,但偶尔仍会有错误发生。」
标签: 比特币挖矿