啃书文库 > 生活 >
近期,被叫做“Open人工智能最强竞对”的大模型公司 Anthropic 重拳发布了其第三代AI(人工智能)模型 ——Claude 3 系列模型,包含 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。
其中,Claude 3 Opu 为 Claude 3 系列模型的最强版本,具备接近人类的理解能力,可以灵巧地处置开放式提示和复杂的任务,依据官方给到的资料,其性能全方位超越了 GPT-4。
值得一提的是,Claude 3 系列模型具备与其他领先模型同等的复杂视觉功能,可以处置各种视觉格式,包含照片、图表、图形和技术图表。
Anthropic 在其官方 X 上表示,Claude 3 系列模型“在推理、数学、编码、多语言理解和视觉方面树立了新的行业基准”。
据介绍,Claude 3 Opus 和 Claude 3 Sonnet 现已可以通过 API 直接访问。现在,API 也已全方位开放,开发职员可立即开始用这类模型。
另外,Claude 3 Sonnet 还可以供部分区域的用户在网站(http://claude.ai)上免费体验,而 Claude 3 Opus 的用法权限,则只开放给了 Claude Pro 用户。
除此之外,Anthropic 团队还表示,Claude 3 系列模型解决了之前模型常常出现“非必须的拒绝”的问题。
智能新标准
测评结果显示,Claude 3 Opus 在 人工智能 系统的大部分常用评估基准上都优于相同种类商品,包含本科生水平的专家常识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)等。它在复杂任务上表现出了接近人类水平的理解力和流畅性,“引领着通用智能的前沿”。
所有 Claude 3 模型在剖析和预测、细微内容创建、代码生成与西班牙语、日语和法语等非英语语言对话方面的能力都得到了提升。
近乎即时的结果
Claude 3 系列模型支持实时顾客聊天、自动完成和数据提取任务,在这类任务中,响应是即时和实时的。
其中,Claude 3 Haiku 是市场上同智能类别中速度最快、性价比最高的模型。它可以在三秒内读取 arXiv 上一篇信息和数据密集的研究论文(约 10k token),并附带图表和图形。
在绝大部分工作负载中,Claude 3 Sonnet 的智能水平比 Claude 2 和 Claude 2.1 高出了 2 倍。它在常识检索或销售智能化等需要迅速响应的任务中表现出色。Claude 3 Opus 的速度要慢一些,与 Claude 2 和 Claude 2.1 类似,但智能水平更高。
准确性提升
与 Claude 2.1 相比,Claude 3 Opus 在具备挑战性的开放式问题上的准确率(或正确答案)提升了两倍,同时也降低了错误答案。
除去做出更可信的回答外,Claude 3 系列模型为来将启用引用功能,如此就能通过指出参考资料中的精确句子来验证答案。
200K 上下文窗口和近乎完美的记忆
目前,Claude 3 系列模型可提供 200K 上下文窗口。不过,所有三种型号都能同意超越 100 万个 token 的输入,将来也会会向需要增强处置能力的特定顾客提供这种服务。另外,Claude 3 Opus 达成了接近完美的召回率,准确率超越 99%。
Anthropic 团队表示,为提升模型的安全性和透明度,他们将继续开发诸如宪法AI(Constitutional 人工智能)等办法,并对模型进行微调,以减轻新模式可能带来的隐私问题。
虽然与之前的模型相比,Claude 3 系列模型在生物常识、互联网有关常识和自主性等重要指标上获得了进步,但依据“负责任扩展政策”( Responsible Scaling Policy),仍处于 人工智能 安全等级 2(ASL-2)。红队评估结果显示,Claude 3 系列模型现在导致灾难性风险的可能性微乎其微。
更易于用
Claude 3 系列模型更擅长遵循复杂的多步骤指令。它们特别善于遵循品牌声音和响应准则,并开发出用户可以信任的面向顾客的体验。除此之外,Claude 3 系列模型更擅长以 JSON 等格式生成时尚的结构化输出,从而更易于指导自然语言分类和情感剖析等用例。
在官方博客的最后,Anthropic 团队写道:
“在推进 人工智能 能力进步的同时,大家也同样致力于确保大家的安全防护手段可以跟上性能飞跃的节奏。大家的假设是,站在 人工智能 进步的前沿是引导其走向积极社会成就的效果最好方法。”
参考链接:
https://www.anthropic.com/news/claude-3-family
- 上一篇:找对象内卷的意思是
- 下一篇:柚子如何弄不苦 什么样的柚子不苦
猜你喜欢
- 2024-03-01 二阶堂富美个人资料|图片|演过的电影电视剧
- 2024-02-21 红海危机持续,报告显示全球Supply chain受损程度超疫情早期吗
- 2024-02-20 AirPods2024换C口
- 2024-02-12 廉赛个人资料|图片|演过的电影电视剧
- 2024-02-10 于海个人资料|图片|演过的电影电视剧
- 2024-02-09 airpods pro2支持无线充电吗
- 2024-01-16 airpods pro2尺寸大小
- 2024-01-14 快压是什么管理系统
- 热点排行
- 热门推荐
- 热门tag