就在我们还被 OpenAI 的 Sora 的实际效果所震撼,惊叹于未来已经到来的时候。 短短一个月时间,OpenAI的“家”被偷走了,北京时间昨晚凌晨,Anthropic宣布正式发布Claude-3,拥有三种高性能模型形态,并宣布在AI逻辑基准测试中超越ChatGPT-4。
可能很少有国内合作伙伴知道Claude,这是一款在海外备受关注、用户基数庞大的AI模型,从GPT诞生之初就爱上了GPT,在AI性能排行榜上都在追赶它。 它也是一个基于GPT(Generative Pre-trained Transformer)技术的大型语言模型,通过对大规模文本数据的预训练,学会了理解和生成自然语言的能力。
亚马逊今天宣布使用 Claude3 来优化其业务逻辑
该系列由三个独特的型号组成:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,每个型号都专注于性能和功能,旨在满足各种应用的需求。
claude 3 haiku
Haiku 模型以其极快的处理能力和具有成本效益的价格而著称。 它能够在短短三秒钟内读取数据密集的 ARXIV 研究**,其中包含大约 10,000 个标记,包括对图表和图形的理解。 Haiku 特别适用于需要极高处理速度但性能负载相对较轻的平台。
claude 3 sonnet
十四行诗模型在大多数工作负载上比 Claude 2 和 Claude 2 更快1、且模型性能与性能一致,并提供更高级别的智能分析能力。 它特别擅长处理需要快速响应的任务,例如知识检索和销售流程自动化等。
claude 3 opus
Claude 3 Opus 是该系列中的高端型号,具有与市场上其他顶级型号相媲美的复杂视觉处理能力,能够处理各种视觉格式,包括图表、图形和技术。 相较于 Claude 21. OPUS使解决开放式问题的准确性翻了一番,同时也大大降低了错误答案的比例。
其他亮点:
全系列型号可处理超过 100 万个标记输入,为需要更多处理能力的客户提供可靠的支持。 Claude 3 系列擅长执行复杂的多步骤指令,尤其是在遵循品牌基调和响应指南方面,创造用户可以信任的客户体验。 此外,这些模型还擅长生成流行的结构化输出格式,例如 JSON。
现在,OPUS 和 Sonnet 可以通过 API 获得,开发人员现在可以注册并开始体验这些尖端模型的强大功能。 例如,PoE 已经支持 Claude-3-Opus 模式,购买 PoE“月卡”后即可体验。
超越 GPT-4; 兼顾视觉功能
根据 Anthropic 的说法,Claude 3 OPUS 在 4 项 AI 标准测试中超过了 GPT-10,包括 MMLU(本科水平知识)、GSM8K(小学数学)、Humaneval(编程)和 hellaswag(常识)。
其中一些胜利的差距非常小,例如Opus,他在MMLU的五次尝试中获得了86分8 分,而 GPT-4 得到 86 分4. 有些差距较大,例如 90 在 humaneval opus 上7 分,而 GPT-4 得分 67 分0%。这可能意味着 Claude 3 对新手编码员更友好。
与前代产品相比,Claude 3 系列在分析、内容创建、生成和多语言对话方面有所改进。 据报道,这些模型还具有增强的视觉功能,允许这些模型使用图形、图表和图形等视觉格式,类似于 GPT-4V 和谷歌的 Gemini
在实际测试中,Claude 3 的 PDF 解释速度比 GPT-4V 快,中文输出的逻辑和优化明显优于上一代,也达到了 GPT-4 替代的水平。