AI Moment:GPT 4最强对手登场! 克劳德 3 AI 模型发布

小夏 科技 更新 2024-03-05

就在我们还被 OpenAI 的 Sora 的实际效果所震撼,惊叹于未来已经到来的时候。 短短一个月时间,OpenAI的“家”被偷走了,北京时间昨晚凌晨,Anthropic宣布正式发布Claude-3,拥有三种高性能模型形态,并宣布在AI逻辑基准测试中超越ChatGPT-4。

可能很少有国内合作伙伴知道Claude,这是一款在海外备受关注、用户基数庞大的AI模型,从GPT诞生之初就爱上了GPT,在AI性能排行榜上都在追赶它。 它也是一个基于GPT(Generative Pre-trained Transformer)技术的大型语言模型,通过对大规模文本数据的预训练,学会了理解和生成自然语言的能力。

亚马逊今天宣布使用 Claude3 来优化其业务逻辑

该系列由三个独特的型号组成:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,每个型号都专注于性能和功能,旨在满足各种应用的需求。

claude 3 haiku

Haiku 模型以其极快的处理能力和具有成本效益的价格而著称。 它能够在短短三秒钟内读取数据密集的 ARXIV 研究**,其中包含大约 10,000 个标记,包括对图表和图形的理解。 Haiku 特别适用于需要极高处理速度但性能负载相对较轻的平台。

claude 3 sonnet

十四行诗模型在大多数工作负载上比 Claude 2 和 Claude 2 更快1、且模型性能与性能一致,并提供更高级别的智能分析能力。 它特别擅长处理需要快速响应的任务,例如知识检索和销售流程自动化等。

claude 3 opus

Claude 3 Opus 是该系列中的高端型号,具有与市场上其他顶级型号相媲美的复杂视觉处理能力,能够处理各种视觉格式,包括图表、图形和技术。 相较于 Claude 21. OPUS使解决开放式问题的准确性翻了一番,同时也大大降低了错误答案的比例。

其他亮点:

全系列型号可处理超过 100 万个标记输入,为需要更多处理能力的客户提供可靠的支持。 Claude 3 系列擅长执行复杂的多步骤指令,尤其是在遵循品牌基调和响应指南方面,创造用户可以信任的客户体验。 此外,这些模型还擅长生成流行的结构化输出格式,例如 JSON。

现在,OPUS 和 Sonnet 可以通过 API 获得,开发人员现在可以注册并开始体验这些尖端模型的强大功能。 例如,PoE 已经支持 Claude-3-Opus 模式,购买 PoE“月卡”后即可体验。

超越 GPT-4; 兼顾视觉功能

根据 Anthropic 的说法,Claude 3 OPUS 在 4 项 AI 标准测试中超过了 GPT-10,包括 MMLU(本科水平知识)、GSM8K(小学数学)、Humaneval(编程)和 hellaswag(常识)。

其中一些胜利的差距非常小,例如Opus,他在MMLU的五次尝试中获得了86分8 分,而 GPT-4 得到 86 分4. 有些差距较大,例如 90 在 humaneval opus 上7 分,而 GPT-4 得分 67 分0%。这可能意味着 Claude 3 对新手编码员更友好。

与前代产品相比,Claude 3 系列在分析、内容创建、生成和多语言对话方面有所改进。 据报道,这些模型还具有增强的视觉功能,允许这些模型使用图形、图表和图形等视觉格式,类似于 GPT-4V 和谷歌的 Gemini

在实际测试中,Claude 3 的 PDF 解释速度比 GPT-4V 快,中文输出的逻辑和优化明显优于上一代,也达到了 GPT-4 替代的水平。

相似文章

    超越 GPT 4!谷歌发布最强大的多模态大型模型 Gemini

    月日凌晨,谷歌在其官网上发布了一款全新且功能最强大的多模态大模型 双子座。据悉,Gemini 有 Ultra Pro Nano 三个版本,可以自动生成文本 总结内容等,并理解 音频和 内容。在 MMLU Drop Hellaswag GSMK 等主流评测中,Gemini Ultra 的能力全面超越 ...

    接近 GPT 4 开源模型大泄密,AI 社区炸锅! Mistral首席执行官透露,这是一个旧模型

    编辑 埃涅阿斯已经破案了!让不少网友抓心痒痒的全新开源模型Miqu,确实是Mistral训练模型的老定量版本,在LLAMA 上进行了重新训练。今天,Mistral的首席执行官亲自证实了这一点。这位首席执行官表示,该模型是从抢先体验客户那里泄露的过于热情的员工。这几天,这个在AI界引发热议的悬而未决的...

    LLM 代理如何使 GPT 4V ision 成为通用 Web 代理

    开发seeact 一种通用 Web 代理,利用 GPT V 等大型多模态模型 LMM 的功能来集成 Web 视觉理解和操作。LMM 已被证明在通用 Web 代理方面具有巨大潜力,给定定位方法,在真实网站上的成功率为 GPT V 还展示了令人印象深刻的功能,例如纠错和长期规划。然而,细粒度的视觉定位仍...

    OpenAI 回答了 GPT 4 变得“没有动力”的原因。

    根据用户投诉,他们声称在高峰时段使用 GPT 或 ChatGPT 时收到了非常缓慢和敷衍的响应。有时甚至会出现对话中断。有用户指出,当他们要求一段 GPT 输入时,系统通常只提供一些信息,然后要求用户自行完成其余部分。有时,GPT 甚至会简单地回答 你可以自己做 这种现象在高峰时段更为明显,可能会对...

    GPT 4 在《自然》杂志上刊登!诺贝尔奖获得者的复杂反应可以轻松完成

    近日,基于GPT 等大型语言模型的大型语言模型AI系统Coscientist成功登上 自然 杂志。它可以快速准确地自主完成化学实验的所有步骤,从检索信息到设计解决方案,再到控制设备和分析数据,展示了AI大模型在化学领域的应用前景。据了解,CoScientist由卡内基梅隆大学研究团队开发,由五个模块...