今天凌晨,GPT4再次全线超车。 没有所谓的新闻发布会,没有什么华而不实**,只是在X(Twitter)上发了一条帖子。
此次推出的新型号Claude3与谷歌去年发布的Gemini非常相似,它包含了三个不同版本的中杯、大杯和超大杯。
该模型是由 Anthropic 公司发布的,该公司由 2021 年离开 OpenAI 的两兄妹创立,因此有些人认为他们是 OpenAI 逃跑的叛徒。
Anthropic目前估值超过100亿美元,在硅谷仅次于OpenAI,投资者包括谷歌和亚马逊,显然是想利用Anthropic来对抗Microsoft,而Anthropic诞生于OpenAI。 总的来说,这家公司的创始团队确实掌握了GPT模型的很多内部秘密,所以他们产品的实力不容小觑。
去年,Claude1 和 Claude2 模型经常与 GPT3 一起使用5 和 GPT4。 与此同时,去年OpenAI内部发生了一场公开斗争,董事会甚至考虑将OpenAI出售给Anthropic,但对方不同意。
Claude3 有三个不同的版本:Haiku、Sonnet 和 Opus,从低到高都有,成本也相应增加。 评估标准与去年 GPT4 发布进行比较时的 Google Gemini 和 OpenAI 几乎相同。 从数据来看,Claude3 的超大杯版本在纸面上优于 GPT4 和谷歌的 Gemini Ultra。
不同模型之间的比较主要包括几个方面,包括基础知识、大学学科知识、数学、能力和推理能力等,这些方面对于模型能力的评估仍然具有代表性,这也是这些公司广泛使用的标准。
从这里的数据来看,Claude3 其实是因为它有超大杯、中杯和大杯,所以其实似乎只有超大杯的能力比 GPT4 和谷歌的 Gemini Ultra 还要多。
另一个重大改进是,Claude3 现在不太可能拒绝用户的日常任务,因为 Anthropic 看重的一件事是,他们认为大型模型是为人类服务的,因此他们对人类的对齐非常严格。 他们过去一直被批评的特点之一是,他们会拒绝回答许多实际上很常见而不是有害的任务,并且在新版本中,他们降低了错误拒绝率并提高了相应的准确性。
从角度来看,Claude3 API 的产出是每百万个代币 75 美元,远高于现在的 GPT4。 目前,它的两个最强版本仅供 Claude Pro 订阅者使用,而十四行诗的歌词现在免费提供。
然而,虽然 Gemini Ultra 和 Claude3 的两个版本现在都声称在测试中优于 GPT4,但他们在这里使用的 GPT4 仍然是他们去年 2023 年 3 月发布的最早的 GPT 版本之一。 但实际上,我们现在在 OpenAI** 上使用的 GPT4 其实是 GPT4 Turbo,也就是说,这个新版本的能力其实比最初的 GPT4 更明显。
因此,我们还不能确定 Claude 3 和 Gemini Ultra 是否比 GPT4 的实际在线版本更好。
毕竟,大多数人通常完成的不仅仅是他们在测试中展示的任务,因此他们在测试期间表现的小百分点差异对普通人来说可能并不那么重要。
所以最后哪一款更好用,我觉得还是需要大多数用户自己去体验和感受的,那么普通用户哪一款更方便,哪一款推荐。 比如我在ChatGPT上调优提示的经验比较丰富,现在OpenAI的整个生态系统也越来越完整和丰富,所以使用ChatGPT就满足了我目前的需求。
这就是为什么除非是谷歌的大模型或者Anthropic的模型与GPT4相比非常强大,否则我仍然看不出我必须切换到不同的平台才能使用它。 对于大多数人来说,只要你能向OpenAI支付每月20美元的会员费来继续使用它,ChatGPT在很长一段时间内仍然是你的最佳选择。
然而,我很高兴看到 Anthropic 发布 Claude3,其中一个重要原因是竞争和数据中的比较。
估计 OpenAI 不能再坐以待毙了,会希望早点发布他们的 ChatGPT 的下一个版本,所以我想我们可以期待一下。
您如何看待 Claude3 模型? 您可以自己尝试免费的十四行诗,欢迎我们互相交谈。
**10,000粉丝奖励计划