编辑:编辑部。
OpenAI 会是下一个吗?
开源社区的另一个中心 Mistral AI 刚刚发布了其最强大的旗舰模型 Mistral Large,性能可直接与 GPT-4 相媲美! (但可惜的是,没有开源)。
Mistral Large 具有出色的逻辑推理能力,能够处理复杂的多语言任务,包括文本理解、转换和生成。
在许多主流基准测试中,Mistral Large 击败了 Anthropic 的 Claude 2 和 Google 的 Gemini Pro,仅次于 GPT-4!
在LLM领域,格局再次发生了变化。
与此同时,就在今天,AI圈又曝出一则重磅消息:继OpenAI之后,Microsoft也将Mistral纳入其麾下!
从一开始,米斯特拉尔就充满了传奇。 成立4周,6人团队,7页PPT,8亿融资(15亿欧元),堪称是一篇很酷的文章。
创始人Arthur Mensch,1993年出生于法国,在谷歌工作了3年后,31岁离开谷歌,招募了两名LLAMA模型的开发者,打造了一家未来可以与OpenAI和Anthropic竞争的公司。
一个由几个人组成的团队,用很少的资金,制作了一个可以与 GPT-4 搏斗的模型。
现在,在基金所有者 Microsoft 的支持下,Mistral 的下一个 OpenAI 头衔得到了确认。
Mistral 不是开源的吗? 网友们惊慌失措!
如今,在全世界的聚光灯下,米斯特拉尔在全世界的聚光灯下,一举一动都非常抢眼。
有网友发现,米斯特拉尔修改了**内容,删除了所有提到开源社区义务的内容,顿时引起恐慌!
上一个主页(左); 当前主页(右)。
但是,目前没有必要太担心。
据外媒采访Mistral的CEO们,他们未来仍将坚持开源的理念,但同时,他们也会推出最强大的闭源模式,参与商业竞争。
现在他们已经完成了以规模命名的开源模型:Mistral 7B 和 Mistral 8 x 7B 的构建,回馈社区,并构建了一条以大、中、小命名的闭源模型赚钱的产品线。
欧洲最强大的模型就在这里!
话虽如此,这次发布的Mistral Large可以说是最适合欧洲人体的大型机型。
简而言之:- Mistral Large精通英语、法语、西班牙语、德语和意大利语,对他们的语法规则和文化背景有深刻的理解。
- Mistral Large 能够处理 32k 代币的上下文内容,使其能够精确、快速地从大型文档中提取信息。
- Mistral Large 在执行特定指令方面非常精确,这使得开发人员可以根据自己的需求定制内容审核策略——例如,Mistral AI 使用它来对 LE Chat 进行系统级审核。
- Mistral Large 原生支持函数调用。 此功能与Mistral AI在La Plateforme上实现的输出内容限制模式相结合,极大地促进了应用程序的开发和技术堆栈的现代化。
目前,Mistral AI 的这种新旗舰模型仅在 Azure AI 和 Mistral AI 平台上可用。
其中,Azure AI 的定价如下: 输出为 0024 USD 1000 代币,输入为 0008 USD 1000 代币。
Mistral Large 最令人印象深刻的是它的超强推理能力。
作为旗舰车型,Mistral Large 在常识、推理和知识方面表现出了令人印象深刻的实力。
虽然与 GPT-4、Claude 2 和 Gemini Pro 1 仍有很大差距0基本上已经是一个失败的人了。
作为欧洲人的大型模型,Mistral Large 在法语、德语、西班牙语和意大利语中的表现优于 Llama 2 70B 模型。
同时,它也比自己的小规模模型更好。
在编程和数学方面,Mistral Large 的能力也很出色。
不仅与其他机型相比有了很大的提升,而且在主流测试基准中也取得了不错的成绩。
小杯子也来了
相比之下,较小的Mistral Small更专注于优化延迟和成本。
与 Mistral 8x7B 相比,Mistral Small 表现出更好的性能和更低的延迟,使其成为介于 Mistral AI 开源模型和旗舰模型之间的解决方案。
与Mistral Large类似,Mistral Small在RAG和函数调用方面使用了创新技术。
此外,mistral 还优化了自己的服务接口:
提供竞争力**的开放式加权端点,包括 open-mistral-7b 和 open-mixtral-8x7b。
推出新的优化模型终结点,包括 mistral-small-2402 和 mistral-large-2402,同时继续提供未更新的 mistral-medium。
配合Microsoft官宣,Mistral AI腰板更硬
除了公布该模型外,Mistral AI还正式宣布了与Microsoft的深度合作。
而这也是Microsoft继OpenAI之后,对AI圈另一家顶级模特公司的第二次实实投资。
虽然 Mistral AI 成立于 2023 年 4 月,但已经对欧洲的 AI 格局产生了重大影响。
开源模型 Mistral 7B 和 Mictral 的发布让开发人员感到惊讶,并在 AI 社区中引起了轩然。
今天来自Microsoft的支持,让更多的人相信米斯特拉尔是下一个OpenAI。
Mistral AI是一家法国AI初创公司,Microsoft与它的合作无疑让Microsoft在欧洲也建立了自己的AI业务。
两家公司合作的目标是弥合基础人工智能研究与现实世界解决方案之间的差距。
如果将来建立多年的合作伙伴关系,Mistral AI将可以使用Microsoft Azure的AI基础设施。
Microsoft的祝福对Mistral AI的意义是不言而喻的。
Mistral AI下一代LLM的开发和部署不仅将大大加快,而且还将开辟新的商机。 总部位于欧洲的Mistral AI将扩大其影响力到全球市场!
具体来说,Microsoft和Mistral AI之间的合作集中在三个关键领域:
超级计算基础结构:Microsoft 将支持 Mistral AI 与 Azure AI 超级计算基础结构,用于 AI 训练和推理工作负载。目前,两家公司尚未披露财务细节。扩展市场:Microsoft 和 Mistral AI 将通过 Azure AI Studio 中的 MaaS 和 Azure 机器学习模型目录向客户提供 Mistral AI 的高级模型。
人工智能研发:Microsoft和Mistral AI将探索合作,为选定的客户开发专有模型,甚至为欧洲公共部门的工作负载开发。
最近,Mistral AI 筹集了 4 美元5亿欧元,由技术投资者安德森·霍洛维茨(Andreessen Horowitz)领投。
然而,与美国的竞争对手相比,Mistral AI显然没有得到太多的资金。
要知道,OpenAI仅从Microsoft就获得了超过100亿美元的投资,Anthropic从谷歌和亚马逊获得了60亿美元的资金。
据华尔街报道,去年 10 月,谷歌承诺向 Anthropic 投资 20 亿美元**。
因此,这次合作一出,Mistral AI的欧洲版OpenAI的名字就更加扎实了。
而对于Microsoft来说,这项投资也有很多好处——这是它在欧洲人工智能领域站稳脚跟的机会。
最初,作为Azure云中欧盟服务器上OpenAI模型的唯一提供商,Microsoft已经引领了欧洲的AI竞赛。
然而,人工智能在欧洲的待遇不如在美国。
欧洲许多国家对人工智能持保守态度和批评态度,尤其是在数据保护方面。
如果它是欧洲服务器提供商的欧洲人工智能模型,它可能令人放心,也是一个很好的补救措施。
9个月前成立的传奇AI创业公司,挑战硅谷巨头
Mistral的6人团队,7页PPT,种子轮融资时8亿融资的故事值得一讲。
2023年初,仍在谷歌工作的亚瑟·门施(Arthur Mensch)年仅30岁。
一年后,他离开谷歌创办了自己的公司,在短短九个月内估值就达到了 20 亿美元!
Mensch 于 2020 年初加入谷歌,担任 Deepmind 的研究员,他的研究重点是提高人工智能和机器学习系统的效率。 他当时27岁。
后来,他与两个年轻人蒂莫西·拉克鲁瓦(Timothée Lacroix)和纪尧姆·兰普尔(Guillaume Lample)一起决定成立一家公司,以更有效的方式构建和部署人工智能模型。
他们认为,在灵活性方面,小团队可以胜过硅谷的大公司,而开源模型是实现这一目标的工具。
尽管他已经从各种投资者那里筹集了超过 5 亿美元,但与Microsoft支持的 OpenAI、谷歌甚至 Anthropic 相比,他的公司 Mistral AI 仍然有点微不足道。
这些巨头,以及它们大力支持的巨型独角兽,已经投资了数十亿美元来构建世界上最先进的人工智能系统。
但Mensch并不担心与这些庞然大物竞争。
我们的目标是成为人工智能领域资本效率最高的公司,Mensch说。 这就是我们成立的原因。 」
至于刚刚推出的Mistral Large模型,他认为该模型可以与OpenAI最先进的语言模型GPT-4和谷歌的新模型Gemini Ultra竞争某些推理任务。
Mensch透露,开发新车型的成本不到2000万欧元(约合2200万美元)。
Mistral在巴黎总部的办公室。
相比之下,OpenAI 的首席执行官 Sam Altman 在去年 GPT-4 发布时表示,训练其公司大型模型的成本接近 1 亿美元。
随着他们继续以业内最高效的开源模式震惊行业,他们也获得了Microsoft,Nvidia和Salesforce等大公司的认可。
这些巨头还通过现金或计算能力收购了Mistral AI的一小部分股份。
随着 Mistral Large 的发布,他们 7 个月前用 9 页的 PPT 吹嘘的公牛已经完全兑现。
六人团队就是这样形成的。
在巴黎综合理工学院和巴黎高等师范学院学习期间,Arthur Mensch结识了另外两位创始人Timothée Lacroix和Guillaume Lample。
两人都是 Meta AI 团队的成员,Lample 甚至领导了 Llama 的开发。
几个三十出头的年轻人已经在法学硕士发展领域拥有丰富的经验。
当时,世界上,甚至在世界上,拥有构建、培训和优化 LLM 专业知识的人也不超过 100 人。
另外三位是让-查尔斯·萨缪利安(Jean-Charles Samuelian)和总部位于巴黎的健康初创公司ALAN的首席执行官查尔斯·戈林廷(Charles Gorintin),以及法国前数字事务国务秘书塞德里克·奥(Cédric O)。
AI科学家,如何创办自己的独角兽公司
Mensch身材高大,留着一头浓密的黑发,看起来既不像典型的技术极客,也不像通常的CEO。
他的朋友和同事说,他总是一边喝啤酒一边和朋友开玩笑。
作为一名体育爱好者,他在 2018 年提交博士学位前的几个月里用了不到三个半小时跑完了巴黎马拉松**。
从很小的时候起,Mensch 就在学术追求和创业之间徘徊。 他出生在巴黎西郊,父亲是一名物理老师,父亲拥有一家小型科技公司。
这位未来的CEO毕业于法国顶尖的数学和机器学习学校。 他的导师将他描述为一个热情和敬业的学生,可以快速掌握他几乎没有基础的项目。
我确实喜欢探索新事物,Mensch 说。 我很容易感到无聊。 」
在攻读博士学位期间,Mensch 的研究重点是优化软件,以分析磁共振成像 (FMRI) 系统的三维脑图像,该系统可以处理数百万张图像。
2020 年底,Mensch 加入了 Deepmind,在那里他参与了大型语言模型的开发。
2022年,他以第一作者的身份出版了著名的《龙猫**》
这项研究重新定义了 AI 模型的大小、训练它所需的数据量及其性能之间的关系,称为 AI 缩放定律。
随着 2022 年 AI 竞赛的升温,Mensch 对大公司的 AI 实验室发表的关于大型语言模型的研究越来越少并与研究社区分享表示沮丧。
ChatGPT发布后,谷歌决定加速追赶。
Mensch 的团队从 10 人的小团队发展到 30 人,最终发展成为 70 人的大团队。
我觉得我应该在事情变得过于官僚之前离开,Mensch说。 我不想在大科技公司中开发那些不透明的技术。 」
在 2023 年春季向投资者提出的初步提案中,Mistral 批评了由开发专有闭源模型的美国公司主导的新兴寡头垄断。
对于Mensch和他的合作伙伴来说,一个重要的原则是将他们最初的AI系统作为开源软件发布,允许任何人免费使用或修改它。
这也是吸引开发人员和潜在客户的一种方式,他们希望每个人都能更好地控制他们使用的人工智能。
Mensch 说,尽管 Mistral 目前最先进的模型 Mistral Large 不是开源的
在建立商业模式和坚持我们的开源价值观之间找到平衡是非常微妙的。 我们想创造一些新的东西,一种新的架构,但我们也想为我们的客户提供一些额外的产品和服务。 」