Predibase 是 LLM(大型语言模型)微调的领先开发平台,它推出了 LoRa Land,这是 25 个开源微调模型的集合,该公司声称这些模型可以挑战甚至超越非常流行的 OpenAI 的 GPT-40。
LoRa Land 由 Predibase 的无服务器微调端点和开源 LoRax 框架提供支持。 新平台提供了广泛的用例,从情绪分析到摘要。
GPT-4 是世界上使用最广泛的 LLM 之一, 对于 LoRa Land 来说,超越它是一项艰巨的挑战。 然而,Predibase似乎对其最新产品的功能充满信心。 该公司声称,LoRa Land 为组织提供了一种更具成本效益的方式来训练高度准确和专业的 GenAI(生成式人工智能)应用程序。
由于从头开始构建 GPT 模型和微调 LLMS 的成本高得令人望而却步,使用专门的 LLMS 正成为一种流行的替代方案,而这正是 Predibase 可能在竞争格局中定位 LoRa Land 的地方。
开发人员使用更小、更专业的 LLMS,利用参数高效微调和低级适配等技术来创建高性能 AI 应用程序,以降低微调 LLMS 的成本。 Predibase表示,它已将这些技术集成到自己的平台中,使用户可以选择最适合其应用的LLM,并对其进行相应的微调。
传统上,微调的 LLM 投入生产成本如此之高的原因之一是它们需要为每个模型配备专用 GPU。 对于需要部署 LLM 以解决各种用例的用户来说,GPU 费用加起来是增长和创新的主要障碍。 虽然通过 API 访问 LLM 的初始实验相对便宜,但当部署完全实现时,成本可能会迅速上升。
从资源的角度来看,微调开源 LLM 不仅成本高昂,而且存在缺乏 AI 技能的主要问题,这是采用 AI 的主要障碍之一。
Predibase 通过设计 LoRa Land 在单个 GPU 上为多个微调的 LLM 提供服务,克服了成本挑战。 根据 Predibase 的说法,LoRa Land 中的 25 个 LLM 能够以低于 8 美元的平均 GPU 成本进行微调。 这不仅更便宜,而且用户也不必等待 GPU 预热启动后再微调每个型号。 LoRa Land 提供的其他优势包括高度可扩展的基础设施模型以及即时部署和提示。
Predibase 联合创始人兼首席执行官 Dev Rishi 表示:“组织越来越认识到为不同的用例和客户拥有许多更小、更精细的模型的好处。 “根据内部数据,65%的受访组织计划在未来12个月内部署两个或更多微调的LLM,18%的组织计划部署六个或更多。 ”
LoRa Land 提供的效率和可负担性为 AI 竞赛中的小公司提供了公平的竞争环境。 对于希望部署各种专业 LLM 以推动其业务向前发展的公司来说,这是个好消息。
新平台的引入不仅提供了技术创新,而且有可能改变人工智能发展的格局。 Predibase 渴望以其高性能、成本效益和可访问性为行业树立新标准。