比GPT 4快20倍，最快的模型Grog诞生了！自主研发的LPU是NVIDIA GPU的10倍

小夏科技更新 2024-02-20

Groq 是由 Google 的 TPU 团队创立的一家初创公司，他们推出了一种新型的自研芯片 LPU（语言处理单元），用于大型模型推理加速。非常强大的是，这款芯片在推理速度方面比 NVIDIA GPU 快 20 倍，同时将成本降低到十分之一。 GroQ 芯片采用 14nm 工艺制造，配备 230MB 大 SRAM，片上存储带宽为 80TBS。

GroQ 的 LPU 本质是克服大型语言模型（LLM）的两个主要瓶颈：计算密度和内存带宽。与其他云平台供应商相比，他们的解决方案提供了更快的 LLM 推理性能。 GroQ 已经支持 Mixtral 8x7b、LLAMA 2、7b 和 70b 等模型，并提供 API 访问和演示。他们的目标是在三年内超越英伟达。太强了！！不不不！！是不是太快了！！根本停不下车！！下面就来看看测试结果吧！！

gpt-3.5 的速度是 40 个代币，然后 GPT-4 和 Gemini 的速度大约是 80 个，看看他们完成一个简单的 ** 调试问题所需的时间，速度其实非常快，但 GroQ 完全碾压了 GPT4 和 Gemini，输出速度比 Gemini 快 10 倍，比 GPT-4 快 20 倍。我无法想象！！还有比这更快的吗???

华为的Ascend和Cambrian AI SC芯片有望取代NVIDIA的强GPU实现弯道超车，因为谷歌的ASIC有优势，以后有可能取代Nvidia的GPU。

老黄要卖7万亿美元买下所有GPU，这么大的市场总要被竞争对手顶上，现在面对的不仅是朋友，还有华为等国内芯片厂商！希望我们国内国家乘风破浪，在这场革命中分一杯羹！

喜欢这篇文章的朋友可以点击“关注”！

**10,000粉丝奖励计划

比GPT 4快20倍，最快的模型Grog诞生了！自主研发的LPU是NVIDIA GPU的10倍

相似文章

LLM 代理如何使 GPT 4V ision 成为通用 Web 代理

OpenAI 回答了 GPT 4 变得“没有动力”的原因。

GPT 4 在《自然》杂志上刊登！诺贝尔奖获得者的复杂反应可以轻松完成

OpenAI 回答了 GPT 4 变得“懒惰”的原因。

GPT 4 学会了偷懒，Open AI 正式承认了！网友承诺打赏试试！

比GPT 4快20倍，最快的模型Grog诞生了！ 自主研发的LPU是NVIDIA GPU的10倍

相似文章

LLM 代理如何使 GPT 4V ision 成为通用 Web 代理

OpenAI 回答了 GPT 4 变得“没有动力”的原因。

GPT 4 在《自然》杂志上刊登！诺贝尔奖获得者的复杂反应可以轻松完成

OpenAI 回答了 GPT 4 变得“懒惰”的原因。

GPT 4 学会了偷懒，Open AI 正式承认了！网友承诺打赏试试！

比GPT 4快20倍，最快的模型Grog诞生了！自主研发的LPU是NVIDIA GPU的10倍