在国内大模型竞争日趋激烈、难以落地的当下,智浦AI的模型有什么特别之处?又能给资本追捧的中国大模式带来哪些不同的思考?
作者 |战斗
制作人 |实业家
对于智璞AI来说,在很长一段时间里,“星捧月”这个词非常贴切。
前段时间,智浦AI最新融资再次引发广泛关注,成为关注的焦点。 公开资料显示,新一轮融资规模已突破25亿元,加上前几轮融资,智浦AI市值已突破100亿。
更值得一提的是豪宅投资人阵容,包括社保**中关村自主创新**(君联资本为**管理人)、美团、蚂蚁、阿里巴巴、腾讯、小米、金山软件、顺为、BOSS直聘、好未来、红杉、高瓴等多家机构,以及包括君联资本在内的一些老股东。
在这场“百模大战”中,智浦AI无疑是大众期待的那一款。
然而值得注意的是,目前知璞AI可以商业化的ChatGPT3只有6B版本,以GPT 3为基准5.商用高参数版本之间还有一段距离。 尤其是在阿里正式开源72b参数模型后,知璞也将面临很大的压力。
一些值得思考的问题是,智浦AI的优势是什么?未来发展的想象在哪里?以及如何解决它目前面临的一些问题?挖掘其频繁筹款的另一面。
1、100亿元的估值是多少?
从3月的第一代开源到7个月后的第三代智浦AI的发展非常迅速
在最新发布的第三代基础大语言模型chatglm3系列中。 官方表示,该机型的性能与上一代相比有了很大的提升,是10B以下最强的基础机型。
具体来说,根据MMLU排序,在各种尺寸的模型对比中,chatglm3-6b的得分排名第9,但前8个模型中最小的也是QWEN-14b,规模为140亿参数,如果按照gsm8k排序,chatglm3-6b-base甚至排名第三,超过 GPT-35 页,共 571分。
由此可见,智普AI追赶OpenAI并非空穴来风。
想要更深入地挖掘智璞AI的优势,就得从国产大模型开发和实现中的诸多问题入手。
一项新技术的价值是几何级的,而商业化是最直接的检验方式。 在国内的大型模型制造商中,可以说大多数还处于技术和开发阶段。 对于商业化,它基本上处于探索阶段。
智璞AI早在成立之前就服务于B端,目前拥有超过1000家客户。 可以看出,其产业落地和商业化前景较大。
实现大型模型的另一个极其重要的前提是数据安全。 作为国内唯一一家完全由内资、国产化的大型样板企业,智璞AI推出了GLM国产芯片适配计划,针对不同类型的用户、不同类型的芯片提供不同级别的认证和测试,能够真正实现安全可控。
从某种意义上说,这一优势完全可以捕捉到中央国企和有特殊要求的大型企业。 “国企央企,如果想做样板能力或准入,知普无论如何都是必然的选择。 一位业内人士对实业家说。
此外,还有人的因素。 在一级市场,早期投资是对人的投资,这适用于所有创业公司。 智浦AI的“前身”是清华KEG(知识工程实验室),CEO张鹏毕业于清华大学,获得计算机科学博士学位刘德兵董事长师从高温院士,曾任清华数据研究院科技大数据研究中心副主任王少兰校长是清华大学创新领域的领军人物。
整体来看,智浦AI具备落地经验、人才齐全、资金充足、技术好等条件。 这种情况也使它率先在大型模型制造商的竞争中脱颖而出。 然而,这只是外观。
在路径选择方面,与更主流的GPT不同,智谱AI使用GLM,智谱AI提出了新的GLM(通用语言模型)路径。 训练效率高于GPT,也能理解更复杂的场景。
在大型模型落地层面,它没有选择推出大型行业模型,而是说服行业客户在通用大模型的基础上进行微调。 在CEO张鹏看来,只有一定规模的通用大模型,才能实现类人认知能力的出现。
此外,为了提高大型语言模型作为AI代理的性能和能力,清华大学和智璞AI推出了一种新的解决方案AgentTuning,可以有效增强开源大型语言模型作为AI代理的能力。
智浦AI之所以能赢得资本和互联网巨头的青睐,不仅在于其技术,还在于其对路径、模式、策略的选择,以及自身大模型底层定位的清晰度。
用CEO张鹏的话来说,智浦AI的全线产品已经对标了OpenAI的产品。
那么,就目前而言,除了经过验证的路径和模型之外,智璞AI还有其他拼图需要完成吗?
2. 商业化、AI开源和不可避免的资金
从智璞AI商业授权的模型版本来看。 它目前限制为 6b,即 60 亿个参数。 从 OpenAI 的开源模型来看,GPT-3 是一个拥有 1750 亿个参数的自回归语言模型,OpenAI 对其进行了部分开源gpt-3.5 有 1375 亿个参数,其中一些也是开源的。
更值得注意的是,阿里最近还开源了 72b 参数模型。 要知道,目前大规模模型应用大多处于大力产生奇迹的阶段,参数越大意味着落地效果越好。
可以发现,虽然智璞AI作为国内首个开源模型,但拥有强大的技术架构不过,OpenAI的模式规模与国内各大厂商的商业授权仍有一定距离。 而随着阿里巴巴开源模型参数更大的发布,智绮AI在6B模型中的优势可能会变弱。
如果你想弥补这个缺点,你需要大量的资金支持。
“如果智浦AI背后也有像Microsoft这样的金融家,那将非常引人注目。 一位业内人士直言不讳地对这位实业家说。
事实上,随着AI大模型能力的不断提升,训练参数自然需要改进,对算力和存储的需求也会增加。 在资金和资源调度方面,这将是一个巨大的问题。
粗略地说,私有化和部署一个规模为130b的大型模型,每年的成本接近4000万,但这4000万在花费时能带来多少价值是未知数。 在大型AI模型的部署方面,目前小企业支付能力较弱,大企业要么自行研发,要么还处于理解认知阶段,很难实现商业化。
钱从哪里来是一个亟待解决的问题。
“开源6b模式的部分原因是告诉市场,我有更好的模式,就看你是否愿意花钱了。 ”一位业内人士对实业家说。 对于智璞AI来说,开源6B展现实力,拉动投资是更明显的解决方案。
另一个解决方案是扩大“朋友圈”。
众所周知,互联网巨头在计算、存储容量和数据资源方面都具有很大的优势。 对于智璞AI来说,这些都需要它投入大量资金来建设。 与巨头合作可以大大降低研发成本,提高研发效率。 此外,智付AI还可以利用云厂商的市场地位和渠道,推广自己的AI技术和服务。
另一方面,由于大模型需要部署在云上,并按照数据运行进行付费,因此用户使用模型和资源越多,对云算力的需求就越大,云厂商的收入也会增加。 此外,云厂商可以利用智普AI的技术实力,提升其在人工智能领域的竞争力。
一般来说,对于云供应商来说,他们可以推动自己的云收入;对于大型模型制造商来说,可以减少基础设施的投入,可谓是一石二鸟。
目前,智普AI已与阿里巴巴、腾讯、美团等企业展开了一系列合作。
由此看来,智浦AI“星捧月”的原因在于其开放、一体化的商业模式,在国内大模型竞争日益激烈、难以落地的当下,能够推动大模型落地,加速大模型生态发展。
智浦AI的这个模型也给自己和国产大模型的未来发展带来了一些新的想象和思考。
三是国产大型车型的未来在首位
“如果该模型可以解雇一半的人,公司将考虑使用它。 在与一位业内人士的交流中,他表达了自己对当前大模型商业化任重道远的看法。
从客观上看,目前国内大型模型业态属于百花齐放,已经开始出现同质化。 这不仅会导致算力等基础设施的不合理使用,还会造成不健康的竞争。
目前,大规模模式落地的进程缓慢,仍在兴起的大规模模式创业热潮,必然会产生大量的泡沫。 对于国内大型模型厂商来说,以生态的力量推动大型模型的商业化无疑是最佳选择。
事实上,国内外主流大模型在算法层面并不存在代际差异但是,在计算能力和数据方面存在差距。
通过大力支持国内通用领域科技龙头企业开发自主可控的国产大模型,同时鼓励各垂直领域利用开源工具,在大模型的基础上构建标准化、可控的自主工具链,逐步构建基础大模型和专业小模型交互共生、迭代演进的良好生态。
随着大型模型生态的日益完善,也会带来一些新的变化。
首先是模型质量的提高。 随着技术的进步和资源的投入,未来的大模型将具有更高的精度、更强的理解力和更广泛的适用性。 这不仅意味着他们能够更好地理解自然语言,而且还能够执行更复杂的任务,例如翻译、推理、创作等。
二是应用范围更丰富。 除了传统的文本处理外,大型模型还将在语音识别、图像生成、理解和推荐系统中发挥更大的作用。 这意味着我们可以在更多场景中享受到AI带来的便利。
另外未来,大模型将更加定制化它可以更好地满足用户的个性化需求。 用户可以根据自己的实际需求选择合适的型号,并自定义配置。 这将使用户能够更灵活地利用大型模型来解决自己的问题。
在大模型生态系统中,数据将变得更加共享和开放。 机构和企业可以加强合作,共享优质数据资源,从而促进大模型技术的发展。 此次合作将为大模型的开发和应用提供更广阔的空间。
新一轮的科技浪潮,必然需要一些企业承担一些使命。 放眼当下,技术架构是大模型问世的重要标准展望未来,要想站在AI大模型的浪潮上,生态建设力量越来越重要。