根据相关**报告,全球最大的大型模型开源社区 Hugging Face 上的预训练模型数量已从 100,000 个增加到超过 300,000 个。 回到国内市场,根据公开资料不完全统计,截至2024年11月底,国内至少有200+大车型上市,各行各业大车型“落地”。 从统计数据来看,除一般大模型外,金融行业的落地速度最快,近15%的大模型为金融垂直大模型。
大观数据7月23日推出的“曹志”大模型,是国内首批专用于垂直行业的国产GPT大语言模型,具有自主可控,具有长文本化、垂直化、多语言化特点,擅长长文档撰写、审稿、翻译等
大观数据CTO季大琦表示:“大观数据一直专注于TOB领域,在金融、制造等行业积累了深厚的专业经验。 我们采取的落地路线是将大模型引入原有产品中,为客户提供更有价值的服务。 例如,过去大观的智能文本处理平台IDPS主要偏向于文本提取,需要标注、训练、调优等复杂步骤才能达到效果。 但是,现在可以使用大模型实现无标签的自动提取,从而显着降低了交付成本。 让企业真正降本增效。 ”
通用模型和垂直模型都有其独特的功能,它们是互补的。 由于通用大模型具有较强的语言理解能力,因此可以拓宽应用范围的广度,而垂直大模型则针对特定行业或需求,在精度和深度方面可以更好地满足实际要求。 这两者不是对立的,而是相辅相成、协同发展的。 未来,两类大模式将共存,成为赋能千行百业的关键。
姬大琦也同意这个观点,“他说通用模型和垂直模型需要有更强的泛化能力,而垂直模型在垂直行业的应用中必须保持较高的精度
在谈到通用机型和立式机型的落地空间时,他认为核心区别之一就是在客户需求方面,不同层次和规模的客户对大机型有不同的要求。 例如,在TOC或中小型B端企业中,客户对模型效果的要求较低,但更注重成本控制。 因此,他们可能会选择使用通用的大型模型来解决一些问题,以便以较低的成本获得超乎寻常的结果。
然而,对于一些B端大客户来说,提升性能的能力可以极大地为他们的业务带来显著的影响和价值,因此他们愿意投入更多的成本。 这些客户可能会选择训练大型垂直模型,也可以利用像大观数据这样的专业垂直大型模型服务来获得更好的结果。 在这种情况下,客户的关注点不仅在于成本,还在于如何实现最佳业务成果。
因此,在大模型的应用中,灵活选择适合特定业务场景的模型策略非常重要。
虽然目前大模型的开发非常活跃和活跃,但在实际实现上仍然存在落地问题:如何找到合适的应用场景
姬大琪说,要想让大模型技术真正落地,不仅要依靠大模型本身,还要考虑中间的实现过程和通往最后一公里的路径,即设计合适的产品形态,选择性价比最佳的,控制机器资源成本, 并最终找到最佳着陆效果。因此,有必要有既了解大模型又了解行业的专业人员来共同解决这个问题。
TOB行业的主要问题之一是监管难度越来越大。 在TOC方面,它还必须面对备案等监管要求。 在传统的互联网时代,可以相对容易地对文本内容进行审查,及时发现和处理一些涉及意识形态的问题内容。 然而,大型模型使监管变得更加困难。 因此,在实施过程中,如何进行有效监管成为亟待解决的问题。 否则可能会导致误用、误用或其他潜在的法律问题。 在解决监管问题的同时,我们还需要思考如何让更多的人从大模型的应用中受益。 总之,如何确保合理监管与促进社会效益之间的平衡,是整个行业需要认真思考和解决的关键问题。
客户提供数据后,大观数据的工程团队会根据具体情况进行处理,这一步其实相当顺利。 但更棘手的问题是如何结合大模型,充分发挥数据的价值,赋能企业实现更清晰的业务目标。 这需要明确的业务战略,定义产品的功能和特性,并确保整个过程有效地满足客户的需求。 季大琪强调。
因此,当今所有公司面临的挑战是战略性地思考大型模型的应用,并将这些想法转化为具体的产品设计和实施步骤。 解决这一挑战需要结合数据科学、业务洞察力和技术专长,以形成全面且可操作的解决方案。 最终,通过深入的战略规划和清晰的产品设计,可以更好地利用数据和大模型的潜力,以实现更有针对性和更有效的业务成果。
最后,大观数据CTO季大琦表示,“我们希望在以下两点达成共识首先,未来可能只有少数厂商有能力提供高质量的底层通用大模型,而垂直大模型及其产业应用将迎来很多机会和竞争。未来,多个大型模型可能会同时组合,以解决企业内部的各种问题。 其次,企业的目标是用AI来解决问题,而不是简单地与AI结合。 因此,公司需要考虑人类和机器如何更好地协同工作并解决问题作为起点。 这不是为了使用大模型而追逐大模型”。