大观数据吉大旗垂直模式聚焦行业细分,是企业首选

小夏 科技 更新 2024-01-30

为了对通用模型和垂直模型的发展方向和应用效果进行深入研究,大观数据CTO季大琪接受了第一新声音的专访,以企业实践为切入点,共同开发通用VS垂直模型的演进方向。

根据相关**报告,全球最大的大型模型开源社区 Hugging Face 上的预训练模型数量已从 100,000 个增加到超过 300,000 个。 回到国内市场,根据公开资料不完全统计,截至2024年11月底,国内至少有200+大车型上市,各行各业大车型“落地”。 从统计数据来看,除一般大模型外,金融行业的落地速度最快,近15%的大模型为金融垂直大模型。

大观数据7月23日推出的“曹志”大模型,是国内首批专用于垂直行业的国产GPT大语言模型,具有自主可控,具有长文本化、垂直化、多语言化特点,擅长长文档撰写、审稿、翻译等

大观数据CTO季大琦表示:“大观数据一直专注于TOB领域,在金融、制造等行业积累了深厚的专业经验。 我们采取的落地路线是将大模型引入原有产品中,为客户提供更有价值的服务。 例如,过去大观的智能文本处理平台IDPS主要偏向于文本提取,需要标注、训练、调优等复杂步骤才能达到效果。 但是,现在可以使用大模型实现无标签的自动提取,从而显着降低了交付成本。 让企业真正降本增效。 ”

通用模型和垂直模型都有其独特的功能,它们是互补的。 由于通用大模型具有较强的语言理解能力,因此可以拓宽应用范围的广度,而垂直大模型则针对特定行业或需求,在精度和深度方面可以更好地满足实际要求。 这两者不是对立的,而是相辅相成、协同发展的。 未来,两类大模式将共存,成为赋能千行百业的关键。

姬大琦也同意这个观点,“他说通用模型和垂直模型需要有更强的泛化能力,而垂直模型在垂直行业的应用中必须保持较高的精度

在谈到通用机型和立式机型的落地空间时,他认为核心区别之一就是在客户需求方面,不同层次和规模的客户对大机型有不同的要求。 例如,在TOC或中小型B端企业中,客户对模型效果的要求较低,但更注重成本控制。 因此,他们可能会选择使用通用的大型模型来解决一些问题,以便以较低的成本获得超乎寻常的结果。

然而,对于一些B端大客户来说,提升性能的能力可以极大地为他们的业务带来显著的影响和价值,因此他们愿意投入更多的成本。 这些客户可能会选择训练大型垂直模型,也可以利用像大观数据这样的专业垂直大型模型服务来获得更好的结果。 在这种情况下,客户的关注点不仅在于成本,还在于如何实现最佳业务成果。

因此,在大模型的应用中,灵活选择适合特定业务场景的模型策略非常重要。

虽然目前大模型的开发非常活跃和活跃,但在实际实现上仍然存在落地问题:如何找到合适的应用场景

姬大琪说,要想让大模型技术真正落地,不仅要依靠大模型本身,还要考虑中间的实现过程和通往最后一公里的路径,即设计合适的产品形态,选择性价比最佳的,控制机器资源成本, 并最终找到最佳着陆效果。因此,有必要有既了解大模型又了解行业的专业人员来共同解决这个问题。

TOB行业的主要问题之一是监管难度越来越大。 在TOC方面,它还必须面对备案等监管要求。 在传统的互联网时代,可以相对容易地对文本内容进行审查,及时发现和处理一些涉及意识形态的问题内容。 然而,大型模型使监管变得更加困难。 因此,在实施过程中,如何进行有效监管成为亟待解决的问题。 否则可能会导致误用、误用或其他潜在的法律问题。 在解决监管问题的同时,我们还需要思考如何让更多的人从大模型的应用中受益。 总之,如何确保合理监管与促进社会效益之间的平衡,是整个行业需要认真思考和解决的关键问题。

客户提供数据后,大观数据的工程团队会根据具体情况进行处理,这一步其实相当顺利。 但更棘手的问题是如何结合大模型,充分发挥数据的价值,赋能企业实现更清晰的业务目标。 这需要明确的业务战略,定义产品的功能和特性,并确保整个过程有效地满足客户的需求。 季大琪强调。

因此,当今所有公司面临的挑战是战略性地思考大型模型的应用,并将这些想法转化为具体的产品设计和实施步骤。 解决这一挑战需要结合数据科学、业务洞察力和技术专长,以形成全面且可操作的解决方案。 最终,通过深入的战略规划和清晰的产品设计,可以更好地利用数据和大模型的潜力,以实现更有针对性和更有效的业务成果。

最后,大观数据CTO季大琦表示,“我们希望在以下两点达成共识首先,未来可能只有少数厂商有能力提供高质量的底层通用大模型,而垂直大模型及其产业应用将迎来很多机会和竞争。未来,多个大型模型可能会同时组合,以解决企业内部的各种问题。 其次,企业的目标是用AI来解决问题,而不是简单地与AI结合。 因此,公司需要考虑人类和机器如何更好地协同工作并解决问题作为起点。 这不是为了使用大模型而追逐大模型”。

相似文章

    好消息!大观数据荣获“长三角百家优秀数字案例企业”。

    近日,中国科协年重点学术活动 第五届中国长三角数字经济大会 在杭州成功举办。本次会议由中国自动化学会 浙江省科协等单位指导,杭州城西科技创新走廊管委会 国科大杭州高等研究院承办。会上,举行了 长三角数字化企业强 颁奖典礼大观数据凭借 大模型 知识图谱驱动的智能质量平台 经过前期各省市协会和专家组的评...

    英伟达主导数据中心利润,遥遥领先

    一般来说,很难在脑海中记住数据中心基础设施支出模型,同时还要了解云和本地支出的趋势,并对主要 IT 供应商进行评分,以确定谁是赢家,谁是赢家。因此,我们建立了一个模型来做到这一点,我们称之为数据中心基础设施报告卡。我们不会给 商家提供字母数字等级,因为金钱是你保持分数的方式,归根结底,它是任何市场中...

    Nvidia Jensen Huang 前往亚洲,专注于数据中心和游戏业务

    英伟达的财报数据简直令人震惊!收入和利润增长猛增,令人瞠目结舌。本季度营业收入增长 达到亿美元 净利润飙升 至亿美元。而且毛利率高达 同比增长 这简直太棒了!英伟达成功的秘诀在于其数据中心业务和游戏业务。凭借雄厚的技术实力和过硬的产品,数据中心业务一路长足进步,为英伟达奠定了坚实的基础。游戏业务也猛...

    大盟数据向科创板备案,前9个月营收447亿,同比增长10%

    雷建平 上 月日 武汉大盟数据库有限公司 简称 大盟数据 近日提交注册,正准备在科创板上市。大盟数据拟募集亿元。其中,亿元用于集群数据库管理系统升级改造项目,亿元用于高性能分布式关系型数据库管理系统升级改造项目,亿元用于新一代云数据库产品建设项目,亿元用于大盟中国数据库产业基地建设项目,亿元用于大盟...