ChatGPT在2022年底的诞生,无疑是人类AI发展史上划时代的大事件。 相较于Alexnet在2012年横扫ImageNet掀起深度学习浪潮,2016年Alphago击败李世石掀起全球人工智能热潮,ChatGPT似乎一夜之间跨过了高不可攀的“图灵测试”门槛,开启了AGI的新范式,也宣告了AI行业正式进入2。0 次。
凭借十余年在AI算法和工程能力、数据、应用场景等方面的深耕,云之盛迅速拥有行业领先的通用大模型和行业大模型,并实现了大模型的大规模商用落地,成为行业内为数不多的同时具备通用大模型和大规模商用的企业之一。 这是云之盛新的里程碑,标志着云之盛正式踏上了迈向AGI时代的新征程。
具体而言,作为一家具有深度算法和工程能力的前沿AI企业,云之盛凭借其近十年在深度学习、BERT预训练大模型、Atlas基础设施、海量数据和产业应用方面的深厚积累,于5月24日成功发布山海大模型(UNIGPT),成为国内首批实现GPT大模型技术升级的团队。 最新版本的山海大模型,一般大模型的能力已经超过了GPT35、接近GPT-4的90%水平,医疗行业的大模型领先于GPT-4和谷歌的MED-PALM2。 这也体现了云之盛的AGI愿景:世界一流的通用能力和世界一流的专业能力。
从高山和海洋起航,学习艺术和科学
ChatGPT所代表的大模型技术范式的升级,不同于以往简单的算法升级,不是简单的“活力奇迹”,而是对一家AI公司的算法基础和工程实力的全面考验,包括前沿机器学习算法的深度积累和海量高质量数据, 以及大规模机器学习的算力储备和工程优化能力。
自2012年以来,云之盛一直跟进CNN、LSTM、Transformer、BERT、GPT等深度学习前沿算法,不断积累海量优质语音和文本数据,并于2016年开始搭建Atlas大规模机器学习平台,可高效调度数千个GPU完成大规模机器学习任务,为生成式大模型训练奠定坚实基础。 2022年底,在下定决心构建山海大模型(UNIGPT)后,我们迅速完成了高性能GPU算力的及时扩容,实现了千亿参数大模型的多机多卡分割,优化了数据、模型和流水线的并行计算,将大模型的预训练效率(单卡利用率达到理论峰值的比例)提升至60%, 这明显处于行业领先水平(行业知名公司为 50%)。
在海量数据、前沿算法和工程能力的支持下,山海大模型不仅在通用能力方面位居行业前列,在多项全球通用任务中表现良好,而且在医疗垂直领域的专业评估性能上也超越了GPT-4和MED-PALM2,标志着山海正式起步。
普遍型能力持续演进,跻身行业前列
2023年7月和8月,山海100亿、1000亿大模型得分603 分和 70以0分的优异成绩,百亿级模型跻身行业前列,千亿级模型的综合能力位居前三,充分印证了山海模式在一般基础能力方面已达到行业第一梯队水平。
中文大型模型对齐评估集(alignbench)是一个多维基准,用于评估模型与人类意图之间的对齐水平。 最新版山海机型6分55分,达到GPT4水平的86%,处于国内领先水平。
医疗增强模型持续增长的能力,走在曲线的前面行业水平
2023年6月,山海模型医疗专业能力取得新突破,在MEDQA任务中超越Google MedPalm2,达到871% 的区别。 此外,在临床执业资格考试中,山海模式的分数提高到523分(满分600分),超过了99%考生的水平。
2023年8月,云之盛基于山海大模型孵化的UNIGPT-MED模型在CCKS 2023 Promptcblue医疗大模型评测(一般赛道)中荣获第一名,大模型的医疗能力再次获得业界认可。
云之盛凭借在智慧医疗领域多年的行业数据、知识和应用经验积累,打造了全球领先的医疗增强模型,不仅在性能上远超GPT-4通用模型,更超越了谷歌的MedPalm2医疗领域模型,拥有数千亿参数,为智慧医疗应用解决方案的升级奠定了坚实的基础。
深入场景,提升效果,拓展边界
山海大模型的综合通用能力及其在医疗领域的强势表现,为云之盛打造了“U+X”实际应用,为大模型技术在众多复杂应用和场景中的落地提供了强有力的技术支撑,并结合多年服务龙头企业客户积累的领域知识和行业落地经验, 为智慧物联网和智慧医疗产业升级提供了更具竞争力的AI产品和解决方案,成为国内首家在行业应用中落地大模型技术的梯队企业。主要应用包括:门诊病历生成、智慧政务服务、车轨人机交互、智能口语学习、蓝藻AIGC平台等。 山海模式不仅在“人机交互”上实现了质的飞跃,也让“门诊病历生成”等新应用成为现实,极大地扩展了AI20 个应用程序边界。
2023年9月,云之盛基于山海模式的门诊病历生成系统落地北京友谊医院,通过一键生成门诊病历,有效提升病历书写效率和质量,成为国内首批重症医疗场景大模型技术商用案例。
2023年10月,云智盛携手深圳龙华数据***,率先在山海模式基础上开发深圳首个政务模式“龙之正”,颠覆传统在线机器问答,实现信息服务从被动人工搜索向主动、双向、实时智能全流程引导的转变,赋能提升治理水平。
2023年10月,云智盛山海模式“入驻”南宁东站,打造更加人性化的智能客服,助力实现中转节点无缝高效换乘,为乘客带来更快、更便捷的出行体验。
2023年10月,云之盛携手吉利新能源品牌瑞澜,基于山海模型打造瑞澜AI模型,实现对用户需求的深刻理解,解锁全车全场景的情感智能交互体验。
2023年12月,基于山海模式的英语学习伙伴Utalk正式上线,专注于读、写、听、说进行全方位的学习训练,致力于满足用户多场景英语学习需求。 目前,utalk用户数量已超过10万。
2024年1月,基于山海模式的AIGC内容创作平台蓝藻AI将开启公测,可为创作者提供AI语音克隆、AI文字配音、AI文案服务,助力内容制作更快、更好、更个性化。
山海交汇屡获行业权威机构认可
微风吹拂明月,山海交汇。 2023年,凭借山海模式在技术创新、场景落地、产品适配等方面的突出表现,将继续得到客户、资本、**的广泛认可和好评,再次证明了山海模式的领先性和竞争性。
2023年6月,基于山海模型的门诊病历生成系统入选北京市人工智能行业首批10大模型应用案例。
2023年7月,云之盛凭借其山海模式入选“北京通用人工智能产业创新合作计划”第二批“示范合作伙伴”; 同时,基于山海模型的门诊病历生成系统入选2023年北京市人工智能产业赋能典型案例。
2023年8月,云之盛凭借在大模型领域的不断耕耘和拓展,成功入选“2023中国AIGC产业图集”。
2023年10月,山海模型获得北京市算法交易服务中心算法模型认证证书,云之盛成为北京算法交易服务中心首批认证企业。
2023年11月,基于山海模型的门诊病历生成系统入选“北京市人工智能产业大模型创新与应用***2023”典型案例。
2023年12月,人民日报在线科技有限公司发起成立“大模范责任联盟”,云之盛成为“大模范责任联盟”首批成员。
2023年12月,山海模型正式通过《生成式人工智能服务管理暂行办法》,面向大型模型在线备案。
2024年1月,山海模型通过与华为Atlas 800训练服务器和华为AI框架Mindspore的兼容性测试,正式获得华为复合证书和认证标志的使用权。
2023年11月,凭借山海大模型突出的商业应用价值,云之盛被嘉子光年评选为“2023中国最具商用潜力AI大模型榜”。
2023年12月,云之盛基于在大模型领域的创新实践,入选2023中国价值企业榜 Investor.com“2023人工智能领域创新企业30强”。
弘扬过去,砥砺未来加速创造一个互联、直观的世界
近十年来,云之盛“上山大海”已经是十年了——十年的技术积累和产业应用积累,为山海大模型的建设奠定了坚实的基础; 未来十年将是云之盛“从山海起航”的十年,从山海大模型出发,从AGI的新征程开始——以通用智能创造一个互联互通、直观的世界。
在UniBrain核心“山海模式”成功升级的同时,多模态感知、生成、知识图谱等全栈AI技术组件也在持续演进,保持行业领先优势
语音识别asr方面在语音识别(ASR)方面,在2023年国际芯片巨头技术POC(样机验证)评测中,云之盛在10项评测指标上超越了全球4家顶级科技公司的竞品,并取得了第一名的成绩,再次证明了其实力在行业中的技术领先地位,并有望在2024年在全球范围内大规模推广应用。
命令识别(KWS)方面,云之盛KWS自由通话摆脱了固定命令词的束缚,让用户更自由地表达自己的需求和意图,并已成功应用于TCL空调等产品,为用户带来更加智能便捷的体验,基于该技术的语音芯片出货量同比增长100%以上。
声纹识别vpr方面在VOXSRC 2023声纹领域权威国际评测中,云智的声纹识别技术在Track1(固定训练集中的说话人确认)中排名第一,在Track2(开放训练集中的说话人确认)中获得第二名,充分印证了其算法的进步。
协助创作aigc方面云之盛TTS、2D数字人、3D渲染、文盛图等多模态生成技术也在不断拓展,为技术与场景的更好融合提供了更多可能。
每一次技术升级,都标志着AGI赋能各行各业道路上的重大进展。 进入2024年,云之盛将继续秉承以人工智能赋能千行百业的初心,持续加大技术创新力度,持续拓展人工智能技术应用边界,携手各界伙伴,共同推动新品质生产力的发展。 让我们一起期待和见证AGI技术与产业的下一次飞跃!