百川智能发布百川3,超千亿参数大模型,医疗能力接近GPT 4

小夏 文化 更新 2024-02-01

视觉中国。

1月29日,中国人工智能初创公司百川智能发布了百川3,这是一个拥有超过1000亿个参数的大型语言模型。 在CMMLU、Gaokao、Agi-Eval等多项权威通用能力评估中,百川3号展现了卓越的能力。 在CMMLU、Gaokao、Humaneval、MBPP等多个中国评测榜单中,已超越GPT-4,在中文任务中展现出优势。

不同于百亿、百亿参数模型的训练,对数据质量、训练稳定性、千亿以上参数模型的训练效率的要求在训练过程中要高出几个数量级。 为了更好的解决相关问题,百川智能在训练过程中提出了“动态数据选择”、“重要性维护”、“异步检查点存储”等多种创新技术手段和解决方案,有效提升了百创3的能力。

在高质量数据方面,传统的数据筛选依赖于人工定义,通过过滤、质量评分、教科书过滤等方式对数据进行过滤。 百川智能认为,数据优化和采样是一个动态的过程,应该用模型本身的训练过程来优化,而不是仅仅依靠人工进行先验数据采样和筛选。 为了全面提升数据质量,百川智能设计了一套基于因果抽样的动态训练数据选择方案,可以在模型训练过程中动态选择训练数据,大大提高数据质量。

百川智能的医学知识水平也取得了突破性进展。 百川3医疗数据集中的代币数量超过1000亿,医疗容量接近GPT-4。 为了给百川3注入丰富的医学知识,百川智能在模型预训练阶段就构建了超千亿个代币的医学数据集,包括医学研究文献、真实电子病历数据、医学领域的专业书籍和知识库资源、医疗问题问答材料。 该数据集涵盖了从理论到实际操作,从基础理论到临床应用的医学知识的方方面面。

目前,百川智能没有透露模型参数的数量,只是宣布百川3是一个参数超过1000亿的大型模型。 相比之下,GPT-35 是 1750 亿参数。

百川智能由王小川、茹丽云共同创立,于2023年4月以搜狗团队为基础成立。 据报道,自成立以来,该公司已获得5000万美元的启动资金。

百川智能的速度一直非常快。 成立不到100天,百川智能就发布了百川-7B和百川-13B两款开源、免费商用的中国大机型。 从百川1号出发0 到现在 30,只用了9个月。

就在一个月前,2023年12月19日,百川智能宣布开放基于搜索增强的百川2-Turbo系列API,包括百川2-Turbo-192K和百川2-Turbo,并在支持192K上下文窗口的基础上,还增加了搜索增强知识库的能力。

与baichuan2-192k相比,baichuan3在允许输入文本的长度上有所减少。 百川2-192k上线时,允许用户输入多达35万字的文字,声称可以一次阅读《三体2》的副本,成为全球处理上下文窗口最长的最大模型。 目前,baichuan3 允许您输入最多 4096 个字符的文本,相当于 2000 个汉字或 3000 个英文单词。

在过去一年的大规模模型创业中,通过行业数据训练行业垂直大型模型,被认为是大型模型落地B端的主要路径。 据佳子光年介绍,百川智能将向量数据库升级为搜索增强知识库,提升了大模型获取外部知识的能力; 搜索增强的知识库和超长上下文窗口的组合使模型能够连接到所有企业知识库和网络范围的信息。

在去年年底的**沟通会上,王小川透露,百川智能C端产品的第一重点就是医疗方向,产品预计2024年上市。

相似文章

    百川智能发布百川3款超千亿元,称中国评价超越GPT 4

    乐天 上 月日 百川智能今日发布超千亿参数大语言模型百川,称在CMMLU Gaokao Agi Eval等多篇权威通用能力测评中,百川展现了能力,尤其是在中文任务上超越了GPT 。基础能力提升,多项权威评测中文任务成绩超越GPT 据百川情报称,百川在几篇英文评测中表现良好,达到了接近GPT 的水平。...

    百川智能发布大模型角色,游戏、影视行业迎变革!

    月日,大型模型创业公司百川智能发布了角色大型模型百川 NPC。据介绍,百川NPC对 角色知识 和 对话能力 进行了深度优化,使模型能够更好地理解上下文对话的语义,进行更符合角色个性的对话和动作,让角色栩栩如生。长期以来,游戏领域存在AI角色开发成本高 周期长 自由度差 API不稳定等诸多短板。针对上...

    永庆百川怎么特别好,百川特别好永庆方地

    近年来,永庆依托优越的地理位置,缓解了北京的非首都功能,规划了平方公里的空港经济区,结合京冀两省城乡规划,依托交通干线和生态廊道,对接机场功能布局,发展迅速,无论是城市发展还是配套设施,日新月异,所以自然有很多人想在永庆落户,请教永清百川特别怎么样,百川特别好?这边已经整理好了,下面给大家详细的介绍...

    百川智能荣获新浪2023科技风云榜年度潜力创业企业奖

    新浪科技。新浪科技报月日下午报道,由新浪财经客户端 新浪科技联合主办的 科技风云榜 年度盛典今日开幕,今年活动主题为 智跃 活动现场,来自各领域的专家学者 众多行业领袖 行业大佬齐聚一堂,共同提升过去一年行业的变化 热点和趋势,总结过去的得失,畅想新的未来。同时,活动还为过去一年洞察机遇 勇于创新 ...

    大海宽容一切河流,寓意墙立在墙上,无欲无意

    海容万河,无欲则壁僵 是中国古代哲学家墨子提出的经典论断,体现了宽容与坚韧的哲学思想,对生活 社会 治理有着深刻的启示。首先,让我们来破译这个经典的断言。其中,海宽江逸 表达了一种宽容精神。大海是心灵的隐喻,百河代表各种河流和溪流。只有当这海 心 宽广,包罗万河,才能称得上伟大。这里的 包容 不是简...