2月19日,有消息称,AI创业公司“月之暗面”近日完成新一轮融资,融资额超10亿美元(目前约合人民币72亿元),投资方均为中国龙头企业,包括红杉中国、小红书、美团、阿里巴巴等。 这也是自ChatGPT爆火以来,国内AI模型公司迄今为止获得的最大一笔单轮融资。
Moonshot AI成立于2023年3月,2023年已获得超过2亿美元(约合人民币14亿元)的融资,投资者包括红杉中国、郑**等。 经过本轮融资,《月球暗面》的估值已达到约25亿美元(约合人民币180亿元),成为中国大型模型领域的龙头企业之一。
如此高的估值和融资,除了得益于AI大模型热潮外,也离不开创始团队。
公开资料显示,公司核心成员大部分来自清华大学,创始团队核心成员曾参与谷歌双子座、谷歌巴德、盘古NLP、物道等多款大型机型的研发,多项核心技术被谷歌Palm等主流产品采用, Meta Llama 和 Stable Diffusion。
公开资料显示,共同创始核心团队主要有5人。
第一位是主要创始人兼CEO杨志林(78岁96%),清华大学交叉信息研究院助理教授,32岁。高中时,没有编程经验的杨志林被选中参加奥林匹克竞赛,并顺利拿到清华大学的录取通知书。 由于招生限制,杨志林一开始没有学计算机科学,直到大二才转入计算机科学系,师从IEEE院士唐杰。 2015年,他以全年级第一名的成绩毕业于清华大学计算机科学系。
后来,杨志霖进入卡内基梅隆大学计算机科学学院(美国第一所计算机学院)。 2019 年,苹果人工智能研究总监 Ruslan Salakhutdinov 和谷歌首席科学家 William W.科恩在他的指导下获得了博士学位。 通常,卡内基梅隆大学的计算机科学博士生往往需要 6 年才能毕业,而他只花了 4 年时间。
在攻读博士学位期间,2018年,杨志林还与图灵奖得主杨乐坤合著了《Glomo: Unsupervised Learning of Transferable Relational Graphs》。
与图灵奖得主 Yoshua Bengio 合作开发“Hotpotqa: A Dataset for Diverse, Explainable Multi-Hop Question Answering”。
2019 年,作为第一作者,他与谷歌和卡内基梅隆大学共同出版了《XLNet:语言理解的广义自回归预训练》。 以及:Transformer-XL:超越固定长度上下文的细心语言模型**。
其中,Transformer-XL成为第一个全面超越RNN的注意力语言模型,并成为Neurips 2019和ACL 2019的顶级引用之一。 XLNet 在 20 个任务中超过了 Google 的 BERT 模型。
同时入选2019年度北京致远青年科学家。 2020年11月入选“2020福布斯中国30位30岁以下精英榜单”。 2022年4月入选AI中国青年学者名单。
在美国期间,杨还曾在 Meta AI 和 Google Brain 工作,分别与 Meta AI 研究科学家 Jason Weston 和 Google Brain 创始成员 Quoc V. 合作le 一起工作。
天才总是善于突破。 杨志霖曾说:“我希望有一种更彻底、更彻底的方式,打破学术界和工业界的壁垒。 ”
早在大二(2016年)时,杨志林就开始了自己的第一笔生意,并创立了Recurrent AI。 2019年,杨志林毕业后回国,回到母校清华大学,担任交叉信息科学研究院助理教授。 2021年,循环智能还与华为云合作,开发了千亿级NLP模型——盘古模型,涉及NLP、CV等多个方向。
杨志霖虽然长期戴着天才的光环,但并非一帆风顺。 杨志林的**Transformer-XL也一度被ICLR 2019拒绝,理由是评委们认为大语言模型的改进在实际场景中不会有更大的价值。 但杨志林一直认为,他已经看到了人工智能的第一原理。
回到国内后,杨志林也一直在尝试整合和重新建立一家相关的AI公司,由自己的团队提供技术,对方提供算力等资源,但一直受到限制。 随着ChatGPT的爆火,杨志林也看到了机会,独自一人出海两个月,这让他坚信有机会成为亚洲的大型样板企业。
它于2023年3月1日正式成立,至于为什么公司被称为“月亮的黑暗面”。 杨志霖本人曾透露,自己在学生时代就组建了乐队,在他看来,摇滚乐的精神与科技创业精神相似。 该公司的成立恰逢英国摇滚乐队 Pink Floyd**The Dark Side of the Moon 发行 50 周年。 同时,“月球的阴暗面”也意味着神秘、好奇和令人向往,但登上月球是一件非常困难和具有挑战性的事情。
除了杨志林,公司的创始团队还有两位联合创始人,周新宇和吴宇欣,他们也是清华大学毕业的同学。
其中,周新宇作为第二股东持有公司10%的股份。 周心宇是一个冒险爱好者,对他来说挑战越大,他就越兴奋。 大三快结束时,我决定工作或学习,最终选择了工作。 大四那年,周新宇加入人工智能产品和解决方案公司旷视科技实习,毕业后正式加入,从事算法量产工作。 他刚加入旷视后,做了很多工作,别人也以为他做了很多工作,但统一在他的逻辑体系里,也就是为了提高生产力。
周新宇曾经说过:“我们在深度学习中所做的90%的事情可能是试错,因为从本质上讲,我们做技术是在与天空作斗争。 ”
在工作期间,他还与旷视研究院基础科研负责人张翔宇合作研究移动终端模型,并合著了《SHUFFLENET:一种用于移动设备的极其高效的卷积神经网络》,该书赢得了CVPR的竞标。 后来,它还影响了各种用于手机的毫秒级人脸解锁技术,包括苹果的3D人脸解锁。
吴宇欣持有5第三大股东96%的股份,与杨志林基本有着相同的人生轨迹,毕业于清华大学和卡内基梅隆大学,都曾在Google Brain(研究基础模型)和Meta AI(计算机视觉)工作,是Meta人工智能实验室FAIR团队的一员。
他在 Fair 的工作获得了 ECCV 2018 的最佳荣誉奖、CVPR 2020 的最佳提名和 ICCV 2021 的 Mark Everingham 奖。 它还创建了 Meta AI 最受欢迎的项目之一 Detectorron2,这是一个广泛使用的视觉开源项目,已集成到 Meta 的全系列 VR AR 产品中。
2018年10月,在GeekPWN国际安全极客大赛上,iyswim是六支参赛队伍中唯一破解人脸识别算法的队伍。 吴宇欣当时以iyswim队的身份参加比赛,据他介绍,“我(以自己的名义报名参加比赛,队友没有到场)使用谷歌的Facenet开源**模型破解了算法。
张玉涛和杨志林一样也师从唐杰教授,持有5%的股份。 此前,他还与杨志林一起创建了循环情报。 据悉,张玉涛曾就读于清华大学计算机系。 清华大学数据科学研究所大数据科技研究中心首席研究员。 他的研究兴趣包括异构数据融合和知识图谱构建。 在数据挖掘领域的重要国际会议上发表论文多篇,如KDD、CIKM、VAST等。
作为核心开发者,开发了全球知名的科技大数据分析平台AMINER,其产品服务于BATHH等科技巨头和科技部等一流科研管理机构。 曾获北京市科学技术奖一等奖、吴文军人工智能技术进步奖一等奖、阿里巴巴天池大数据大赛二等奖。
除了清华四人组,还有一位毕业于复旦大学计算机系的王震,在月亮暗面的股东名单中。 复旦大学毕业后,他前往新加坡南洋理工大学学习计算机工程。 他拥有 20 年的软件开发经验,目前正致力于人工智能在法医学中的应用。
据悉,王震曾担任谷歌高级软件工程师、iHealth Labs系统架构师、Ised Ventures副总裁、新加坡科技局Smart Nation Fellow特聘工程师。 他还是新加坡人工智能驱动型独角兽公司Advance AI的首席技术官。 他还曾在投资机构工作过。
除了这四大核心人员外,月亮暗面还吸引了一大批研发人才,他们曾参与谷歌双子座、谷歌巴德盘古NLP、物道等多款大模型。 2023年10月,大约有50人,现在的团队有80多人。
虽然团队不大,但在2023年10月,也就是公司成立几个月后,就推出了全球首款支持20万汉字输入的智能助手产品。 核心特点是,相较于市面上基于英语训练的大模型服务,Kimi Chat具有较强的多语言能力,20万汉字的输入在中文中也更具优势。
目前,月球暗面正在开发通用的多模态模型,预计将在年内推出。 对于如今的大型创业公司来说,多模式模式确实是核心竞争点。 尤其是OpenAI首款AI**模型Sora的发布,再次为赛道增添了一把火。 然而,与文本相比,图像和**等多模态模型的训练成本更高,需要更多的资金和人才。