清华大学,90后学者,创业后年薪25亿美元

小夏 科技 更新 2024-02-19

**:狩猎云选,温王飞

在OpenAI的文生**模型SORA备受关注的当下,中国90后清华学霸创立的大型模型公司,继续受到知名机构的追捧。

今日,Moonshot AI被曝完成新一轮超10亿美元融资,投资方包括红杉中国、小红书、美团、阿里巴巴等,老股东紧随其后,投后估值约25亿美元。

2月3日,春节前夕,《月亮的暗面》被曝出正在筹措2亿美元,由蚂蚁金服和阿里巴巴集团联合投资,投前估值15亿美元。

针对“最新一轮融资”,文志典对 Lieyun.com 表示,“谢谢大家的关注! 公司暂不便对具体融资信息发表评论。 月亮的暗面在过去和未来一直坚持推动中国AGI领域底层的关键技术进步和产品创新,并将继续匹配公司发展阶段对应的资本战略,期待未来与大家分享更多好消息。 ”

事实上,成立于 2023 年 4 月的月球黑暗面在融资披露方面“几乎没有明确的说法”。 针对成立仅两个月就完成的首轮融资,创始人杨志林在2023年10月“更正”称,公司已获得红杉资本、今日资本、丽丝资本等知名机构近20亿元投资。

而这也是自近一年前月球暗面成立以来唯一一次准确的融资披露。

月亮的暗面之所以能够在成立之初就拿到头VC的赌注,与90后杨志林的“学者”身份和丰富的阅历有很大关系。

在清华大学学习期间,杨教授师从清华大学计算机科学系知识工程实验室(KEG)主任、智源教育学院学术副院长、启蒙工程负责人唐杰教授。 最终,他以满分的成绩通过了所有编程课程,并以全年级第一名的成绩毕业。

然后,在 2015 年,Yang 加入了卡内基梅隆大学 (CMU) 的语言技术研究所 (LTI),在那里他师从苹果人工智能主管 Ruslan Salakhutdinov 和谷歌人工智能首席科学家 William W.科恩正在攻读博士学位。

毕业后,曾在谷歌脑研究所和Meta(Facebook)人工智能研究所工作,是Transformer-XL和XLNet的第一作者。 其中,XLNet模型在18个自然语言任务中取得了优于Google BERT的成绩,是当时NLP领域最流行的国际前沿模型之一。

据不完全统计,杨志林在ICLR、NEURIPS、ICML、ACL、EMNLP等计算机峰会上发表文章20余篇,研究成果累计被Google Shcolar引用超过17000次。

目前,杨先生还是清华大学交叉信息科学研究院的助理教授,研究方向为大规模预训练、自然语言处理、自然语言理解与生成、小样本学习、零样本学习和多模态学习。

杨志林,90后出生,在大型模型领域有名气:循环智能、智普AI、致远研究院......他的名字和身影无处不在。

同时,杨志林团队还作为核心研发成员参与了Google Bard、Gemini、Einstein、Pangu、五道等大型模型的研发,发明了Transformer XL、XLNet、Rope、Detectron2、Group Normalization等AI领域的里程碑式成果,已被Google Palm、LLAMA等模型采用。

天眼查APP信息显示,月亮的暗面是杨志林拥有的7897% 具有绝对控制。 他身边的创业伙伴也都不平凡,不容小觑。

月亮黑暗面的联合创始人周新宇拥有该公司10%的股份,他与杨志林和张玉涛一起是清华大学计算机科学与技术系2011年的本科生。 大四那年,周新宇加入了各方面都符合自己标准的旷视实习,毕业后正式加入,工作内容是算法的量产,就是将算法的生产效率提高很多倍。

作为赌注 5第三大股东吴宇欣96%的股份,月暗面联合创始人,毕业于清华大学和卡内基梅隆大学,并在2018年欧洲计算机视觉大会(ECCV)上被提名为最佳中的佼佼者。 2018 年 10 月,Iyswim 是 GeekPWN 国际安全极客大赛六支队伍中唯一破解面部识别算法的队伍。 吴宇欣当时以iyswim队的身份参加比赛,据他介绍,“我(以自己的名义报名参加比赛,队友没有到场)使用谷歌的Facenet开源**模型破解了算法。

此外,杨志林的同胞兄弟张玉涛目前持有公司5%的股份。 据公开资料显示,张玉涛曾就读于清华大学计算机系。 研究方向为异构数据融合与知识图谱构建,在KDD、CIKM等顶级计算机会议上发表多篇文章。 作为技术负责人,他参与了技术大数据分析平台aminer的开发。

豪华的团队阵容和深厚的积淀,月暗面成立不到半年,2023年10月宣布在“长文”领域取得突破。

据杨志林介绍,针对“大模型输入长度有限导致的应用难”,月亮暗面正式推出首款支持20万汉字输入的大模型Moonshot,以及搭载该模型的智能助手产品Kimi Chat。

随后,他详细介绍了Kimi Chat的一些实际用例。 以整本书《月亮与六便士》为例,Kimi Chat可以和用户一起阅读,帮助他们更好地理解和应用书中的知识:

与目前市面上基于英语培训的大模型服务相比,Kimi Chat具有很强的多语言能力。 例如,Kimi Chat在中文方面具有显著优势,实际使用效果可以支持约20万个汉字的上下文,2是 Anthropic 的 Claude-100K(测量值约为 80,000 字)的 5 倍,是 OpenAI 的 GPT-4-32K(测量值约为 2.)的 8 倍。50,000字)。

同时,通过创新的网络结构和工程优化,Kimi Chat实现了千亿参数下的无损远程注意力机制,不依赖滑动窗口、下采样、小模型等性能损失较大的“快捷方式”解决方案。

今年1月26日,Kimi Chat发布了最新的“V13春节版“:全面升级基础模型能力,......了用友的在线搜索能力、语境学习能力、文学创作能力、语言翻译能力Kimi智能助手的小程序版本已经支持中英文语音输入。

需要的是,近日,OpenAI的文生**模型SORA以其突破性的一分钟时长,加上演示的高真实感和高质量,持续备受关注。

据多方透露,月球暗面也在暗中开发通用多模态模型,预计今年内推出。

换言之,在基于文本的大语言模型领域取得阶段性进展的“月亮暗面”,未来也将在基于图像和**的多模态模型领域与OpenAI等国内外同行展开竞争。

资本市场“月亮暗面”的“频频行动”,似乎正在为更高的培训成本、更大的资金和人才需求做更充分的准备。

以团队规模为例,2023年10月月亮暗面有50人左右,公司团队有80多人。

未来,我们将继续关注月球的暗面能否在“多模态模型”领域占有一席之地。

相似文章

    故事 嫁给清华大士人5年后,我离婚了,再次见到前夫时,他跪下乞求再婚

    那天,我在百货公司挑选玩具时,突然看到一个熟悉的身影,是我的前夫唐。五年前,我和唐结婚了,我们本以为会有一个幸福的家庭,但最终,我们还是逃不掉离婚的命运。当我回想起那段时间时,我感到惋惜和复杂心情走近唐。我们是在一次工作活动中认识的,当时我在一家公司工作,唐是我的老板。我们一起参加了校友聚会,并更好...

    90后数字游牧民一年走遍全国,闲置房产成生活保障

    近日,一则与 数字游牧民族 相关的新消息引起了广大网友的关注。据介绍,已经是后员工的陶涛,因为感觉到自己处于 内讧 状态,所以选择成为数字游民。她受雇于互联网,同时生活在全国各地,体验差异的风景,结交各界人士,重新发现自己写作的初衷,开阔了自己的人生视野。越来越多的年轻人选择成为数字游民,但线上就业...

    匆匆忙忙带来的学生欺凌的幻觉,在初二年级回归现实

    初中第二阶段对思维能力的要求相对较低,只需要基本的思维能力。由于前期学习难度有限,很多家长选择过分吃鸡,导致实际能力的差距被弥补。初中二年级只是揭开了原来的差距,而不是这段时间形成差距的阶段。事实上,这种差距早在每个人都获得满分的学习阶段就已经开始显现。从表面上看,初二似乎标志着学习差距的开始,但实...

    棒!90后青年带领村集体年挣200万,对他赞不绝口

    月日,广东召开 百万工程 青年创业与乡镇培育计划启动会。此前,旨在为农村地区培养业务人才的 农村CEO计划 项目已在全国多个试点地区实施。其中,后出生的白玲,在云南昭通苗族村担任CEO近年。他参与民宿和咖啡馆的建设,推广特色美食,规范服务标准。无论是在厨房洗碗,在客房里铺床叠被褥,还是早上主持动员大...

    一年级学生如何成为尖子生

    养成良好的学习习习习惯。为了让一年级的孩子成为尖子生,他或她首先需要养成良好的西习习惯。这包括以下内容 .课前习 课前,习你将要学习的内容习,理解你不理解的内容,这样你在课堂上可以更专心地听,提高你的习学习效率。.在课堂上认真听 在课堂上,认真听老师的讲解,不要分心去做其他事情。对于老师强调的重点内...