**:狩猎云选,温王飞
在OpenAI的文生**模型SORA备受关注的当下,中国90后清华学霸创立的大型模型公司,继续受到知名机构的追捧。
今日,Moonshot AI被曝完成新一轮超10亿美元融资,投资方包括红杉中国、小红书、美团、阿里巴巴等,老股东紧随其后,投后估值约25亿美元。
2月3日,春节前夕,《月亮的暗面》被曝出正在筹措2亿美元,由蚂蚁金服和阿里巴巴集团联合投资,投前估值15亿美元。
针对“最新一轮融资”,文志典对 Lieyun.com 表示,“谢谢大家的关注! 公司暂不便对具体融资信息发表评论。 月亮的暗面在过去和未来一直坚持推动中国AGI领域底层的关键技术进步和产品创新,并将继续匹配公司发展阶段对应的资本战略,期待未来与大家分享更多好消息。 ”
事实上,成立于 2023 年 4 月的月球黑暗面在融资披露方面“几乎没有明确的说法”。 针对成立仅两个月就完成的首轮融资,创始人杨志林在2023年10月“更正”称,公司已获得红杉资本、今日资本、丽丝资本等知名机构近20亿元投资。
而这也是自近一年前月球暗面成立以来唯一一次准确的融资披露。
月亮的暗面之所以能够在成立之初就拿到头VC的赌注,与90后杨志林的“学者”身份和丰富的阅历有很大关系。
在清华大学学习期间,杨教授师从清华大学计算机科学系知识工程实验室(KEG)主任、智源教育学院学术副院长、启蒙工程负责人唐杰教授。 最终,他以满分的成绩通过了所有编程课程,并以全年级第一名的成绩毕业。
然后,在 2015 年,Yang 加入了卡内基梅隆大学 (CMU) 的语言技术研究所 (LTI),在那里他师从苹果人工智能主管 Ruslan Salakhutdinov 和谷歌人工智能首席科学家 William W.科恩正在攻读博士学位。
毕业后,曾在谷歌脑研究所和Meta(Facebook)人工智能研究所工作,是Transformer-XL和XLNet的第一作者。 其中,XLNet模型在18个自然语言任务中取得了优于Google BERT的成绩,是当时NLP领域最流行的国际前沿模型之一。
据不完全统计,杨志林在ICLR、NEURIPS、ICML、ACL、EMNLP等计算机峰会上发表文章20余篇,研究成果累计被Google Shcolar引用超过17000次。
目前,杨先生还是清华大学交叉信息科学研究院的助理教授,研究方向为大规模预训练、自然语言处理、自然语言理解与生成、小样本学习、零样本学习和多模态学习。
杨志林,90后出生,在大型模型领域有名气:循环智能、智普AI、致远研究院......他的名字和身影无处不在。
同时,杨志林团队还作为核心研发成员参与了Google Bard、Gemini、Einstein、Pangu、五道等大型模型的研发,发明了Transformer XL、XLNet、Rope、Detectron2、Group Normalization等AI领域的里程碑式成果,已被Google Palm、LLAMA等模型采用。
天眼查APP信息显示,月亮的暗面是杨志林拥有的7897% 具有绝对控制。 他身边的创业伙伴也都不平凡,不容小觑。
月亮黑暗面的联合创始人周新宇拥有该公司10%的股份,他与杨志林和张玉涛一起是清华大学计算机科学与技术系2011年的本科生。 大四那年,周新宇加入了各方面都符合自己标准的旷视实习,毕业后正式加入,工作内容是算法的量产,就是将算法的生产效率提高很多倍。
作为赌注 5第三大股东吴宇欣96%的股份,月暗面联合创始人,毕业于清华大学和卡内基梅隆大学,并在2018年欧洲计算机视觉大会(ECCV)上被提名为最佳中的佼佼者。 2018 年 10 月,Iyswim 是 GeekPWN 国际安全极客大赛六支队伍中唯一破解面部识别算法的队伍。 吴宇欣当时以iyswim队的身份参加比赛,据他介绍,“我(以自己的名义报名参加比赛,队友没有到场)使用谷歌的Facenet开源**模型破解了算法。
此外,杨志林的同胞兄弟张玉涛目前持有公司5%的股份。 据公开资料显示,张玉涛曾就读于清华大学计算机系。 研究方向为异构数据融合与知识图谱构建,在KDD、CIKM等顶级计算机会议上发表多篇文章。 作为技术负责人,他参与了技术大数据分析平台aminer的开发。
豪华的团队阵容和深厚的积淀,月暗面成立不到半年,2023年10月宣布在“长文”领域取得突破。
据杨志林介绍,针对“大模型输入长度有限导致的应用难”,月亮暗面正式推出首款支持20万汉字输入的大模型Moonshot,以及搭载该模型的智能助手产品Kimi Chat。
随后,他详细介绍了Kimi Chat的一些实际用例。 以整本书《月亮与六便士》为例,Kimi Chat可以和用户一起阅读,帮助他们更好地理解和应用书中的知识:
与目前市面上基于英语培训的大模型服务相比,Kimi Chat具有很强的多语言能力。 例如,Kimi Chat在中文方面具有显著优势,实际使用效果可以支持约20万个汉字的上下文,2是 Anthropic 的 Claude-100K(测量值约为 80,000 字)的 5 倍,是 OpenAI 的 GPT-4-32K(测量值约为 2.)的 8 倍。50,000字)。
同时,通过创新的网络结构和工程优化,Kimi Chat实现了千亿参数下的无损远程注意力机制,不依赖滑动窗口、下采样、小模型等性能损失较大的“快捷方式”解决方案。
今年1月26日,Kimi Chat发布了最新的“V13春节版“:全面升级基础模型能力,......了用友的在线搜索能力、语境学习能力、文学创作能力、语言翻译能力Kimi智能助手的小程序版本已经支持中英文语音输入。
需要的是,近日,OpenAI的文生**模型SORA以其突破性的一分钟时长,加上演示的高真实感和高质量,持续备受关注。
据多方透露,月球暗面也在暗中开发通用多模态模型,预计今年内推出。
换言之,在基于文本的大语言模型领域取得阶段性进展的“月亮暗面”,未来也将在基于图像和**的多模态模型领域与OpenAI等国内外同行展开竞争。
资本市场“月亮暗面”的“频频行动”,似乎正在为更高的培训成本、更大的资金和人才需求做更充分的准备。
以团队规模为例,2023年10月月亮暗面有50人左右,公司团队有80多人。
未来,我们将继续关注月球的暗面能否在“多模态模型”领域占有一席之地。