“坚持原创,让人工智能引领人类进步。 ”文丨何乾明、程曼琪、张家豪编辑丨程满琪
12月16日,商汤科技发布讣告,宣布商汤科技创始人汤晓鸥于2024年12月15日晚去世,享年55岁。 清华大学智能科学讲座教授张雅琴在微信群中表示,他得知唐晓鸥因呼吸暂停在睡梦中死亡。
唐晓鸥是享誉全球的人工智能科学家,在职业生涯中经历了三个身份:AI研究者、培养了一批AI人才的教育家、创立AI公司商汤科技的创业者。
商界关注唐晓鸥创立的商汤科技的跌宕起伏:一度快速增长的估值、巨额资金和持续的商业化探索。
学术界为失去一位承载了许多年轻一代的导师而感到遗憾。 “唐老师最大的财富,就是培养了一批像何凯明这样非常优秀的人才,大大提升了中国计算机视觉在世界上的影响力。 “唐的一位博士后说。
商汤科技联合创始人、董事长兼CEO徐力在朋友圈哀悼:“遇见你的时候,我们度过了最美好的时光。 商汤科技高管、唐晓鸥学生徐冰表示:“他不仅是商汤科技的灵魂,更是无数学子心中的灯塔。 ”
在他去世前的五年里,唐先生逐渐从商汤科技退休,回归教育研究,担任浦江实验室主任、上海人工智能实验室主任、香港中文大学教授。
他最后一次参加大型公开活动是在7月在上海举行的世界人工智能大会上。 他用三位学生的研究故事来总结自己的研究生涯,说他的团队的18项工作是世界上第一次将深度科学的习应用于视觉问题,相当于“在深度学习的习门口按了18次门铃”。
唐小鸥说话幽默,喜欢调侃。 谈及科学家的骨干,他说,虽然不会为了“五桶米”而弯腰,但“如果是六桶......这比五个桶多一个桶。 有人称他为科学家中的“小丑”。
他说,幽默就是看事物的本来面目:“事物的本质有两面性,一面是荒谬的,一面是更荒谬的”。
在今年7月的演讲结束时,他提到自己经常听着余谦的相声睡觉,心想:“一台机器怎么能超越这么有趣的灵魂呢?我不相信。 ”
现在,世界又少了一个有趣的灵魂。
科学家唐晓鸥:“在深色原色中寻找光明”。
唐晓鸥,2024年出生于辽宁省鞍山市,17岁时从鞍山市第一中学考入中国科学技术大学精密机械与精密仪器系。 2024年毕业后,他前往美国留学,在那里他花了一年时间在罗切斯特大学获得硕士学位,然后在麻省理工学院攻读博士学位。
在此期间,他的研究兴趣转向了用计算机处理图像。 唐晓鸥最早发表的公开文章发表于2024年,比较了三种基于纹理的声呐图像分类方法。 这个**的合作者是最早登上泰坦尼克号的深海考古科学家之一。
2024年毕业后,邓博士赴香港任教,花了20多年时间将香港中文大学打造成计算机视觉研究中心。 一开始,他的研究继续朝着博士的方向发展,比如如何让机器自动识别海底的浮游生物。
2024年在香港中文大学成立MMLAB后,Tang的研究重点开始转向更接近日常生活的图像处理,例如人脸识别。 在接下来的三年里,唐的团队在各种学术会议和期刊上发表了50多篇文章**。
这是大多数研究者一辈子都觉得很难取得的成就,但对于唐晓鸥来说,这才刚刚开始。
2024年,他还是Microsoft亚洲研究院视觉计算小组的负责人,这导致了顶级学术会议的高峰**。 唐晓鸥把科研的动力归结于生活。 他后来在接受采访时提到:“我一直想在日常生活中使用计算机视觉和人工智能。 他自己做到了。
当他接手Microsoft亚洲研究中心工作时,他的儿子只有两岁,唐晓鸥不得不往返于北京和香港之间。 “总觉得和明明(唐小鸥儿子的昵称)在一起的时间太少了,我想把每一分钟都记录下来。 他在一份自我报告中写道。 每次见到儿子,唐小鸥都会拍大量的**,不到两年的时间,他已经保存了上万张照片,根本整理不出来。
唐晓鸥的解决办法是“自私地号召大家做**管理研究”,比如如何快速找到图像如何从多张图像中分割肖像?
事实上,这些都是计算视觉研究中罕见的高质量数据。 在Microsoft Research Asia期间,Tang的团队在各种顶级学术期刊上发表了60多篇文章,他调侃他的儿子是“世界第一的名字”。
唐晓鸥经常把做研究比作一场武术比赛,认为要把重点放在顶级学术会议的目标上。 “你要是要去太行山谈剑,进军大别山,别人只能把你当游击队了。 ”
2024年,唐晓鸥迎来了学术生涯的高光时刻。 今年,他被任命为IEEE Fellow,这是计算机信息领域的最高荣誉之一。 他和他的学生何凯明(Kaim Ho)当时是亚洲研究中心(Microsoft Research Asia)的科学家,以及孙健(Jian Sun)被评为CVPR的最佳学生。 这是CVPR25年历史上首次有亚洲团队获得最高奖项。
一年后,唐晓鸥回到母校中国科学技术大学讲学,谈起了这篇文章。 他们发现了自然图像的一个基本属性,称为“暗通道先验”——在任何正常图像的任何色块中,总是至少有一个像素的红色、绿色或蓝色值接近于零。 有了这一发现,他们能够几乎完美地去除图像中的烟雾、雾霾和其他元素,并恢复真实场景。
唐晓鸥说,自然图像研究几十年了,仍然可以发现图像的新基本特征,研究者应该坚持这个态度:在深色的原色中寻找光明。
CVPR是唐晓鸥学术生涯的代表作之一,也是他研究理念的体现。
2024年,唐晓鸥在中国科学技术大学讲学。 **来自中国科学技术大学。
导师唐晓鸥:针对提前深入学习习,带出中国半壁AI产业的技术带头人
在今年的世界人工智能大会上,唐晓鸥自豪地介绍了他的三位学生:王晓刚、何凯明和林大华。
2024年,作为商汤科技联合创始人,王晓刚带领团队研发了GaussianFace算法,在人脸识别方面首次超越了人类水平。
2015 年,何凯明发表了基于 Transformer 架构的深度残差网络 (Resnets)** 大型模型,这些模型现在被何凯明广泛使用。
2014 年,他领导了 OpenMMLAB 的推出,这是目前世界上最具影响力的计算机视觉开源项目。
早年,他谈起这些天才学生,还不忘加几句调侃的话:“小刚是我见过的第一个天才学生......”他的才华和性格非常出色,我毫不犹豫地将我的妹妹嫁给了他。 后来,我的另一位天才学生大华发表了更多的文章,但我已经没有妹妹再婚了。 ”
唐晓鸥老师培养出的优秀学生远不止这三位。 Xiaogang Wang、Kaim He、Dahua Lin和更多的人工智能科学家都曾在唐晓鸥创立的MMLAB学习或工作。
优秀导师的特征之一是他或她对技术方向有敏锐的把握,并提出正确的问题。
2024年,唐晓鸥开始关注人工智能中的深度学习习类型。 几年前,习的深度科学方法在2024年斯坦福大学赞助的机器视觉识别竞赛ImageNet上震惊了学术界。
不久之后,唐晓鸥决定将MMLAB的研究重点转移到深习。 在随后的几年里,mmlab是将深度学习习方法用于计算机视觉的主要领导者。
从2024年到2024年,CVPR中的29个深度***中有14个来自MMLAB。 例如,在2024年,CVPR中仅有的两篇深入的习文章都来自mmlab。
2024年,mmlab入选全球十大AI先锋实验室之一,亚洲唯一一家。
唐老师的一位学生说:“唐老师是一位冷静、耐心、有指导的导师。 即使离开实验室的学生在开会时遇到唐晓鸥,他也会抽出时间与他们交流:“他很擅长引导学生放大自己的能力,所以他培养了一大批优秀的人才。 ”
除了以上特质,唐晓鸥还具备大多数教授所不具备的能力:策略、人性理解、解决问题的能力。
2024年唐晓鸥回港任教时,香港大学的师生关系紧张:当时,香港**正在推动香港大学从教育转向研究,一批欧美资深科学家被高薪聘用,这些人想在香港培养自己的博士;但是,来香港的学生一般只想在香港攻读硕士学位,然后去欧美深造。
在创办mmlab并招收学生后,唐晓鸥反其道而行之:他不介意学生以mmlab为跳板,甚至“鼓励他们这样做”。
唐晓鸥认为,当老师的核心是找到好学生,而不是博士生导师的名字。 他在清华大学、中国科学技术大学等中国大陆高校讲课时,会告诉考生:MMLAB不介意你来这里只读硕士,但在硕士毕业之前,一定要努力才能取得成绩如果之后想去欧美留学,“我帮你一起申请”。
王晓刚, 林大华, 李雪龙, 闫水成 ......我经常去实验室,然后去麻省理工学院、斯坦福大学和牛津大学。
兄妹俩的口口相传吸引了更多的人才,其中就包括清华大学、中国科学技术大学相关院系的佼佼者,何开明是2024年广东省高考状元,本科就读于清华大学物理系基础科学班。
何开明在MMLAB攻读硕士学位期间发表的第一篇文章,就是获得世界顶级计算机视觉大会CVPR 2009最佳文章的文章。
顺势而为的策略,让唐晓鸥实现了一些导师一直无法要求的目标:一些人才选择留在香港完成博士学位。 何启明就是一个例子,他最初在香港申请中文硕士学位,但后来转为博士学位,并在4年内完成了硕士和博士学位。 MMLAB的结果给了他信心,他不需要依靠学校来增加他的气场。
唐晓鸥和何凯明。 **来自香港中文大学。
后来走出MMLab的同学们,丰富了中国人工智能的研究和产业,特别是在计算机视觉领域,被誉为“黄埔军校计算机视觉”:除了今年唐晓鸥演讲中提到的三名同学,还有曾担任依图CTO的严水成, Shopee首席技术官,现任昆仑万维天工智能联席CEO重庆邮电大学校长高新波;华为诺亚方舟计算机视觉实验室主任徐春景;赵德利,阿里佛法学院前基本观负责人;商汤科技联合创始人徐冰;中国科学院先进计算与数字工程研究所所长乔宇;陶大成,前 JD.com 顶级技术科学家;赵聪,大疆前AI视觉负责人等
人才密度高也是商汤科技起步时最大的优势。 在深度学习习爆发和业界关注之后,唐晓鸥将开启另一个身份:企业家。
一位了解MMLab组织方式的人,对唐晓鸥的创业有着不同的看法:“教授们普遍不看好创业。 但唐小鸥确实有创业成功的潜质。 ”
创业者唐晓鸥:创立了商汤科技,但不仅仅是商汤科技的创始人
2014 年 6 月,唐晓鸥团队发布了一款名为 DeepID 的人脸识别模型,该模型在人脸识别数据库 LFW(Labeled Faces in the Wild)上的识别率超过 99%,击败了 Facebook 的 Deepface。
当时,被Facebook吸引到“人脸识别”的全球业务**发现,Facebook大力推广的Deepface,居然输给了来自中国的一家实验室。
再加上IDG投资人牛奎光的推动,唐晓鸥于同年年底创立了商汤科技。 相较于2024年成立的旷视和2024年成立的依图,商汤科技的创业起步稍晚一些。 但此后,在人才密度和估值方面,它已成为中国人工智能领域排名第一的公司。
唐晓鸥为商汤科技制定了一个崇高的公司使命:“坚持原创,让人工智能引领人类进步。 ”
商汤科技最初选择的模式,也是一种看似能够高效引领各行业进步的方式:做一个技术平台,即商汤科技主要做计算机视觉的通用软件技术,让下游应用或合作伙伴可以应用到自己的场景中。
2024年之后的积极氛围支撑了商汤科技的早期繁荣,尤其是在2024年AlphaGo战胜李士琪之后,掀起了新一轮的AI热潮。 一群投资者已经从过去为流量增长付费,变成了为最佳数量付费。
在2024年左右的巅峰时期,商汤科技拥有近300名医生,以至于内部有一个笑话:“如果你是三人行,你必须有一个医生”。
今年,唐晓鸥在发布会上公布了过去几年全球各机构在顶级计算机视觉学术会议上发布的对比图数量,商汤科技排名第三,仅次于Microsoft和卡内基梅隆大学。
BAT都说自己是一家AI公司,但在国际上,只有商汤科技存在。 唐晓鸥说。
商汤科技曾是全球融资最多的人工智能公司,在2024年底上市前,共筹集了52亿美元的资金,估值为120亿美元。
但随着时间的流逝,基于技术理想的“平台”的想法在商业竞争中遭受了挫折。
由于软件技术的快速扩散,AI算法的竞争力不容易保持;行业内企业所持有的大规模制造能力、业务关系或行业意识是更深层次的障碍。 当时,计算机视觉技术本身还不够普及,在很多场景下都无法低成本迁移。
从海康威视到字节再到特斯拉,该行业的公司正在从人工智能技术中获益。 商汤科技想要赋能自己的对象就是赋能自己,这是一群纯AI公司共同面临的商业化困境。
商汤科技的一位高管表示,他最初认为“科学技术是第一生产力”,但后来发现这并不适用于所有场景和阶段。 在中国市场,技术要想产生收入,就必须要么沉入基础设施,要么束缚应用。
近年来,商汤科技调整了业务战略。 它包括“赋能万行百业”的范围,包括智慧城市、智慧汽车、智慧商业和智慧生活“垂直整合”不仅做软件算法,还做计算基础设施和应用向下做,比如在上海建立3万多个GPU的大型算力设备抓住机会打造大模型。
商汤科技的商业化探索仍在继续。 财报显示,商汤科技今年上半年营收为1433亿元,毛利648亿元,同比均略有增长;净损失 3143亿元,同比微降2%;上半年应收账款高达7726 亿美元,是收入的五倍。
多位商汤科技高管表示,在整个创业过程中,唐晓鸥的管理风格就是把握宏观层面,“只管好几个商汤科技的共创”。 不过,也有商汤科技的人表示,唐晓鸥会关心公司的外在形象,亲自审阅公司的宣传资料。
一位前商汤科技员工告诉晚邮报,唐晓鸥也是商汤科技的导师,大家都叫他“唐先生”,他不会在公司年会上谈公司的发展战略,而是聊聊生活,分享最近刚看到的好书。
唐晓鸥在商汤科技倡导“害群之马文化”:要求员工要有同理心,但绝不能陷入“羊群效应”,做别人没有做过的事情,甚至是别人想不到的事情。
2024年前后,唐晓鸥逐渐淡出商汤科技,只保留了执行董事的身份。 在后来的**报道中,唐小鸥与商汤相关的消息,基本只是商汤市值的下跌,从而减少了他的财富。
在他去世前的四五年里,唐晓鸥作为上海人工智能实验室的主任,在行业内更加活跃。 该机构成立于2024年7月,由唐晓鸥担任实验室主任,领军科学家还包括姚驰志院士和陈杰院士。 除了人工智能研发,上海人工智能实验室还与国内多所知名高校合作培养博士生。
唐晓鸥又回到了他熟悉的研究者和导师的角色。
过去几年,上海人工智能实验室在机器视觉、自动驾驶、机器学习等多个领域取得了成果,习:2024年,实验室自动驾驶团队开源了Bevformer架构;今年6月,上海人工智能实验室、武汉大学和商汤科技联合提出了自动驾驶通用模型**,该模型在CVPR 2023**中荣获最佳,这也是近十年来首篇以中国学术机构为单位的顶级计算机视觉大会最佳文章**。
2024年7月在上海举行的世界人工智能大会是唐晓鸥的最后一次公开演讲。 在演讲的最后,唐晓鸥再次感谢了自己的同学们。
他借用了电影《好老师》中的一句台词:“我没有在最好的时间遇见你。 当我遇见你时,我度过了最美好的时光。 ”
在今年7月的世界人工智能大会上,唐晓鸥借用了《好老师》结尾的台词。
标题图片**:视觉中国。