“坚持原创,让人工智能引领人类进步。”
文丨贺乾明 程曼祺 张家豪
编辑丨程曼祺
12 月 16 日,商汤科技发布讣告,宣布商汤创始人汤晓鸥于 2023 年 12 月 15 日晚因病救治无效去世,享年 55 岁。清华大学智能科学讲席教授张亚勤在一个微信群里称,他得知汤晓鸥是因呼吸暂停症在睡梦中离世。
汤晓鸥是世界知名的人工智能科学家,他在职业生涯中经历了三重身份:AI 研究者、培养了一批 AI 人才的教育者、创办 AI 公司商汤的创业者。
商业世界关心由汤晓鸥创立的商汤科技的跌宕起伏:它一度快速增长的估值,巨额的融资和仍在进行的商业化探索。
学术界痛惜失去了一位提携了诸多后辈的良师。“汤老师最大的财富是他培养了像何恺明这样一批非常优秀的人,让中国计算机视觉在世界上的影响力大幅提升。” 汤晓鸥的一位博士后说。
商汤科技联合创始人、董事长兼 CEO 徐立在朋友圈悼念:“遇见了你,我们才有这最好的时光。商汤科技高管、汤晓鸥学生徐冰说:“他不止是商汤的灵魂,更是无数学生心中的灯塔。”
离世前的 5 年里,汤晓鸥逐渐从商汤公司淡出,重新回到了教育与研究,在商汤科技任执行董事之外,他还是浦江实验室主任、上海人工智能实验室主任和香港中文大学教授。
他最近一次参加大规模的公开活动,还是出席今年 7 月在上海举办的世界人工智能大会。他用三个学生的研究故事概括了自己的研究生涯,说他的团队有 18 项工作是全世界范围内第一次将深度学习用到视觉问题上,相当于 “在深度学习的大门上,按了 18 次门铃”。
汤晓鸥谈吐幽默、喜欢调侃。谈到科学家有骨气,他说虽然不会为 “五斗米折腰”,“但如果是六斗的话 …… 就比五斗多一斗了”。有人称他是科学家中的 “段子手”。
他说幽默是看到了事物的本质:“事物的本质有两个方面,一个是可笑的一面,一个是更可笑的一面”。
在今年 7 月这场演讲最后,他提到自己常听着于谦的相声睡觉,会想:“机器怎么可能超过这样有趣的灵魂?我不信。”
现在,世界上又少了一个有趣的灵魂。
科学家汤晓鸥:“在暗原色中寻找光明”
汤晓鸥 1968 年出生于辽宁鞍山,17 岁从鞍山一中考入中国科学技术大学的精密机械与精密仪器系。1990 年毕业后,他前往美国读书,花了 1 年时间在罗彻斯特大学拿到硕士学位,然后去了麻省理工学院攻读博士。
在此期间,他的研究兴趣转移到了用计算机处理图像上。汤晓鸥公开可查的论文中,最早的一篇发布于 1994 年,对比了三种根据纹理分类声呐图像的方法。这篇论文的合作者,是第一批登上泰坦尼克号的深海考古科学家之一。
1996 年,汤晓鸥博士毕业,前往香港任教,用 20 多年的时间把香港中文大学变成了计算机视觉研究重镇。刚开始,他的研究还延续着博士时期的方向,比如研究如何让机器自动识别海底浮游生物。
在 2001 年组建香港中文大学多媒体实验室(MMLab)后,汤晓鸥的研究重心开始转移到人脸识别等更接近日常生活的图像处理上。接下来三年,汤晓鸥团队在各种学术会议和期刊上发布了 50 多篇论文。
这是绝大多数研究者穷尽一生都难以做出的成绩,但对汤晓鸥来说,才刚刚开始。
他于 2005 年开始兼任微软亚洲研究院视觉计算组负责人,也让这里迎来了顶级学术会议论文的发布高峰期。汤晓鸥把科研的驱动力归结为生活。他后来接受采访时提到:“一直想把计算机视觉、人工智能的东西用到日常生活中。” 他自己也是这么做的。
接下微软亚洲研究院工作时,儿子才两岁,汤晓鸥只能在北京和香港两地辗转。“总感觉和铭铭(汤晓鸥儿子的小名)在一起的时间太少,想把每一分钟都记录下来。” 他在一篇自述中写道。每次见到儿子,汤晓鸥都会拍下大量照片,两年不到就攒了上万张,根本没法整理。
汤晓鸥的解决办法是,“很自私地号召大家做照片管理方面的研究”,比如怎样快速查找图像?怎样把一个人像从多个图像中分割出来?
实际上,这些照片也是计算视觉研究中难得的优质数据。微软亚洲研究院期间,汤晓鸥团队在各种顶级学术期刊发布了 60 多篇文章,他调侃自己儿子为 “天下第一铭”。
汤晓鸥经常把做研究比作比武论剑,认为要把目标聚焦到顶级学术会议上。“论剑就要到华山论剑,如果一定要去太行山论剑,挺进大别山,别人只能当你是游击队。”
2009 年,汤晓鸥迎来学术生涯的高光时刻。这一年,他被评为 IEEE Fellow,是计算机信息领域最高荣誉之一。他和自己的学生何恺明、时任微软亚洲研究院科学家孙剑发布的论文被评为 CVPR 最佳论文。这是 CVPR 创办 25 年以来,第一次由亚洲团队拿到了最高奖项。
一年后,汤晓鸥回到母校中国科学技术大学办讲座,谈到这篇论文。他们发现了自然图像中被称为 “暗原色 (Dark Channel Prior)” 的一项基本性质在任意一个普通图像的任意色块内,总有至少一个像素点,红色、绿色或蓝色的数值接近于零。靠着这个发现,他们能接近完美地去除图像中的烟雾、雾霾等元素,复原真实场景。
汤晓鸥说,自然图像已经被研究了几十年,还是能发现全新的图像基础特性,科研人员就应该秉承这种态度:在暗原色中寻找光明。
CVPR 这篇论文是汤晓鸥学术生涯的代表作之一,也是他研究理念的映射。
2010 年,汤晓鸥在中国科学技术大学做演讲。图片来自中国科学技术大学。
导师汤晓鸥:提前瞄准深度学习,带出半个中国 AI 产业的技术负责人
在今年的世界人工智能大会中,汤晓鸥自豪地介绍了他的三位学生:王晓刚、何恺明和林达华。
2014 年,王晓刚作为商汤联合创始人带领团队开发 GaussianFace 算法,第一次在人脸识别上超越人类水平。
何恺明在 2015 年作为一作发表深度残差网络(ResNets)论文。以 Transformer 架构为基础的大模型现在也普遍采用何恺明当年设计的结构。
林达华在 2014 年主导发起了现在全球最有影响力的计算机视觉开源项目 OpenMMLab。
早年他谈起这些天才学生,还不忘了加几句调侃:“晓刚是我见到的第一个天才学生 …… 他的才华和人品如此出众,以至于我毫不犹豫地将妹妹嫁给了他。后来我的另一个天才级学生达华发表的文章更多了,可是我已经没有妹妹可以再嫁了。”
导师汤晓鸥带出的优秀学生远不止这三位。王晓刚、何恺明、林达华以及更多 AI 科学家都有在汤晓鸥创立的 MMLab 求学或工作的经历。
优秀导师的一个特质是能敏锐把握技术方向,提出对的问题。
2010 年,汤晓鸥就开始关注人工智能里的深度学习流派。此时离深度学习方法在 2012 年 ImageNet (由斯坦福大学发起的机器视觉识别比赛)上震惊学界还有几年时间。
这之后不久,汤晓鸥决定 MMLab 的研究重心全面转向深度学习。此后几年里 MMLab 在用深度学习方法做计算机视觉上处于大幅领先地位。
从 2011 年到 2013 年,CVPR 所有 29 篇深度学习论文中,来自 MMLab 的有 14 篇。比如 2012 年 CVPR 仅有的两篇深度学习论文全部来自 MMLab。
2016 年,MMLab 入选世界十大人工智能先锋实验室,是亚洲区唯一入选的实验室。
一位汤晓鸥的学生说,“汤老师是平和、有耐心、引导型” 的导师。即便是离开实验室的学生在会议上碰到汤晓鸥,他也会抽时间和他们交流:“他非常善于引导学生把能力放大,所以培养了大批优秀人才。”
除了上述特质,汤晓鸥还有多数教授不具备的能力:谋略、对人性的理解,以及解决问题的能力。
汤晓鸥 1996 年回到香港任教时,香港高校的教授和学生之间有一种张力:当时正值香港政府推动香港的大学从教育型转向科研型,高薪聘请了一批欧美资深科学家,这些人希望在香港培养自己的博士;但来到香港的学生却普遍只想在香港读硕士,之后再去欧美深造。
在创办 MMLab、开始招募学生后,汤晓鸥反其道而行之:他并不介意学生把 MMLab 当跳板,甚至 “鼓励他们这么做”。
汤晓鸥认为做老师的核心是找到好学生,而不是博士生导师的名头。他在内地高校,如清华、中科大宣讲时,会告诉候选人:MMLab 不介意你们过来只读硕士,但在硕士毕业前,要努力做出成果;如果这之后你想去欧美深造,“我帮你一起申请”。
王晓刚、林达华、李学龙、颜水成……都是那批时间点去了实验室,之后又去了 MIT、斯坦福、牛津。
师兄弟姐妹间的口口相传,让 MMLab 吸引到了更多人才,包括清华、中科大各相关院系的前几名,如何恺明是广东省 2003 年高考状元,本科就读于清华物理系基础科学班。
何恺明在 MMLab 读硕期间发表的第一篇论文,就是那篇获得国际顶尖计算机视觉会议 CVPR 2009 年度最佳论文的文章。
顺势而为的策略让汤晓鸥达到了一些导师求而不得的目标:一些人才选择留在香港完成博士学位。何恺明是一个例子,他本来申请的是港中文硕士,后来转为博士,4 年完成了硕博连读。在 MMLab 的成果使他有自信不需要靠学校增加自己的光环。
汤晓鸥与何恺明。图片来自香港中文大学。
从 MMLab 走出去的学生后来充实了整个中国 AI 尤其是计算机视觉领域的研究和产业界,这里被称为 “计算机视觉的黄埔军校”:除了汤晓鸥今年演讲中提及的三位学生,还有曾担任依图 CTO、Shopee CTO,现在是昆仑万维天工智能联席 CEO 的颜水成;重庆邮电大学校长高新波;华为诺亚方舟计算机视觉实验室主任许春景;阿里达摩院前基础视觉负责人赵德丽;商汤联合创始人徐冰;中科院先进计算与数字工程研究所所长乔宇;京东前最高技术科学家陶大程;大疆前 AI 视觉负责人赵丛等。
高密度的人才也是商汤起步时的最大优势。在深度学习爆发并被产业界关注后,汤晓鸥将开启另一重身份:创业者。
一位了解 MMLab 组织方法的人士对汤晓鸥来创业另眼相看:“教授创业一般不被看好。但汤晓鸥真的有可能创业成功。”
创业者汤晓鸥:创立商汤,但不只是商汤创始人
2014 年 6 月,汤晓鸥团队发布名为 DeepID 的人脸识别模型,在人脸识别数据库 LFW(Labeled Faces in the Wild)上的识别率超过 99%,打败了 Facebook 的 DeepFace。
当年被 Facebook 吸引到 “人脸识别” 上的全球商业媒体发现,Facebook 大力宣传的 DeepFace 居然败给了来自中国的实验室。
加上 IDG 投资人牛奎光的推动,汤晓鸥在同年底创办商汤。相比旷视 2011 年成立、依图 2012 年成立,商汤创业起步稍晚。但它之后成为了中国人工智能领域人才密度和估值都排名第一的公司。
汤晓鸥为商汤制定了远大的公司使命:“坚持原创,让人工智能引领人类进步。”
商汤最初选择的模式,也是一种看起来能有效率地引领各行业进步的方式:做技术平台,即商汤主要做计算机视觉的通用软件技术,让下游应用方或合作伙伴运用到各自的场景里。
2014 年之后的乐观氛围支持了商汤初期的蓬勃发展,尤其是 2016 年 AlphaGo 战胜李世后,掀起新一轮 AI 热潮。一批投资人从过去为流量增长买单,到为论文数量买单。
2018 年前后的巅峰期,商汤有将近 300 名博士,以至于内部有一句调侃:“三人行,必有博士”。
这一年,汤晓鸥在发布会上放出过去几年全球各类机构在顶级计算机视觉学术会上发布的论文数量对比图,商汤排第三,仅次于微软和卡耐基梅隆大学。
“BAT 都说自己是 AI 公司,但在国际上,存在的只有商汤。” 汤晓鸥说。
商汤一度是全球融资最多的人工智能公司,在 2021 年底上市前,共筹集了 52 亿美元资金,估值达到 120 亿美元。
但随时间推移,以技术理想出发的 “平台” 设想在商业竞争中遭遇挫折。
由于软件技术扩散更快,AI 算法的竞争力不易保持;由行业内企业掌握的大规模制造能力、商务关系或行业认知是更深的壁垒。当时的计算机视觉技术本身也不够通用,还做不到在很多场景里低成本迁移。
产业里的公司,从海康、字节到特斯拉,都在利用 AI 技术获益。商汤们想赋能的对象在自己赋能自己,这是一批纯 AI 公司共同面临的商业化困境。
一位商汤高管说,他最初坚信 “科学技术是第一生产力”,但后来发现这并不适用所有情境和阶段。在中国市场,技术要产生收入,要么往下沉做成基础设施,要么往上绑住应用。
近年来,商汤调整了经营策略。包括收束 “赋能百业” 的范围至智慧城市、智能汽车、智慧商业和智慧生活;“垂直整合”,不仅做软件算法,还向下做算力基础设施、向上做应用,如在上海建立了有超 3 万块 GPU 的算力大装置;抓住大模型的机会。
商汤的商业化探索仍在继续。据财报,商汤今年上半年收入 14.33 亿元、毛利润 6.48 亿元,均同比微增;净亏损额 31.43 亿元,同比微降 2%;上半年应收账款高达 77.26 亿元,是收入的五倍。
多位商汤高管说,在整个创业过程中,汤晓鸥的管理风格是抓宏观,“就管好几个商汤的联创”。但也有商汤人士称,汤晓鸥会在意公司对外的形象,亲自审核公司宣传物料。
一位前商汤员工告诉《晚点 LatePost》,汤晓鸥在商汤也是导师般的存在,大家都喊他 “汤老师”,公司年会时他不会谈公司发展战略,而是谈生活,分享最近刚看到的好书。
汤晓鸥在商汤倡导 “黑羊文化”:要求员工具备同理心,但不能陷入 “羊群效应”,要去做别人没有做过的事情,甚至是别人想不到的事情。
2019 年前后,汤晓鸥逐步淡出商汤,只保留了执行董事身份。后来的媒体报道中,汤晓鸥与商汤相关的新闻,基本只有商汤市值下降让他财富减少。
离世前的四五年里,汤晓鸥更多以上海人工智能实验室主任的身份活跃在业界。该机构成立于 2020 年 7 月,汤晓鸥担任实验室主任,牵头科学家还包括姚期智院士与陈杰院士等。除了 AI 研发攻坚外,上海人工智能实验室也与国内多所知名高校联合培养博士研究生。
汤晓鸥又回归了他熟悉的研究者与导师身份。
过去几年,上海人工智能实验室在机器视觉、自动驾驶、机器学习等多项领域均有成果:2022 年,实验室自动驾驶团队开源了 BEVFormer 架构;今年 6 月,上海人工智能实验室、武汉大学及商汤科技联合提出的自动驾驶通用模型相关论文,获得 CVPR 2023 最佳论文,这也是近十年来计算机视觉顶级会议中第一篇以中国学术机构作为第一单位的最佳论文。
2023 年 7 月上海的世界人工智能大会是汤晓鸥最后一次公开演讲。在演讲结尾,汤晓鸥再次向他的学生们致谢。
他借用了电影《老师好》中的一句台词:“我不是在最好的时光遇见了你们。而是遇见了你们,才有了这段最好的时光。”
今年 7 月的世界人工智能大会上,汤晓鸥借用《老师好》的台词结尾。
题图来源:视觉中国