炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
就在刚刚,计算机视觉领域代表人物何恺明最新官宣,已加入谷歌DeepMind,担任杰出科学家(Distinguished Scientist)。
他在个人主页上表示,自己在 DeepMind 的工作是兼职,还将继续保留 MIT 终身副教授的身份。
何恺明是残差网络(ResNet)的主要发明人,而这项技术成为了深度学习及后续人工智能进步的基础。我们今天看到的 ChatGPT、AlphaGo、AlphaFold 都离不开它的影响。
根据《自然》杂志的统计,2016 年发表的 ResNet 论文是 21 世纪迄今为止引用量最高的论文——就连《注意力就是你所需要的一切》(Attention is all you need)这样的 Transformer 经典之作都不是它的对手。
据了解,何恺明出生于 1984 年。2003 年,他获得了保送清华大学的资格,但依旧参加了高考并以 900 分满分成为了广东省高考状元。他本科就读于清华大学物理系基础科学班,之后前往香港中文大学攻读博士学位,并于 2011 年取得信息工程博士学位,师从汤晓鸥。
他在学术初期就展现出非凡的研究才能。早在 2009 年,他提出的“暗通道先验”(Dark Channel Prior)用于图像去雾,就已在国际顶级计算机视觉会议 CVPR 上获得最佳论文奖(第一位获得该奖项的华人),被认为是图像增强领域的重要突破。
博士毕业后,何恺明加入微软亚洲研究院(Microsoft Research Asia),在 2011 年至 2016 年期间担任计算机视觉研究员。也就是在微软的这段时间,他带领团队完成了日后被载入人工智能发展史的重要成果——残差网络 ResNet。
2015 年,何恺明及其团队提出了 ResNet 架构。这一架构通过引入“残差连接”概念,解决了神经网络随着层数增加而训练困难的问题,使得训练上百层的深度神经网络成为可能。
(论文链接:https://arxiv.org/pdf/1512.03385)
传统神经网络在变深之后常常会出现梯度消失,导致准确率下降,而ResNet 通过“跳跃式”连接,巧妙规避了这一瓶颈。
ResNet 横空出世后立即在各大视觉竞赛中大放异彩:152 层的 ResNet 模型在 2015 年的 ImageNet 挑战赛中包揽了图像分类、定位、检测三项冠军;同年还赢得了 COCO 图像识别与分割挑战的第一名。
微软 AI 官方博客称,这一架构成功攻克了超深网络训练不稳定的难题,堪称 AI 发展的“分水岭”。
ResNet 的影响远远超出计算机视觉。如今几乎所有深度学习模型都在不同程度上借鉴了 ResNet 的残差结构。
也正因如此,2023 年,何恺明及其团队获得了未来科学大奖(数学与计算机科学奖项),以表彰其在“深度残差学习”方面的开创性贡献。
2016 年,何恺明加入 Facebook AI Research(FAIR,现为 Meta AI),继续在计算机视觉领域深耕细作。2017 年,他又一项标志性成果诞生:Mask R-CNN。
这是在 Faster R-CNN 目标检测架构基础上的一次重要升级。Mask R-CNN 不仅能准确识别图像中的各类物体,还能为每个对象生成像素级别的精确轮廓。
(论文链接:https://arxiv.org/pdf/1703.06870)
这种实例分割(Instance Segmentation)能力对于自动驾驶、图像编辑、AR 等场景至关重要。该模型一经推出就迅速在 COCO 标准测试集上刷新多个指标,成为该领域的“黄金标准”。
除了检测与分割,何恺明在 Meta 还致力于推动“自监督学习”的研究。他与团队相继提出了MoCo(Momentum Contrast)和 MAE(Masked Autoencoder)等框架,显著提升了无监督视觉表征的质量。
这类技术如今已被广泛应用于数据稀缺场景,拓宽了 AI 模型的训练方式。
2024 年初,何恺明受聘为麻省理工学院(MIT)电子工程与计算机科学系终身副教授。
入职 MIT 后,他开设了关于生成式模型与视觉学习的前沿课程,同时继续活跃于一线科研。
就在今年 2 月,何恺明带领三位大一新生提出了扩散模型新思路:扩散模型基础架构中的噪声调节,被广泛认为不可或缺的,但他们挑战了这一假设,并证明了去除噪声调节不仅可行,而且还能提升性。
目前他的论文总引用次数已超过 70 万次,在全球 AI 学术圈内影响深远。
显而易见,在加入 DeepMind 之后,我们一定会看到这位“学术+行业”的双料 AI 大牛带来影响更深远的成果。
参考资料:
https://people.csail.mit.edu/kaiming/
https://ieeexplore.ieee.org/author/37085360867
https://www.nature.com/articles/d41586-025-01125-9
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.