You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

85 lines
14 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 148 | 曾经辉煌的雅虎研究院
雅虎是最早成功的互联网公司之一,也是最早意识到需要把基础研究,特别是机器学习以及人工智能研究,应用到实际产品中的公司。雅虎从很早就开始招聘和培养研究型人才,雅虎研究院就是在这个过程中应运而生的。
今天我就来说一说雅虎研究院的历史,以及过去十多年间取得的成就,聊一聊如何通过引进高级人才,迅速构建起一支世界级的研发团队。当然,也会聊一聊研究院的衰落。高级研发机构对于企业而言往往是锦上添花的事情,在整个公司产品和视野都欠缺的情况下,也往往避免不了最后衰败的结局。
## 雅虎研究院的创立
雅虎研究院的故事要从一个叫乌萨马·菲亚德Usama Fayyad的人说起。乌萨马出生在北非突尼斯的迦太基Carthage早年在突尼斯以及其他地中海沿岸国家度过包括中东、非洲以及南欧的一些国家。高中时期在约旦的安曼生活后来在美国密歇根大学度过了他的本科1984年、硕士1986年以及博士1991年生涯。毕业之后乌萨马来到了美国加州南部隶属于美国国家航空航天局NASA的喷气推进实验室Jet Propulsion Laboratory工作一直到1996年。之后加入微软研究院从事数据挖掘的研究工作。
早在1994年乌萨马就和拉马萨米Ramasamy Uthurusamy一起组织了最后一届KDD研讨班然后在1995年他们把这个研讨班升级成了会议并在加拿大蒙特利尔举办了第一届KDD大会First International Conference on Knowledge Discovery in Data。从此KDD大会成了数据挖掘、数据科学以及应用机器学习的顶级会议。
1996年乌萨马又创办了一本叫《数据挖掘和知识发现》Data Mining and Knowledge Discovery的学术期刊并亲自担任主编。这本期刊也渐渐成了数据挖掘领域主要的学术期刊之一。乌萨马本人可以说在20世纪90年代中期就已经开始成为数据挖掘领域重要的领军人物。
进入21世纪乌萨马先是在2000年创立了一家叫Audience Science的数据挖掘公司并担任CEO然后又在2003年创立了一家叫DMX Group的数据挖掘咨询公司后者于2004年被雅虎收购。不久后他成为雅虎的执行副总裁以及首席数据官Chief Data Officer这也是互联网历史上的第一位首席数据官。
因为雅虎在搜索以及广告业务上的扩展乌萨马意识到应该成立一个类似于微软研究院但更偏向于互联网业务的研究组织这个想法得到了公司CEO杨致远的支持。乌萨马当时的首要任务是为研究院物色一位院长。
经过一段时间的寻找他成功邀请到普拉巴卡·拉加万Prabhakar Raghavan来担纲。今天回头来看普拉巴卡无疑成功地引领了雅虎研究院并让其一度成为人人向往的互联网研究机构。当然这跟普拉巴卡本人的经历也密切相关。
首先他本人就是知名的学者参与撰写的经典教科书《随机算法》Randomized Algorithms和《信息检索导论》Introduction to Information Retrieval在学术界享有盛誉。他还是ACM、IEEE的院士也是美国工程院院士这为他招纳学术界权威人士和博士生提供了便捷。加入雅虎之前他已经在IBM研究院以及Verity任职多年IBM的从业经历更是让他对企业文化和工业界的研究机构有了很深的了解。
2005年7月雅虎研究院正式成立普拉巴卡担任研究院负责人向乌萨马汇报。2008年雅虎研究院与之前就在搜索与广告事业部存在的应用科学部门合并。在卡罗尔·巴茨Carol Bartz任职CEO期间普拉巴卡直接给她汇报并且普拉巴卡还曾担任首席战略官。
## 雅虎研究院的蓬勃发展和辉煌
雅虎研究院组建之后,首要任务当然就是吸引工业界和学术界的知名学者,从而能够组建一个有效的团队。普拉巴卡利用他个人和乌萨马的声望,很快就做到了这点。
比如之前和普拉巴卡在IBM共事的安德鲁·汤姆金斯Andrew Tomkins加入团队担任负责搜索的首席科学家以及搜索方面的副总裁安德鲁后于2009年之后加入谷歌担任工程总监。 再比如曾和普拉巴卡在IBM共事的安德烈·布罗德Andrei Broder2005年加入团队担任负责计算广告方面的副总裁。
安德烈本人大有名头。他在斯坦福大学攻读博士期间师从图灵奖得主高德纳Donald Knuth然后在曾经名噪一时的第一代搜索引擎公司AltaVista担任首席科学家之后加入位于纽约的IBM研究院组建企业级搜索平台。和普拉巴卡一样安德烈也是ACM和IEEE的双料院士。2012年安德烈加入谷歌担任杰出科学家 Distinguished Scientist
我们这里简单列举一些曾经在雅虎研究院工作过的知名学者,我们便可一览其盛况:
* Ronald J. Brachman哈佛大学计算机科学博士加入雅虎研究院之前长期于贝尔实验室工作曾担任贝尔实验室人工智能研究部的负责人。1996年之后担任AT&T实验室通信服务研究中心副总裁。2005年加入雅虎研究院协助普拉巴卡进行管理并于2012年到2016年间担任雅虎研究院首席科学家以及负责人。Ronald曾任AAAI主席。2016年之后担任纽约康奈尔科技大学的Jacobs Technion-Cornell研究院院长。
* Yoelle Maarek以色列理工大学计算机科学博士加入雅虎研究院之前曾任IBM研究院的杰出工程师和谷歌的工程总监。历任雅虎研究院以色列分部的负责人、高级研究总监并在2016年Ronald离开之后任雅虎研究院的负责人。
* Jan Pedersen斯坦福大学统计学博士。2002年加入AltaVista担任首席科学家在安德烈之后。2003年加入雅虎研究院担任搜索和广告方面的首席科学家在安德鲁·汤姆金斯之前。2009年加入微软担任Bing核心搜索部门Core Search的首席科学家。2017年加入Twitter担任数据科学副总裁。
* Ben Shahshahani普渡大学电气工程博士。曾在Nuance Communications担任工程总监。2005年加入雅虎研究院之后历任负责搜索广告的高级总监以及搜索与媒体科学组的副总裁。2012年加入谷歌任工程总监。2014年回到雅虎任广告科学方面副总裁。
* Ricardo Baeza-Yates滑铁卢大学计算机科学博士ACM和IEEE双料院士信息检索和搜索方面的权威著有《现代信息检索》 Modern Information Retrieval一书。他在雅虎研究院担任拉美和欧洲分部的副总裁直至2016年也是智利科学院以及工程院的院士。
* Ravi Kumar康奈尔计算机科学博士加入雅虎研究院之前在IBM 研究院从事数据挖掘算法的研究。2005年加入研究院之后担任首席研究科学家。2012年加入谷歌担任高级主任研究科学家Senior Staff Research Scientist。他的论文引用数达3万次以上。
* Evgeniy Gabrilovich以色列理工大学博士在雅虎研究院担任首席研究科学家并且担任自然语言处理方向研究的负责人。2012年加入谷歌担任高级主任研究科学家。2012年当选ACM杰出科学家ACM Distinguished Scientist
* Deepak Agarwal康涅狄格大学University of Connecticut统计学博士加入雅虎研究院之前在AT&T担任高级研究科学家一职。2006年加入雅虎研究院担任首席研究科学家主要研究推荐系统相关的内容。2012年加入LinkedIn担任人工智能和机器学习方面的副总裁。
* Alexander Smola柏林理工大学计算机科学博士加入雅虎研究院之前任澳大利亚国立大学教授。2008年加入雅虎研究院后任首席研究科学家Principal Research Scientist。2013年加入卡内基梅隆大学任教授一职。2016年加入亚马逊担任机器学习方面的总监。他的论文引用数达8万次以上。
* Jianchang (JC) Mao密歇根州立大学计算机科学博士加入雅虎研究院之前曾在IBM 研究院任职还曾担任Verity的首席软件架构师。2004年加入雅虎之后任广告科学方面副总裁。2012年加入微软之后先后担任Bing的多个职务并于2016年被提升为公司副总裁。他的论文引用数达1万次以上。
* Raghu Ramakrishnan德克萨斯大学奥斯汀分校计算机科学博士加入雅虎研究院之前担任威斯康星大学教授。2006年加入雅虎研究院之后任云计算方面的副总裁。2012年加入微软之后一直担任CTO负责云计算领域。他的论文引用数达3万次以上。
当然,在雅虎研究院工作过的知名人士还有很多,这里无法一一列举。不过我们可以看出,不少人在离开雅虎之后,依然在业界发挥着不小的作用。
**除了招揽到一批优秀人才,雅虎研究院也发表了一系列有价值的研究成果,在很短的时间内建立了学术研究上的威望**。在10年间据不完全统计雅虎研究院的学者获得过两次信息检索顶级会议ACM SIGIR的最佳论文、3次数据科学和数据挖掘顶级会议ACM KDD 的最佳论文、两次机器学习顶级会议ICML的最佳论文、两次推荐系统顶级会议ACM RecSys的最佳论文、两次信息检索以及网络信息挖掘的权威会议ACM WSDM的最佳论文、两次信息检索和数据库领域顶级论文ACM CIKM最佳论文以及一系列有影响力的最佳论文奖项涵盖了搜索、广告、推荐系统、数据挖掘、机器学习、人机交互等诸多方面为互联网研究和发展做出了重大贡献。
可以说在非常短的时间内,雅虎研究院就用卓越的研究成果向世人证明了这个团队和组织的实力。曾经在某一段时期内,世界各国的优秀研究人员和博士毕业生都希望跻身雅虎研究院的研发队列。
## 雅虎研究院逐渐成为历史
2012年是雅虎历史上格外动荡的一年。先是公司CEO卡罗尔·巴茨在上一年的9月份被董事会解雇然后经历了短暂的临时CEO——蒂姆·莫尔斯Tim Morse之后新CEO斯科特·汤普森Scott Thompson在1月上任5月份就因学历造假丑闻离职罗斯·莱文索恩Ross Levinsohn之后担任公司临时CEO直至7月。然后玛丽莎·梅耶尔Marissa Mayer加入公司担任CEO。短短不到一年的时间里共有5个人担当了CEO的职位。
在这个过程中普拉巴卡离职并加入谷歌很多之前追随他的人也先后加入谷歌。普拉巴卡离开后罗纳德·布拉赫曼Ronald J. Brachman接过了研究院领导人的位置并在2012到2016的4年间为玛丽莎重新招募了超过100名博士科学家。
2016年2月雅虎宣布研究院不再作为一个独立实体而存在罗纳德离职所有研究人员被分散到各个工程部门依然保留雅虎研究院的对外旗号耶艾尔·玛瑞克Yoelle Maarek担任负责人。2017年雅虎和Verizon合并雅虎作为一个独立的公司成为历史。
雅虎研究院逐渐淡出历史舞台,这固然有公司高层频繁更换的原因,也有一些更加深层次的原因。研究院的成果往往都需要一定时间才能直接在产品中体现出来,因此,虽然在技术上研究院能够帮助公司提升水平,但是实际产品的效果未必就一定能够受到用户的青睐。
例如,研究院曾经投入了大量人力物力,利用机器学习来提高搜索引擎的搜索品质。可以说,雅虎是最早将人工智能和机器学习技术大规模应用在搜索引擎上的公司。但是搜索引擎的好坏很多时候是一个产品、技术、设计的综合体现,雅虎研究院研发的算法并没有在产品的综合表现中挣得额外加分。
相似的例子还包括雅虎研究院在早期就投入了很多力量研发广告平台,甚至包括安德烈·布罗德本人到斯坦福大学开设了世界历史上第一门计算广告学的课程。然而,雅虎整个平台的产品都在下滑,因此广告平台受到了额外的压力。虽然研究院的科学家们在算法和模型上做出了很多创新,也在一定时间内带来了不小的收益,但都无法改变整个公司产品线运营不佳的情况。于是,**雅虎研究院的成果在雅虎整体业绩不理想、公司产品缺乏想象力的大背景下显得杯水车薪,并不能从整体上扭转公司的颓势**。在公司进入动荡之后,研究院对于高层领导来说,往往也就不是公司的重点发展对象了,研究院的瓦解也就成了必然。
## 小结
今天我为你分析了雅虎研究院的兴衰。一起回顾下要点:首先,雅虎研究院曾通过引进高级人才的方式,迅速构建起了一支世界级的研发团队,并发表了一系列有价值的研究成果,建立起在学术研究上的威望,创造了研究院曾经的辉煌;其次,因高层变动以及一些深层次的问题,雅虎研究院没有摆脱最后衰落的结局,一切辉煌终成历史。
最后,给你留一个思考题:到底什么样的**企业环境**能够最好地发挥研究院的成果,又是怎样的**研发流程**能够使研究院成为公司新动力的源泉?雅虎研究院在当年并没有找到答案。不知道随着最近一批互联网新贵纷纷成立人工智能研发团队的契机,大家是否能够找到更好的研究院运作模式。
欢迎你给我留言,和我一起讨论。