作者 | 略大参考
“AI没有国界,AI的福祉也没有国界”,在12月中旬上海的一个演讲中,李飞飞这样说。
她自己就是那个技术和知识没有国界最好的证明——出生于中国,16岁和父母移民到美国,全家人靠洗盘子、开干洗店生存下来,凭借强大的驱动力,她在普林斯顿、加州理工这些学校里完成了世界最好的科学训练。
之后,她一头扎进了人工智能的研究中。
整个人工智能研究领域,尤其是计算机视觉研究,因为她的贡献而变得不同。2016年,美国最古老的基金会——卡内基基金会,提名她为当年的杰出移民。
但她在学科上做的贡献、她培养的门徒从来没有限制在美国境内。现在,她又作为谷歌的一员回到中国,领导这家公司在中国的人工智能研究中心。
知识和技术总是流动的,不会因为行政命令或者是特朗普签证关卡而停止流动。
Cover
李飞飞谈及自己的人生,总是从16岁谈起,她说那年她和父母移民到了美国。
她1976年出生在北京,16岁那年是1992年。
那大概是中美经济生活之间还存在巨大差距的最后一个时代,从中国移民到美国往往要付出巨大的代价。李飞飞全家移民到美国两年后,一部名为《北京人在纽约》的电视剧在国内爆红,描写的就是这种代价——社会地位的落差,经济上的困顿等等。
李飞飞受过高等教育的父母来到美国后,也失去了原本在中国的知识分子的工作,父亲给人修理照相机,母亲则是一名收银员。
用她自己话来说,全家人出于一种“求生模式”中。李飞飞说,她什么样的工作都做过,从在中餐馆里打工,到给人打扫房子甚至帮人遛狗,但她没有觉得困难,因为父母也同样努力工作。
初到美国,全家人住在纽约附近一个叫帕西帕尼(Parsippany)的地方,全家人仅有的一些朋友都是和他们一样的移民,“大家都很忙,忙着讨生活”。
作为一个移民,她必须从零开始学英语。相比当地的孩子,她浑身散发着书呆子气,她说她在学校也没有太多的朋友。
“我想要理解很多本质的问题,如宇宙的起源,生命的意义等,我想要生命中拥有那种智慧”,她说这是她的驱动力。
所幸她的数学和理科都不错,她就读的帕西帕尼高中(Parsippany High School)在新泽西州的高中里排名中等,她毕业的时候排名第六。
当时她申请了一大批学校,但普林斯顿给了几乎全奖的奖学金,她去了普林斯顿。
事实上,她考上普林斯顿就在当地让人惊讶了,1995年2月,当地的报纸专门刊载了她的故事,《“美国梦”成真了!》
她最大的欣喜是发现身边朋友起了变化,“身边全是这些学术、知性、充满魅力的人”,她说。
她极少公开提及的是她与《南京大屠杀》的作者张纯如在那段时间成了好友。她在普林斯顿读书时,曾经举行过一个跟南京大屠杀有关的活动,当时在地区有不小的影响力,作为学校里数量非常非常少的来自中国大陆的学生,做到这一点并不容易。
在她与知识分子为伍时,她家人的生活还在挣扎当中,她决定在帕西帕尼盘下一家干洗店来,让父母来经营。全家人都凑不够那么多钱,她四处向朋友借钱,甚至从高中数学老师那里借到了钱。
多年后回忆起初到美国的困顿生活,她总是提及她的高中老师,“我真的很感谢那些高中老师们,我当时什么都不是,就是个移民的小孩”,她回忆说,但这些白人老师愿意帮助她。
她自己说那就是“双城记”,帕西帕尼和普林斯顿。
周一到周五,她在普林斯顿学物理,放学后通过电话参与干洗店的经营,周末她就回到帕西帕尼给家里的干洗店帮忙,接待那些来取送衣物干洗的人。“我非常爱普林斯顿,不过也非常爱我的洗衣店,缺少了它们中的任何一件,都没有现在的我”,她说。
1999年,她从普林斯顿毕业。作为一个和父母一路艰辛走来的中国移民女儿,这毫无疑问是一个帮助全家人从经济困境中解脱出来的最佳时刻。
当时是美股大牛市,就业市场一片大好。她受邀去面试了数家投行和咨询公司,高盛和麦肯锡都给过她工作offer。如果她就这样去了华尔街,从此让全家人过上了富裕的中产生活,也是一个足够励志的北京人在纽约的故事了。
她并没有去华尔街,而是选择了去西藏研究一年藏药,“这听起来很疯狂”,李飞飞说她自己也知道一般人难以理解她的选择。
她的父母放弃了北京知识分子生活来到美国,也并不只是为了早日过上美国舒适的生活,他们非常尊重李飞飞的选择。
从西藏回来后,她选择继续读博,学的是人工智能和计算神经科学。这意味着这段时间她还是只有微薄的奖学金,全家人仍然要承受经济的不宽裕。
“人生最大的挑战其实是不辜负你最大的潜能,又不辜负你身上的责任,以及诚实面对你自己内心所希望追求的事业”,2017年,她在接受CNN采访时这样说。
在加州理工读博士期间,李飞飞妈妈得了癌症,又患了中风。
在《北京人在纽约》那部电视剧里,生活里的困苦拍成了40集连续剧,李飞飞在接受CNN采访时把这段经历间断地描述为,”我们经历了很多艰难困苦,然后一起挺过来了”,她说,如果加州理工那段经历发生在她刚刚来美国那段时间——要面临全新文化和语言的挑战,她不认为她自己能够办得到。
2005年,李飞飞从加州理工获得了博士学位。
从1995年到2005年,她接受了世界上最好的科学教育。
Cover
从移民生活的困顿中解脱了出来后,李飞飞一头扎进关于大的问题的研究当中——如何让计算机理解图片。
计算机如果要越来越广泛地被人们所使用,就必须习得认知画面的能力。最简单的例子是,当自动驾驶的汽车前方路面出现了一个障碍物时,计算机需要识别那是个可以轻松碾过去的纸袋子还是个应该避开的石头。
这是认知世界最重要的一部分能力。大自然努力了5亿4千年,人类才进化到拥有这个地步。几十年来,相当一部分计算机研究人员都投身于此。
2005年前后,李飞飞刚成为美国伊利诺伊大学香槟分校的计算机科学教授。对于计算机的图片识别问题,她发现学术界和AI工业界都在朝着一个方向努力:寻找一个更好的算法,这个算法可以提供更好的决策。
但她看到到了这个路径的局限性——如果这种算法基于的数据并不能够反映真实世界,再好的算法也不会有用。她试图寻找另一种路径——构建一个更好的数据集。
在保持对这个问题的思索中时,李飞飞恰巧接触到了关于WordNet的理论,受到了启发。
1980年代,普林斯顿大学物理学家乔治·米勒启动了一个项目叫做“WordNet”,目标是为英语语言搭建一种逻辑结构——有点像词典,但不是按照字母排列,而是以逻辑关系展现,这种逻辑关系能够被机器理解和阅读。
比如,“dog”(狗)这个词会出现在“canine”(犬)这个词下,而“canine”(犬)又出现在“mammal”(哺乳动物)这个词下。以这种方式,WordNet收集了15万5千多个索引词汇。
2006年,访问母校普林斯顿时,李飞飞拜访了在WordNet领域有影响力的一名学者Chrinstiane Fellbaum教授。Fellbaum给她出了个主意,建议她给WordNet每个单词配一张图片,作为一种逻辑关系的索引。
几个月之后,她回到普林斯顿任教,再几个月后,2007年初,李飞飞启动了ImageNet项目——遵循了Fellbaum的建议,给每个单词配以多个图片,从而构建一个庞大的数据集。
十年后的2017年,她在接受Quartz 采访时回忆那段经历,“那时我们决定做一些史无前例的事情,要描绘整个物理世界”。
李飞飞说的“我们”不过是包括她自己在内的三个人——她聘请了教授研究员Kai Li,Kai后来又说服了博士研究生Jia Deng加入,而Deng一直和李飞飞一起管理这个项目,一直到2017年这个项目结束。
“当时我清楚地知道这将改变视觉研究领域的游戏规则,但如何改变,却不清楚”,Jia Deng对Quartz回忆说。
ImageNet 数据集里既包括熊猫、教堂这种具体事物,也包括“爱”这种抽象概念。
他们这个庞大的工程,要从最基础的工作开始——给WordNet这种逻辑数据集添加照片。
李飞飞的第一个想法就是以10美元每小时的价钱雇佣本科生,让他们以人工的方式寻找照片并添加进数据集。很快,他们发现,按照这种速度,大约需要90年才能完成照片收集。
叫停这个方案后,李飞飞和团队重新回到黑板前来讨论别的路径。他们考虑写一些算法,让计算机自己从网上找图片,然后只是人工审核准确性。又对算法推敲了几个月,他们发现这种路径缺乏持续性——这种算法只能拣出能够识别的图片,而这种识别能力在编程时就限定了的。
李飞飞的目标始终是整个世界。
与此同时,李飞飞还面临的另一个问题是团队已经没有资金了。她四处向联邦申请资金,得到的回复是对方写在申请书上严厉的批评——为普林斯顿在做这样的研究而感到羞愧,这个研究唯一的可取之处是这是一个女性主导的研究。
没有任何一家愿意给他们钱,这个项目眼看陷入绝境。
转机来自于李飞飞和一个研究生偶然间的聊天。那名学生问李飞飞是否知道亚马逊的 Mechanical Turk 网站——一个众包平台,可以把任务在这个平台上分发出去,雇佣世界各地的人用电脑远程完成,费用低廉。
“我真的就是在当天对ImageNet重新燃起了信心”,李飞飞说,“突然间就找到了一种可以大规模完成这个任务的工具,如果仅仅是靠普林斯顿的本科生,ImageNet将是一个不可能实现的梦”。
即便利用 Mechanical Turk 这种高效的工具,数据集最终也花费了两年半的时间才完成。最终它包含了 320 万张标记的照片,这些照片被划分为 5247 个种类,划分为12个子树,比如“哺乳动物”、“机车”和“家具”等。
2009年,李飞飞和团队发布了ImageNet的论文和数据集,但并不是什么破茧而出的时刻,外界几乎没有什么反应。
当时在CVPR——计算机视觉研究的前沿会议上,主办方都不允许他们上台做演讲,仅仅是批准他们贴一张海报。没有办法,他们只好向与会人员派发印有Imagenet品牌的钢笔。
他们所有的努力都是基于这样一种观点——更多地数据对于算法是有帮助的,但大部分人对这个观点持怀疑态度。
Jia Deng对当时的遭遇记忆犹新,“很多人都说,如果你连一个物体都算不好,干嘛要收集几千几万个物体的数据?”
李飞飞始终是一个有野心的人,她希望更多的人接受她的观点,“我们意识到如果要更大众接受这个路径,那我们要做得更多”,李飞飞说。
在图片识别研究领域会有一些赛事,大家持自己算法参赛,对同样的图片数据库做识别,识别率最高者获胜。李飞飞联系到了当时欧洲的一个知名的图片识别大赛PASCAL VOC,对方同意和她联名举办比赛。
随着比赛不断举办,ImageNet的名声越来越大,成为衡量图像识别算法性能如何的一个基准。
随着比赛举办到2011年、2012年,研究者们注意到比赛之外的收获——他们的算法经过使用 ImageNet 数据集后表现得更好了。李飞飞向外界证明了他们观点的正确性——更多的数据对于获得更好的算法是有用的。
Alex Berg,团队的第四名成员后来回忆说,“人们惊讶地发现先用 ImageNet 训练模型,然后再针对其它任务调试模型,这不仅仅是神经网络领域的突破,也是识别领域的重大进展。”
2012年的ImageNet大赛上,发生了一件重要的事情——杰弗·瑞·辛顿(Jeoffrey Hinton)和他的团队胜出。
那场大赛上,来自加拿大多伦多大学的杰弗瑞·辛顿(Geoffrey Hinton)、Ilya Sutskever,和 Alex Krizhevsky 提交了一个叫做 Alexnet 的深度卷积神经网络架构,夺得了当年的 ImageNet 冠军,图片识别的正确率比第二名高出达41%。
一直到今天,人们都把深度学习能够重新获得生命的原因归结于这场比赛,从此以后整个人工智能研究领域都发生了变化。
Cover
“和辛顿相比,我感到很幸运,因为他坚持研究了二十多年才获得回报,我等待的时间没有那么长,我很敬佩他的坚持和热情”,在2017年和《国家科学评论》的访谈中,李飞飞这样说。
辛顿和学生们赢得那场比赛时已经65岁了,因为对深度学习这个领域的坚持,在此之前他完全过着边缘化的一生。
深度学习的前身叫神经网络,可以把它理解为人工智能研究中的一个分支,完全迥异于传统的机器学习学派依靠数学逻辑的路径。这个分支在1950年代萌芽,他们的核心思想是“训练”——简单来说,就是通过一种“奖赏机制”让机器学会识别新事物。
正因为和传统路径迥异,注定了这个学派每次取胜时都会遭到传统学派的抨击和诋毁,在几十年里几番复活又几番死去,这个学派的信徒们也不可避免地卷入这种命运沉浮中。
辛顿1970年代在英国爱丁堡开始做研究时,这个学派已经在1950年代短暂地繁荣之后进入了寒冬期。
别人问辛顿“看你挺聪明的一个人,为什么要做这个?”当时他在论文中只要提到“神经网络”,论文就无法通过同行评审。毕业后,他没有找到全职的学术工作。
辛顿当时的长期合作伙伴Terrence J. Sejnowski说:“我们都坚信神经网络。可以说是盲目信仰,因为我们不能用数学或其他方法来证明。”但是,当看到基于数学和统计学的人工智能搞不定诸如图片识别等难题时,他们知道自己手中握有王牌。
1980年代早期,辛顿来到加州大学圣地亚哥分校做博士后,但最终没有获得教职,他回到英国,做着一份无聊的职位。
一个学术路径未被证明之前,很多人研究人员都不得不像乞丐一样四处讨要资金,这让这些学术路径的生死带有偶然性。在英国的一个半夜,辛顿被一个美国来的电话惊醒,对方表示,愿意资助他35万美元继续他的研究。
辛顿后来才知道这笔资助的来源:兰德公司的一个非营利子公司通过开发核导弹攻击软件获得了数百万美元。因为是非盈利组织,政府以此要求他们,要么把这笔钱用来支付薪水,要么尽快散出去,他们选择把这笔钱散给了辛顿。
因为这笔钱,辛顿等人的研究又复活。到了1980年代末,神经网络随处可见,他们重返《纽约时报》,好莱坞也以此博取眼球,阿诺德.施瓦辛格扮演的机器人终结者说:“我的CPU是一个神经网络处理器,一个会学习的计算机。”
但冬天很快再次来临——神经网络可以学习但学的不太好,一个神经网络失败了,人们也未必清楚其中原因,工程师讨厌这种变化无常。在主流机器学习会议上,很难发表任何有关神经网络的内容。
1990年代末开始,深度学习完全进入冰封期,辛顿和一群自称为“主流机器学习社区弃儿”的人密谋复活神经网络,这些人包括伊恩·乐坤(YannLeCun)——后来主持Facebook人工智能实验室的学者,以及后来加入百度的吴恩达等人。“当时每个人都在做着不同的事,莫名其妙地,辛顿说服了他们”,经历了那场复兴运动的乐坤回忆说。
到2004年,他从CIFAR的加拿大组织申请到一笔研究资金,这让这个组织有了活下去的可能性。
到了2006年,Hinton发表了有关“深度信念网络”的文章,这个人工神经网络被冠以新名称”深度学习”。
现在看来,那是人工智能技术大爆发的前夜。也是在那个前后,李飞飞在普林斯顿思考有关数据对算法的问题,并着手建立ImageNet。
我们不知道两人之间在当时是否有过交流,但很明显两人都在朝着一个有微弱光芒的地方前进——李飞飞对数据问题的强调,正好契合了辛顿的深度学习路径对于数据需求。
2012年ImageNet大赛的结果,让深度学习从此成为显学,李飞飞说,到了2014年时,所有的高分选手都在用深度神经网络。从此,大批的研究资金倾入这一领域,大公司广泛采用这一路径—— Facebook 用它来标记用户照片;特斯拉自动驾驶汽车用它来检测物体。
ImageNet 数据集的收集和标注花费了李飞飞大量心血,但自从构建以来,它一直秉承开放和自由使用的原则,这也影响了其它大公司在数据上的行为——2016 年谷歌发布了Open Image数据集,DeepMind 今年夏天也发布了自己的视频数据集。
整个人工智能领域从此变得不一样了。
Cover
2016年,美国最古老的基金会——卡内基基金会,提名李飞飞为当年的杰出移民。每年,他们会选出约40名的已入籍移民予以表彰,以奖励他们对美国社会所做出的显著贡献。
美国是一个移民国家,因此聚集了世界上最聪明的那一批大脑——像李飞飞这样的人。这种基金会的表彰和提名,本质上是为这一制度和背后的经济繁荣感到优越和自豪。
在一边举办ImageNet大赛时,李飞飞另一个重要的身份是教书,在普林斯顿之后,2009年她去了斯坦福。
大概是自己是移民的缘故,对于人才是否能够自由流动,她一直保持警惕。“我见过斯坦福非常优秀的博士生怎么也得不到绿卡,为世界上的人才创造这么多的障碍,在我看来是无法想象的”。
另一方面,她又希望留住学生们,大家一起为这个领域努力,而不是跑去华尔街。
姚邦鹏是李飞飞学生之一,从普林斯顿一直跟随她到斯坦福,是李飞飞手把手教他推公式带出来的。但姚邦鹏最终决定离开学术界,去了华尔街做金融。
李飞飞对他的决定非常失望。姚邦鹏说,在李飞飞看来,他放弃做学术也就罢了,拒绝了GoogleX和FAIR等公司,去了一个金融小公司,是自毁前程。
但让他感动的是,毕业前,他去参加一个学术会议,到了机场才发现买错了票,他说,他在机场给李飞飞打电话,李二话没说就让他重新订机票,并允许报销。在美国,博士生的工资费用和出差开销都由导师报销,“要知道当时她已经看出来我对学术没有过去那么热情了,并且当时她刚休完产假经费并不宽裕”,姚邦鹏在知乎上回忆说。
李飞飞在斯坦福的课总是爆满,有人说,对她记忆最深的一句话总是她在课堂上那句,“来晚了的同学们,走廊上有小椅子可以坐下”。
在2016年11月,李飞飞自己也加入了工业界,“我将利用学术假期,在谷歌云计算担任人工智能机器学习(Machine Learning, ML)部门的首席科学家。在这段时间里,我也会继续和斯坦福的同事、博士后、研究生一起工作”,对于这一作安排,李飞飞自己是这样解释的。
实际上,几乎就在2012年那场ImageNet大赛之后,工业界开始争夺学术界的人才。谷歌买下了辛顿的公司,让辛顿去主持谷歌的人工智能研究;而辛顿当时的伙伴——乐坤被Facebook抢走,吴恩达,斯坦福教授机器学习的重要教授,被百度请去带领百度人工智能研究;因此,李飞飞进入谷歌外界也并不意外。
对于这些人来说,谷歌和Facebook这些大公司有他们在学术界难以获得的机器和数据,而这是研究所不可或缺的。
进入工业界后的李飞飞不忘记强调她的愿景。在2017年3月的谷歌云大会上,李飞飞谈及AI“民主化”,强调和呼吁谷歌把平台、算法以及数据向外界以及其它公司开放,甚至是人才也要和外部公司合作。
这种对AI“民主化”的强调为几个月后她回到中国埋下了伏笔,2017年12月,李飞飞在上海宣布回国主持谷歌在中国的研究中心。
“我们重点关注基础AI研究,与学术界建立合作关系,在本土合作上有所建树,提供AI和机器学习的教育支持。我们很珍惜这次Google和中国顶尖AI人才合作的机会,这些人才也势必是全球顶尖的AI人才”,在大会上,她这样介绍这一研究中心。
你也可以看作是对人才的争夺。谷歌在英国收购了人工智能创业公司DeepMind之后就竭尽全力的在挖空英国的人工智能人才,这个创业公司的团队规模从100 人扩大到了大约 250 人。而现在,这种研究中心在中国的开设,毫无疑问也是如此。
从另一个角度,这些人并不像李飞飞那个时代那样,仅仅是聚集在美国,他们在英国、在中国和加拿大,这本身就是李飞飞说的“民主化”。
在李飞飞回到中国的时候,辛顿回到加拿大去主持一个国家资助的实验室,这些人,在二三十年后又以另一种方式在移动,在一个技术更为民主化的现在。
版权声明
本文版权归“腾讯深网”公众号所有,如需转载请在文后留言,经允许后方可转载,并在文首注明来源、作者及编辑。