2016年被称为AI(人工智能)元年,而在这一股人工智能浪潮中,李飞飞注定是一个无法绕开的名字。作为斯坦福大学人工智能实验室和计算机视觉实验室的负责人,这位气质出众的人工智能大咖此前一直在科研界工作,她所带头创立的 ImageNet 是目前世界上图像识别最大的数据库。每年举办的 ImageNet 计算机视觉比赛都会吸引全世界这个领域的顶级研究团队参与其中。
她曾在不同场合解释说:云是最适合人工智能发展的平台,不只是存储,更重要的是数据计算。此前,随着人工智能专家学者一个个投奔各大科技公司,不管是学界还是工业界,几乎整个人工智能领域都在等待李飞飞出山。利用其拥有的两年“学术假”,2017 年 1 月 3 日,李飞飞正式加入 Google Cloud (谷歌云)担任首席科学家。
■ 本报综合报道
“我爱普林斯顿,也爱我的洗衣店”
这是一个人工智能界无人不知的名字。
她是斯坦福大学的终身副教授,人工智能实验室主任,在一流计算机期刊上发表合计超过100篇学术论文。她最大的贡献,便是主导的图形识别项目,每年吸引着包括Google(谷歌)、Facebook(脸书)、Amazon(亚马逊)等科技巨头在内的上百家顶尖机构,共同向前推进机器智能的边界。
“人工智能“这个概念因为 AlphaGo (阿尔法狗)的横空出世而快速走进了大众的视野,李飞飞本人也开始走出实验室,到更广泛、实用性更强的商业与工业领域试水。2016 年 11 月中旬,Google 宣布了李飞飞教授和前 Snapchat 研究主管李佳这两位华裔女科学家将担任其云机器学习部门负责人的消息。这在当时就轰动了业界,因为与来自斯坦福大学的另一位华裔人工智能领袖吴恩达不同,李飞飞此前一直专注于实验室,她并不是一个注重和工业界联系的教授。而这次她个人做出的改变可能也代表着她对行业认知的转变,其将加入的团队即是致力于将尖端技术融入各种 Google Cloud 产品中。
在今年1月中旬,她飞来中国连续参加了几场人工智能领域的活动,再次刷新了国人对这位华裔女科学家的认识。尽管她过去每年都会回中国探亲,但这是她从实验室踏入工业界后第一次来到中国。1976年出生的李飞飞,年仅33岁时便获得了斯坦福的终身教授职位,不仅是斯坦福AI实验室唯一的女性,也是计算机系最年轻的教授。在巨大的科研成就背后,李飞飞还隐藏着一段颇为传奇励志的人生。
李飞飞的父母是上世纪90年代来到美国新泽西洲Parsippany小镇的。初到美国时,全家英语都很差。因此,光是李飞飞的入学就颇经历了一番周折。她在镇政府、教育部门、多所高中之间奔走数月,好不容易进入一所当地排名中等的学校。
入学之后,怎么挣钱养活自己成了大问题。父母只能找到相机修理、超市收银之类的工作,微薄的收入远不足以支撑全家的生活和学费,李飞飞不得不分出大量精力,在唐人街中国餐馆打零工。
这时,距离美国的大学入学只有2年时间。如果想要进入一所好大学,李飞飞不仅要在少得可怜的学习时间里,迅速掌握英语,还要拿出一份极其优秀的成绩单,只有这样,才能拿到顶尖大学的奖学金。否则,以他们的家境,是付不起美国私立名校的高昂学费的。
最辛苦的时候,她一天只睡4个小时,奔忙于工作和学习之间。
李飞飞做到了。高中毕业时,她收到了普林斯顿大学计算机系的全奖录取通知书。她的成功在小镇上名噪一时,有报纸专门刊载了她的故事。普林斯顿的学术生活对李飞飞而言是幸福的。在这里,她接触到了大量的优秀人才。但是,她的父母却仍在Parsippany过着艰难的生活。李飞飞敏锐地注意到了市场上的机会,她决定借钱买下一家洗衣店,交给父母经营。她从此过上了双重生活,周一到周五,她是普林斯顿的高材生,拼命努力吸收知识;周六到周日,她则走出实验室,穿上白围裙,给洗衣店帮忙。她笑言:“我非常爱普林斯顿,不过也非常爱我的洗衣店,缺少了它们中的任何一个,都没有现在的我。”
攀登人工智能发展道路上的高峰
1999年,她从普林斯顿本科毕业。当时正值著名的大牛市,华尔街的金融人士在全世界都可以横着走。众多投行和咨询公司都向她发来了邀请,数十万的年薪眼看唾手可得。
这个自从来到美国以后,就饱受经济压力的乖乖女,却少见地叛逆了一回。她决定去西藏研究一年藏药,之后去加州理工学院攻读博士学位。这种追随内心的热情和强硬坚韧的作风,始终贯穿着她的行为轨迹。博士毕业后,她选择了当时还不太流行的图像识别作为研究方向。
图像识别技术,是人工智能发展道路上的一座高峰。简单来说,它就是要教会计算机看图说话。要知道,“看到”和“懂得”是不一样的。比如,你可以告诉计算机,“猫”就是有着圆脸、胖身子、 两个尖尖的耳朵,还有一条长尾巴的东西。
可是,如果图片是猫的非正常身体姿态,就很难了。一个3岁小孩都能从图片中识别出“猫”,可是计算机却做不到。李飞飞研究了很长时间,始终没有突破。交好的教授都劝她换个方向,以便拿到tenure(终生教职:在西方高校,有了tenure就相当于终生的职业生涯都有了保障)。
她没有同意。有一天,李飞飞突然意识到,由于人眼每200毫秒就能获取一幅图像,一个3岁儿童可能已经获得了上亿次的图像识别训练,是计算机的几何级倍数。也就是,关键在于自主训练量。
李飞飞马上开始着手,从twitter(推特)上抓取海量照片,将它们统统打上标签后,训练计算机进行机器学习。机器学习(machine learning),就是给出一定算法,让计算机自己学习。
这个过程是艰苦的。如今,机器学习已经是热门概念,可在2007年,李飞飞的实验室缺少人手,又申请不到经费。最困难的时候,她一度想重开洗衣店,筹集实验资金。
之后,她从亚马逊的众包平台中找到了解决办法,让全世界的网友一起给图片打标签。当时,李飞飞的研究项目,一度是该众包平台全球最大的雇主。就这样,一个前所未有的庞大数据库建成了,这就是大名鼎鼎的ImageNet。
“我们专注在计算机视觉领域的一些最艰难的问题,给感知和认知建立一个桥梁,”李飞飞说,“不仅仅是处理像素的数据、知道它的颜色、阴影,而且把它们转变成 3D 形式进行更全面的理解,带来语义视觉的世界。”
李飞飞没有敝帚自珍,而是将ImageNet数据库开源,供学术和商业界的每一个实验室调取。图片识别技术从此飞速发展,如今已经能辨识出大部分照片中的物体,还能用高度拟合的人类语言,将它们描述出来。
由于学术成就卓著,李飞飞收到了很多社会活动的邀请。她曾经接受过纽约时报的访谈,也曾登上 TED的舞台,讲述图形识别技术发展的背后故事。李飞飞还组织了一年一度的 ImageNet挑战赛,邀请谷歌等科技巨头参赛,促进图像识别和人工智能领域的交流。
图像识别下一步将交棒工业界
在1月中旬连续参加完“极客公园 2017 创新大会”以及“未来论坛”等多项国内热门活动之后,李飞飞不止一次和团团围住她的记者们表示“我是来学习的”。她说自己实际上并不太了解中国的人工智能。“中国的文化我是懂的,我是中国人,但中国的公司我就不太了解了。”
短短一周的时间里,李飞飞见了很多国内的公司,与中国学术界的朋友也交谈了很多。“我这次回来,就是想了解现在国内相关行业的情况,了解国内学术界对人工智能的想法。”李飞飞表示,她完全没有想到国内对人工智能的热情如此之高,也没有料到自己竟意外地身处这股风潮的正中心。
另外,李飞飞还多次提到“传承”,她反复强调了解过去的重要。“我个人的心得是,眼睛看到的前方应该是比较空旷的。”她说:“如果你眼睛看到的前方是热闹的,那这个方向就不是最好的研究方向。而空旷的地方一般都不是热点,因此你必须找准自己的焦点。”李飞飞坦承,她不是一个特别关注热点的人。“如果我关注热点,就没有今天的ImageNet。”
在李飞飞看来,目前的图像识别与人工智能,还只相当于一个牙牙学语的3岁儿童。而从3岁到10岁的过程,才是 AI 技术的难点和关键。未来的 AI 开发,将交棒给工业界,这也是她加入谷歌的原因。
“人工智能现在越火,越希望冷静做研究的人。”公开和私下,李飞飞都在这样强调。