信息学铸就的世界冠军,让“人工智能”不再冷门的时代领袖:戴文渊

戴文渊

他曾因为 NOI 获得银牌保送上海交通大学,在交大三度在 ACM-ICPC 亚洲区域赛上碾压清华、北大赛队夺金,曾在 ACM-ICPC 世界总决赛上率队夺冠。他的身上光环无数,曾经获得上海交通大学校长奖、全国三好学生标兵、“最佳百度人”、华为“President Award”、吴文俊人工智能科学技术创新奖一等奖、《财富》中国 40 位 40 岁以下商业精英、MIT 35 位 35 岁以下科技创新杰出精英……

学校里的“奇葩” 信息学的“大神”

在苏州市沧浪区实验小学上学的戴文渊就发现编程很有意思、很好玩,就对编程产生了兴趣。进入苏州中学后,戴文渊开始真正钻研信息学:“其实一开始也没有什么擅长不擅长的啦,主要就是觉得感兴趣,所以会喜欢去做。高中以后为了准备竞赛就和一帮同样爱好编程的同学一起,经常在一间小教室里讨论研究啊什么的。”

如果用大众的眼光来评价高中时的戴文渊,可能最适合形容他的词是“奇葩”。高一的时候,戴文渊和同学一起搞了一个班级网站,上面有各种学校和班里的奇闻轶事,也成了同学们戏耍的另一片乐土。有一次数学课代表忘了收他的数学作业本,戴文渊自此之后就不再交作业了;不过,他的数学成绩依然在班里名列前茅,老师也就不再怎么管他。

大学时的戴文渊曾在博客里回忆高中生活:“我一直觉得我的高中是厮混过来的,正经事没做几件,荒唐事却干了不少。就说高中的数学课吧,我应该有大于百分之五十的课在睡觉,百分之六十的作业是抄的。”

少年时代的戴文渊
少年时代的戴文渊

然而,这样一个常人眼中的“奇葩”在信息学方面却是一个真正的“大神”。早早的他就拿下了 NOI 的银牌,获得了清华大学、上海交通大学的保送资格。据他高中同桌的父亲介绍,高三时,戴文渊还曾经用两三个月的时间把同学带成了 NOIP 的一等奖,被他带出来的同学最终被国防科大提前录取。

中学时选择做信息学竞赛并且坚持下来往往离不开父母的支持,在戴文渊的眼中他父母对他的选择一直都很支持:“他们基本上不太管我的事,除了一些原则的道德底线问题他们会教育,其他的事一般都随我,总之他们都是蛮开明的人。”

放弃清华去交大 大三获全球总冠军

在保送的选择中,最终戴文渊选择了上海交通大学。在很多人眼中,戴文渊放弃清华大学的录取通知书去了上海交通大学可能也是一个“荒唐事”,但是在戴文渊看来,这是一个非常正确的选择。

2002 年的寒假,作为进入了上海交通大学教改联读班的候选人,戴文渊提前参与了学校程序设计竞赛的训练,见到了很多的牛人。

刚进入大学时的戴文渊(左一)
刚进入大学时的戴文渊(左一)

暑假后,戴文渊正式进入了上海交通大学教改联读班,两个月后,随着上海交大计算机系“ACM试点班”在俞勇老师支持下的成立,戴文渊转入了以“培养计算机科学家”为主要目的的这个新试点班。

对于戴文渊来说,他的这个选择意味着选择了一个良好的环境、一批优秀的人,戴文渊曾表示:“我后来的成长也得益于这我一直觉得我们班这个集体是相当优秀的,倒也并不一定是出了什么优秀的人或者成果。我们班的氛围令我沉醉其中。在这个班里,我见识了完全是自发的考前全班集体自修的场面。”

2003、2004 年,戴文渊和队友代表上海交大在 ACM-ICPC 亚洲预选赛中拿下了三场冠军,在国内力压清华北大和浙大。

2005 年 4 月,ACM-ICPC 全球总决赛上,总共 5 个小时的决赛已经进行一个小时了,他和另外两位同学代表的上海交大代表队作为东道主仅仅完成一道题,而别的队伍已经完成了三道题。

戴文渊当时不停地对自己说“要专注于自己的目标,排空任何杂念。时间还有四个小时,关键是我们要把握好后面的时间,不能计较一时的得失。”

离比赛结束 8 分钟时,他们拿下了最后一题,反超!这次比赛他们成为了唯一一支解答出 8 道题的队伍,毫无悬念地赢得了大赛冠军。骄傲的代表上海交通大学站上了 ACM-ICPC 的最高领奖台,享受来自台下来自麻省理工学院、清华大学等众多牛校的选手热烈的祝贺。

ACM-ICPC世界总决赛时的戴文渊(右三)
ACM-ICPC世界总决赛时的戴文渊(右三)

在总结信息学的学习经历时,戴文渊将成功归结于“跟大牛”和“好的环境”。

戴文渊:“跟大牛很重要,我说的这个大牛自然是 lincx 啦。从进队的第一天起,我就开始模仿 lincx 的套路,一直模仿到了 2005 年拿到冠军。虽说是模仿,但这一路做下来,基本上算是深刻理解这一套路的原理了。记得有一次比赛失利后,lincx 把我们叫到徐汇校区,和我们一起总结北京赛区的比赛。我记得,总结的时候,lincx并不直接指出我们队哪里有问题,而是从自己的角度向我们介绍,如果他们队来做这套题,会怎么做。”

在上海交大本科就读期间,戴文渊获得了 2005 年上海交通大学校长奖、2006 年全国三好学生标兵、中国青少年科技创新奖。

学习人工智能 算法底子奠定基础

作为一个当时只有 22 岁的青年人,戴文渊已经深谙成功之道,知道在获得巨大成功之后控制好自我认知的重要性。

在拿下 ACM-ICPC 世界总冠军后,2005 年 11 月的博客中,戴文渊写道“从调整心态做起,这是我必须开始做的。我不知道自己是否还有机会登上下一个顶峰。如果有的话,可能也需要几十年的时间。我必须有足够的耐心。”

本科毕业后,戴文渊并没有选择出国进修。在一些“不期而遇的事情”改变了他原本的计划后,他决定读一读研究生,给自己一些犹豫的时间。那时,学界最火的方向是“图形学”,而戴文渊却没有跟随这所谓的主流,选择了当时没人相信能做成的“人工智能”方向。

戴文渊在采访时曾经表示:“在那时没有人相信 AI 能做成,(都认为这个方向)毕业以后,成绩好的,能当个老师,成绩不好,那就算白学了。”

回母校与学弟交流时的戴文渊
回母校与学弟交流时的戴文渊

在“人工智能”方面,当时的上海交通大学本身并没有特别强的导师,系里就把戴文渊作为访问学生推荐到了香港科技大学,师从计算机系教授杨强。毫不夸张的说,跟随杨强教授的学习彻底改变了戴文渊的人生轨迹,当时的杨强教授不仅仅是从天体物理到计算机科学成功跨界的典范,更是人工智能的坚定信仰者,而杨教授的坚定引领和指导是“心里没谱”戴文渊所最需要的。

杨强的研究重点从机器学习转到迁移学习的研究。他也带领戴文渊投身其中,当时香港科大并未提供多少经费,因为当时最火的方向是凸优化,但是他们都坚定地坚持下来了。

戴文渊(左)和他的老师杨强(右)
戴文渊(左)和他的老师杨强(右)

读研期间,有良好信息学算法基础的戴文渊顺风顺水,将过去所学运用在了解决凸优化问题上,在诸如 NIPS、ICML、AAAI、KDD 等人工智能相关研究领域顶级会议上发表了《Boosting for transfer learning》等多篇高引用、对人工智能产业产生重大影响的代表作。

成企业争抢人才 为百度、华为做重大贡献

2009 年,曾经在本科毕业时立志潜心学术的戴文渊放弃攻读博士学位,转而加入百度商务搜索部。加入百度的戴文渊并非为了“高薪”,而是因为“百度庞大的数据”——“我给自己定下的KPI就是每天喝四瓶矿泉水,用最乐观的心态和最健康的身体做最重要的事。百度庞大的数据库拥有无可比拟的价值。”

2011 年,戴文渊晋升为百度商务搜索部科学家,担当主任研发架构师,负责百度最为重要的“印钞机核心”——百度凤巢策略团队模型组。

戴文渊在百度迈出了冒险的一步。他开始了世界上第一个商用深度学习系统的研究——“深度学习应用于凤巢广告”的项目。这个项目持续了一年多,屡次处于被砍与被不砍之间,戴文渊一直力挺,他坚持说这是一个比较重要的方向,一定要投入一些资源,做一些前沿的东西。

一年之后,效率提升的拐点来临了。此时,整个凤巢系统的团队都开始了向深度学习的转向,最终使得百度变现能力提升 8 倍,这让戴文渊的团队获得了百万美金的“百度最高奖”。

在百度时的戴文渊(右)
在百度时的戴文渊(右)

2013年,戴文渊迎来了一个事业新转折,不甘于被养起来的戴文渊选择了换一个更适合自己的环境——进入诺亚方舟实验室任主任科学家。

当时,华为正在与国际巨头争夺自己在金融领域的话语权,“去银行争解决方案,那个阶段的华为赢面并不大”有一次,在离给客户承诺的时间还有 2 星期时,一个问题当时的工程师怎么都调试不出来,大家压力都非常大。已经有 3 年没有写过代码的戴文渊花了15分钟把代码写完并解决了。对于帮华为在金融领域凿开口子这一点,戴文渊为华为做出了巨大的贡献。

自立门户 帮所有人掌控“人工智能”

然而,在华为攻城略地的日子并不是很长久。在戴文渊的心里,只为一家公司服务并不能满足他内心的欲望,他更宏大的愿景在于把人工智能的价值最大化。

2014 年,戴文渊和他的老师杨强一起成立了“第四范式”,用他们最擅长的迁移学习技术对数据进行精准预测与挖掘,帮助企业提升效率、降低风险,获得更大的商业价值。

创业后的戴文渊
创业后的戴文渊

著名信息咨询公司 Gartner 前不久发布了一份报告,评出了 2017 年度东亚人工智能领域最具代表性的五家公司,第四范式和其它三家中国公司就占据了四席。第四范式的拳头产品——国内首个人工智能全流程平台“先知”,还荣获了“吴文俊人工智能科学技术创新奖”的一等奖,这是中国在智能科技领域的最高奖。

现在的戴文渊和他的团队在一步步的向他们的终极理想迈进——“AI for everyone”,让每一个人都可以成为人工智能的参与者、使用者和创建者。就像 Win95 的出现和个人电脑的普及,让 PC for everyone 一样。

结语

从最初的信息学学习到拿下世界级比赛的最高皇冠,从进入冷门的人工智能研究领域到迎来人工智能大潮将所学应用于所需,戴文渊一次次攀登一个又一个新的高峰。

或许,他的成功来自于他每一个阶段的踏实,也或许来自于他高中时就已感悟的人生道理—— “人要有勇气去改变那些能够改变的事情,有涵养去接受那些不能改变的事情,有智慧去区分哪些是能够改变的、哪些是不能改变的。”

对于信息学学习,戴文渊也给后来者留下来很多的建议:

那么,如果身边没有优秀的选手可以借鉴,该怎么办呢?其实没关系。任何一个程序都是可以看的。一个程序,就算写得再差,总还会有一两个闪光点,要想办法把它们找出来。另外,程序里写得不好的地方,也要一一找出来。读程序,从某种角度来看,就像读史。好的历史是用来借鉴的;不好的历史则应该引以为戒。读程序也是一样,择其善者而从之,其不善者而改之。

这个世界上并不存在难题。只有“题”和“非题”。什么叫“题”?就是你用有限的时间(对于比赛来说是5个小时)可以做出的题。什么叫“非题”?就是不可能做出来的题。至于题目会有难易,实际上是因为我们给题目加上了对自己的“要求”。试想,一道简单题,如果要求 1 分钟内完成,是不是会变成难题?一道难题,如果给你一个月的时间去做,是不是就简单了?所以,本质上来说,题目是没有难易的。说到这里,也许你已经明白了,当你抱怨题目太难时,一定是计划作错了。

学习达不到自己预期时,也不用慌。每个人的预期总会或多或少的带点理想的色彩,所以实际的效果一般来说总是不如预期的。有时,甚至会出现只有预期的三分之一到二分之一的情况。但是,只要你坚持不懈地去做,不动摇自己的信念,最后的成绩一定不会差。记住,你遇到过的困难,你的对手也会遇到的。