张峥:人工智能发展趋势和中国面临的挑战

来源:上海发展研究基金会时间:2021-01-08

上海国际经济交流中心、上海发展研究基金会与中国与世界论坛秘书处于2020年12月27日在上海联合举办了“第六届 2050中国与世界论坛——中美关系变局和 2050国际格局”研讨会。亚马逊人工智能研究院院长张峥先生在研讨会“第二单元:2050地缘经济与全球科技发展趋势展望”作了关于人工智能的发言。以下是他发言的主要内容。


人工智能在进入八十年代后期的寒冬之前,曾经有过一个高潮,以日本的第五代计算机为代表,在花费了四亿美元之后宣告失败。但寒冬之中很多人工智能的应用和实践开始涌现,比如1997年IBM的深蓝在国际象棋上打败人类棋手。同年,有两个美国NASA的宇航员,也是围棋爱好者,把围棋带入太空,这也可以看作一个象征,宣示以围棋作为人工智能和人类智能的边界,因为围棋的变化超过宇宙的原子数。

后来的故事大家都知道了:20年之后的2017,谷歌的AlphaGo从零开始学习,完败人类围棋棋手。

2012年,加拿大学者Jeff Hinton(2019年图灵奖得主之一)和他的学生采用深度学习的模型在一个物体识别的数据集上大幅度超越已有模型,从此正式开启链接主义碾压符号主义的道路。不过,我个人认为链接主义和符号主义各有优劣,今后必有重新整合的可能和需要。

深度学习的成功有几个关键因素。其一是有互联网和在其上催生的众包服务,收集大量数据。第二是硬件加速,GPU从专用游戏卡变身提升训练速度的利器。GPU进入超算早于深度学习,但并没有因此带动一个生态的发展,深度网络后来居上,成为契机。第三是实用型模型发力,理论上不清楚也没关系。事实上,学界到现在还没有彻底搞清楚为什么深就是好。


另外一个重要的推动力是全方位的开源,论文可以在被会议接受之前先发布预印本(https://arxiv.org/),一般还同时会发布代码,这使得研究迭代速度大大提高,论文发表连续出现指数增长。这个趋势尚不见趋缓,顶级会议上2020年和三年前比较,文章翻了三倍,非常惊人。

论文数暴涨还有两个原因,一个是作者的年轻化,研究力量从研究生“下沉”到本科生,申请国外好学校手里有几篇顶级会议的文章成为常态。我就有学生在本科毕业已经有11篇,在我们研究院实习的时候又做了6篇,论论文数,已经超过博士的标准了。



另一个原因是工业界的研究院的投入,上图可以看到谷歌、脸谱、微软、IBM等等,在超级顶会Neurips’20中超过30篇的队伍中加起来的总量惊人。表明(1)工业界的投入非常大(应该远超于一般学术会议中来自工业界的比例)。(2)这一波研究的实用性很大

我个人认为智能可以分成两部分。一部分本质上是数学问题,比如围棋,这方面人工智能超越人类智能已是定论,另一类和人类特有的智能紧密相关(常识、情感、推理、人类的创造力包括数学和物理系统、艺术等等),这方面人工智能还没有找到合理的路径,甚至可以说还没摸到门。如果我们不了解人脑是如何工作的,可能永远不能,因为人类的进化历史无法重复,也因此缺乏原始可信的数据。

中国学者的身影如何呢?一般说来,我们可以认为有两类研究工作,一类“挖坑,”贡献大的idea,一类“填坑,”把坑中的其他问题搞清楚。这两类互动的研究,合二为一,是一个自洽的生态。中国学者基本上属于填坑人。从2012开始到现在八年了,我还没看到来自国内学校和单位的挖坑工作。但是,填坑的石头有大有小,近年一个明显的趋势是来自国内的石头越来越大,质量也越来越好,这是很可喜的。比如在上面的30+梯队列表中,清华在第七,北大二十一。

需要注意的是,因为开源研究,“赶超”二字水分很大。把别人的论文读懂了,代码跑通、复现结果,就赶上了,这可能是在预印本发布之后一周之内就能搞定的事。把模型修改一下,调整下参数,就“超”了。显然,这不是真正意义上的超越:研究的第一步是最难的也最有意义的,需要深厚的功底,需要有刨根问底的能力,需要好奇心,把这个“短路”了,只能沦为更高效的填坑人。

中国学者能不能从填坑人变身成为挖坑人,我持保留态度。不过,需要说明的是,这是一个完整鲜活的生态,填坑速度快,也激发、启发挖坑人加快步伐,不能说填坑人没有用。

以上是研究的情况,我们在看看落地和应用。我常用的一个比喻是取一桶水去浇地,各处湿度有深有浅。某种商业操作,只要数字化完整和快速,就收益更多更快。在落地方面,中国迅速获取红利,这和企业和民用数字化快和弯道超车、数据获取容易、用户多反馈快紧密相关。我觉得领先世界没有争议,甚至在用户体验上有很多创新。但在原型发展上,首发少,开掘市场快。换句话说,和研究不同的是,中国企业在本地市场同时是挖坑人也是填坑人,然后再迅速扩张到海外。

最后讲一下问题和挑战问题。


前两个无关国界。其中一个大家最关心的是对就业的影响。比如机器可以读片了,还需要放射科医生吗?结论是不会利用AI做辅助工具的放射科医生确实会失业。新工具的出现需要新“工人”,哪个时代都是如此,没有例外,我在这方面的焦虑并不大。

焦虑比较大的是互联网+AI造成信息茧房和极化迅速加剧。这是一个信息同时极大又极小的时代。同类聚合是天性,但目前的问题是信息过剩加上AI投喂,造成了某种意义上的(个人)信息黑洞,每个人都可能成为反智主义者,如果不是原创者,也是传播者。

对中国来说,有自己特殊的问题。比如软硬件的生态是全球化的,依赖不可避免,这个问题大家已经说了很多。第二是缺乏从0到1的能力,却是从1到无穷大的霸主,我想每一个认真的学者,都不会觉得这是件值得骄傲的事情。第三是原始、粗暴、不尊重隐私的数据积累,和文明走向相悖,应该尽早结束。

最后最重要的一点,在中国比哪里都更容易把科学宗教化,带来两个毛病:表现为盲目自信,盲目迷信。这些问题,在最近围绕量子计算的公众解读和争议中,体现明显。