经济学原理

2018,如何拥抱人工智能活动演讲


年1月10日晚,由正略集团和中伦律师事务所共同主办的新年论坛系列活动在北京国际饭店揭幕。著名互联网专家、乌镇智库理事长、《人工智能简史》的作者张晓东先生,在《人工智能专场》活动中做以主旨发言。他结合英国数学家图灵、AlphaGO等实例详细描绘了人工智能的发展史,并分析了人工智能的发展现状及对其未来作出预测。他表示,在人工智能领域,中国属于世界第一梯队,并且在很多子应用领域都有领先美国的趋势。在现场互动环节,与会嘉宾踊跃提问,张晓东对各式问题一一解答,妙语连珠,现场掌声不断。现摘录金句如下:

1、尽管说现在有各种各样的机器学习的算法,但是在短期内我们还看不到强人工智能。

2、一个是来钱最快的金融,任何一个新技术,第一个都是金融,金融行业离钱最近;第二个是医疗。

3、从政府招商引资的角度看,一是看在这个产品市场上有没有竞争力,二是从本地角度来讲,能否提供发展环境或者产业链的支持。

4、IBM医疗并没有读病例,读的是论文,因为论文对这个病的描述和用药是有严格的格式的。

5、在技术突破方面,比如自然语言处理可能今年会像人脸识别、语音处理一样流行。

6、中国跟美国无论在技术上,在产业上,还是在投融资方面的距离会越来越短,今年有可能在几个特定的领域里面,中国甚至会更大程度的领先美国。

张晓东完整版现场演讲实录

人工智能,是最近一段时间从领导人到老百姓都广为热议的话题。这次乌镇大会期间,王沪宁常委到乌镇大会致辞,他提到两个潜在的、在不久的未来就会影响到人们生活的技术,第一个是人工智能,第二个是量子计算。

今天我讲两个方面的东西:一个是从历史的角度来审视什么是智能以及智能是怎么来的,然后我们再看一看人工智能的发展;后面我会从我们研究的成果,去看人工智能现在是什么样的状况,在稍微可预见的未来,人工智能会变成什么样的情况。

人工智能这个词“ArtificialIntllignc”,大家都在讲,这个词是怎么来的,很多人都说是年达特茅斯会议上麦卡锡提出来的。后来我考证了一下,麦卡锡在八十几岁临死前的一次采访中,说过“‘人工智能’这个词实际上也是从别的地方听来的”。那么到底是谁提出来“人工智能”这个词,现在已经没办法考证了,我的书里其实写了一段这个段子。所以说人工智能,我们最早还是要从自然的智能开始看。

自然智能大家最容易想到的就是:人跟动物有什么区别?人们往往说人跟动物的区别就是人的大脑更发达。但大脑更发达是用什么东西来度量,很多人说人的大脑最大,但是事实上并不是这样。这个有证明:大象的脑子、鲸鱼的脑子从体积和重量上都要比人的大脑要大。那肯定有人要说人大脑的质量要比大象大脑的质量要好,不是体积和重量的问题。这个问题大家认为是一个常识性的问题,但是这个问题一直没有得到精确的回答,一直到几年以前一个巴西的女生物学家做了大量的工作,最后她写了一本书,这本书在国内好像翻译成“超级人类或超级大脑”。她在这本书里面,几乎把她十年间的工作做了一个总结。她这十年干什么呢?她一直企图解开“人的大脑是不是在质量上比其他动物的大脑质量高”。质量高低用什么衡量呢?很多人说可以用脑子里神经元的总数来衡量,所以年她在开始这个工作的时候,问过很多同行生物学家,问人的大脑里面到底有多少神经元。她问过很多得诺贝尔奖的脑科学家,他们说大概一千亿。但是她查了好多资料,这个一千亿没有出处。

所以她一直企图揭开人大脑里面到底有多少神经元。历经千难万险,为了把人的大脑和其他动物的大脑做对比,她跑到非洲去,把被猎杀的大象的大脑放到冰箱里,偷运回巴西,这期间发生了很多很好玩的故事。然后她对各种不同动物的脑子做了解剖,而且发明了一些独特的标记手段,能够测算出来不同动物的脑子里面到底有多少神经元。最后她得到比较精确的答案——人脑实际上不是有一千亿个神经元,而是大概有亿个神经元。大象的脑子有多少呢?大象的脑子有亿个神经元,比人脑还要多。比人脑还要多,为什么大象不如人聪明呢?她又做了更详实的实验,最后她得出这样的结论:人和动物的脑子都有大脑和小脑之分,人的大脑比大象的大脑神经元多很多,而由于小脑驱动身体运动,大象身体庞大,它就需要比较大的小脑来协调它的身体运动。她在这方面做了大量工作,而且还在美国做了TED演讲,这个演讲后来造成很大的轰动。

如果用神经元来测度不同动物的智能水平的话,你会看到最低级的动物一直到最高级的动物的演化过程。人有更发达的神经系统是跟能量有关系的,人的大脑占人体重量的2%,却消耗人每天摄入能量的25%。直立行走的动物比爬行的动物更消耗能量,这是一个进化的结果。人这个物种在某一个节点上发明了烹饪技术,烹饪技术可以把东西做的更好吃,那么就有更强烈的动机去消耗摄入的更大能量。作为大象因为它太大了,所以它把它的能量都用在了协调身体不同的部位上。从进化的角度来讲、从智能的测度上来看就是人通过消耗更多的能量来给大脑提供养料,人就变得越来越发达。

再来看看能量,能量是很有意思的事情,我们先把智能放在一边,来看一看能量在过去几千年是怎么发展起来的。关于这个也有一本很好玩的书,斯坦福的历史学家几年前写过一本,也是畅销书,实际上是比较学术的著作,但是他最后这个书卖的很好。我们过去一直说,我们有几千年的文明。我们这几千年的文明用什么来衡量,最后他得出一个结论,他说在过去几千年里面,如果我们用人均能量的摄入来考核人类发展的话,西方实际上一直都要比东方发达。比方说公元前年开始一直算到现在,西方人均能源消耗都要超过东方,只有在很短的时间是例外的,罗马帝国衰败一直到工业革命开始,中间大概历经年,东方略微超过了西方。

但是工业革命之后,西方的人均能耗巨幅提高,亚洲国家的能耗则是鸦片战争之后才开始提高的。所以从某种意义上,鸦片战争之后的年到年,十年间西方打开了东方的大门,同时也教授了东方更好地、更有效地消耗或者摄取能源的方式。但是他的这个定义也有争议,因为“东方西方”的分法不合常规。大家知道有一本很有名的书,叫做《文明的冲突》,大概十几二十年前在国内有出版,它对人类文明做了三分法,不简单是东方和西方,而是“西方、东方、穆斯林”。但是能量摄取研究里面,他是把西方和穆斯林包含在一起考虑,就是西方和穆斯林统称西方。他有他的考虑,比方说他有人种的考虑、有地域的考虑。但是如果说,我们用三分法来看,同时也用Moranc的方法来看的话,我猜想可能西方领先中国、领先东方的程度要更大一些。

能量的来源是多样化的。目前能量主要的来源还是碳能源——煤、石油、天然气,然后关于核能可以看“蓝曲线”,核能在一段时间有很快的增长,但是这几十年核能并没有很快的发展,因为安全等各种各样的因素。如果把社会总的发达程度来做一个衡量的话,除了能源消耗,在现代社会我们还有新的手段来衡量,这就是学术的进步。学术的进步可以用学术出版物来衡量。从这个图大家可以非常精确地看到,能量的增长几乎是一个线性的增长,但是学术的增长是指数性的增长,尤其在过去几百年有了印刷术之后。

人工智能是从自然到人工的,其中起源之一是英国的数学家图灵在年写的一篇文章《计算机器和智能》。为什么不简单的叫计算机呢?因为那个时候,50年代的计算机指的不是我们现在意义上的机器,“计算机”在英语里面指的是人。就像大家知道操作员,或者电话刚出来的时候接线员,计算机指的也是人,实际上是在50年代末60年代初开始,这个词才指计算机。早期所谓计算机就是人肉计算。

那个时候很刻意强调电子计算机,现在很少说电子计算机,原因就是没有区别了,现在指的就是计算机。另外电脑这个说法在50年代和60年代初在英国曾经风行过一段,后来没有了。学术进步更快的表现就是摩尔定律,摩尔定律是什么大家都知道。摩尔是英特尔的创始人,根据半导体发展的趋势,他总结出来计算能力或者说存储能力、或者说普遍的信息处理能力,每12到18个月加一倍,就是说你过十个周期的话,就要翻一千倍。我们把学术出版物、整个社会累计的数据量、摩尔定律,还有整个社会总算例放在一起,发现摩尔定律的增长要比学术出版物还要快,也就是说有了学术之后,人类社会得到了指数级的发展,但是有了新的信息处理技术之后,人对数据和自然的掌控,又有了指数级的提升。

人工智能的来源在哪儿?谷歌曾经做过非常有意思的工作。在年,谷歌刚刚开始成立的时候,谷歌的创始人就一直有一个情怀,他想把全世界所有图书馆里面的书都电子化。这个电子化不是说扫描出来做成PDF,而是做了所有语言的处理。后来因为出版社各方面跟他打官司,结果没有公布。但是统计的结果公布了,谷歌在年之前,扫了大概有万本书。这万本书里面所有词出现的频率他都做了统计,并且把这个统计做成一个产品发布了。

这个产品发布了之后,在学术界就非常有用。举几个例子,大家知道“美国”的英文“UnitdStats”,后面是复数,既然是复数,后面我应该说“ar”还是“is”,谷歌扫了万本书之后告诉你这个规律——南北战争之前主要的英文出版物都说“ar”,到南北战争之后就变成了“is”。用谷歌等工具你可以做很多很有趣的发现。

既然咱们今天聊人工智能,那我就做了一个很简单的工作,谷歌这个工具丢进去,你会看到控制论是在40年代产生,50年代到达顶峰。人工智能是50年代才出来,60年代、70年代、80年代,因为谷歌这个工作做到年就为止了。年之前有一段时间,人工智能这个词没那么热,那个时候是人工智能的低潮期。其实在年之后,由于深度学习的发现,人工智能又有很大的提升。这些工具告诉我们人工智能的历史,实际上也是起伏变迁的。

除了能量、学术、算例,还有一个是钱——投资,整个在人工智能产业的投融资的情况我们也做了一个对比。这个行业的投资,在过去几年几乎和摩尔定律是同步的。人工智能到底是什么在媒体上有两派观点,一派是人工智能永远超越不了人类;还有一派观点是英国物理学家Hawking提出的,说人工智能将来某一天要颠覆、取代人类。

人工智能一直有所谓的强人工智能和弱人工智能之分,所谓弱人工智能就是指在人们认为是人的智能属性的某一个方面,机器超过了人。这一点大家毋庸置疑,深蓝以及阿尔法狗,获得了如此之大的胜利。现在如果是两个好一点的机器之间下国际象棋的话,人类大师、特级大师是看不懂他们在下什么的。当年深蓝赢的时候,特级大师可以看大概13步,但是深蓝那时候可以看13步半,深蓝多比他看了半步,人就不可能有任何机会赢。所以可以反过来,看你怎么理解这个事。现在去美国的高中去看,美国几乎每个高中都有一个象棋队。30年前,那时候我刚到美国,高中象棋队里面很少有选手积分可以到,现在随便一个高中象棋队里面超过的孩子,几乎到不了就进不了象棋队。这说明现在的小孩有很多机会去跟机器学习。在过去20年前,30年前小孩不可能跟特级大师比。所以说到弱人工智能的话,在某一个方向上面机器超越了人,这个已经毋庸置疑。

强人工智能就是说有这样的人工智能,他能够在人类表现出智能的所有方面都超过人。关于有没有强人工智能,现在有争议,至少短期是没有的。但是我们总是要探讨强人工智能到底是不是可能的。强人工智能如果会发生的话,意味着将来会有机器全方面取代人类,《未来简史》作者的那本书的英文题目叫《神人》,现在的人是智人,将来的人是神人,将来的神人可能是机器了,就像人类也有一个进化的历史。

至于什么是智能,我们又要回到伟大的英国数学家图灵。图灵在年的时候写过一篇数学的文章,定义了“图灵机”。我们可以说现在还没有任何一个新的机制比图灵机更强的,当然量子计算有可能在某些方面超过图灵机。如果我们把图灵机当做智能的定义或者智能的衡量尺度的话,机器超过人是迟早的问题。机器不断变得越来越快,处理信息的能力越来越强,但是人不可能像机器这样。图灵被公众认可是在年,当然他在年的时候就写过一篇文章,这两篇文章里他定义了“图灵测试”。“图灵测试”是一个概念,我做一个简化的版本:假设说你把一个机器放到房间里面,机器对外的沟通是通过递纸条的方式;如果你不断的递纸条、问问题,机器回答问题,过了很长时间,人从外界都没法断定里面的物体是机器还是人的话,那么机器就是智能的。

超级智能有很多种说法,大家知道图灵除了在计算理论、人工智能方面是鼻祖之外,他还是二战的时候英国破解德国密码最重要的功臣之一。他提出了“奇点”,所谓奇点,就是机器超过人的时刻。谷歌有一个未来学家,谷歌里面有很多程序员非常看不起他,他总是在那儿不断的预测,他预测的结果就是奇点会什么时候发生。有很多不同的时间点,有的人说,有的人说,他基本是说大概几十年之后,这个奇点就会来了。

我刚才讲了《未来简史》和“超级智能”,那图灵是怎么定义计算的以及图灵机是什么东西。图灵机是异常简单的东西,两张图灵的照片下面,就是一个无限长的纸带,上面有一个有限自动机,有限自动机可以打零或者打一,或者往左移,或者往右移,这是图灵机,在数学上还没有人想出比这个装置更强有力的装置。伟大的数学家哥德尔,想出来递归函数,他一直在问自己一个问题,递归函数是不是最强有力的表达手段?他自己没有信心。但是他看到图灵机之后就有了,递归函数跟图灵机是等价的。目前人想出来所有的东西,都跟图灵机等价有关,图灵机又是这么简单的东西,就是无限长的纸带,上面打零打一、左右移。这个东西在数学上可以证明等价于现在我们发现的所有计算装置,所以在数学上我为什么说你可以把图灵机当做至少是一个智能方面的测量,因为你想不出别的更好的方式。

大家知道图灵的遭遇是很悲惨的,因为他是同性恋。关于他的八卦,有一个英国的数学家给他写了一本传记,那本传记八几年写的,现在有很多新的材料,原本就是基于他那本传记。图灵因为同性恋的遭遇,受到了一定的歧视,在四十几岁的时候自杀,那时大家公认他是自杀,但是他母亲不承认。他死的时候床头上有一个苹果,这个苹果被咬掉了,苹果上被鉴定出来有氰化钾。所以很多人开玩笑说,苹果公司logo少了一口就是因为图灵咬掉的,这个乔布斯已经公开说了。后来乔布斯开玩笑说“我倒是希望当时想logo的时候有图灵这么一个高大上的形象”。直到英国的首相、英国皇室对图灵道歉,他们认为50年代图灵遭遇了不公正的待遇。这确实是一个非常感人的故事。

还有一个非常有意思的发现,有一个中国非常天才的数学家叫洪加维,他的结果在80年代的时候有很大的轰动性。因为这个结果已经被大家默认了,默认之后大家就不会再提起来洪加维这个人,他提出的相似性原理是在图灵上面的一个结果,任何一种计算装置都可以模仿,都可以被图灵机来模仿,图灵机也可以被其他的足够强的计算装置来模仿。洪加维提出“机器之间互相模仿的成本是多项式的”,从计算的复杂意义上说,多项式成本是很低很低的。别看图灵机这么简单,如果用图灵机来模仿我们现在最强的超级计算机的话,图灵机的模仿成本只是多项式级别,不是指数级别,是很低成本的模仿。这个实际上也是一个很深刻的观察,所以洪加维把这个叫相似性原则。有了相似性原则,我们就朝着智能定义的方向更进一步,如果说你想不出来比图灵机还强的计算装置的话,起点的来临还真是有可能发生。

超越图灵机的东西可能的话就是量子计算,量子计算可以变成一种通用的计算方式。量子计算是不是比我们常规意义上的计算机或者图灵机更快,现在没有严格意义上的数学证明。我想提到一个点非常有意思——素数分解。素数分解在图灵机上是不是很难实现,现在没有数学上的证明,但是素数分解在实践当中被证明是很难很难的。所以现在大家在网络安全上面用到的最核心的算法RSA的最顶层的东西就是素数分解。你给一个很大的数,你要把他分解成素数的话,需要的时间超级巨大,但是如果有量子计算的话那就不一样了。年,有一个数学家提出来一种算法,他说如果说我们能造出一台量子计算机,在这台量子计算机上做素数分解可以超级快。如果量子计算真能发生的话,我们现在所有的安全通信瞬间就变得不安全了。所以可以理解为什么美国在此投入了巨大的资金,国内在量子计算方面也投入了巨大的资金。如果说大家可以证明素数分解很难,实际上量子计算从某种意义上突破了图灵机,但是这个目前没有严格的数学证明。

“超级智能”和“智能”是不同的定义,“超级智能”是说图灵机等价于智能的话,我目前的计算机只要每隔几年快几倍,照这个速度发展下去的话,机器超越人是迟早的。英国物理学家罗杰·彭罗斯有几本书在国内有翻译,《皇帝的新脑》这本书就提出了不同的观点,他实际上是霍金的合伙人,大家知道霍金是物理学家,他是数学家也是物理学家,但是霍金的数学并不够好,所以需要一个数学家跟他一起工作,罗杰·彭罗斯就是跟霍金一起的数学家,包括黑洞理论,他都是原创者之一。罗杰·彭罗斯的理论说人脑是量子计算机,他甚至和加州理工学院心理学家一起合作,企图证明人脑里面存在一种东西叫微管,这种微管可以让人变得不容易被机器模仿。但是很多人都嘲笑他,生物体那么大的一个东西,不可能存在量子效益。这个问题一直有争议,但是他提问题的方法并没有错,他说如果说你可以证明人脑不是传统意义上的图灵机的话,那么就是人脑有某些计算机不具备的能力,这些不具备的能力就是“智能”。所以这个目前为止关于智能的定义还没有一个大家公认的标准,如果按照图灵机就是智能的话,那超级智能发生是迟早的事,但是如果说智能是某种意义上的量子计算的话,还需要更多扎实的数学和物理工作,这些工作现在很多人在做,但是还没有结论性的东西。

我前面做了更宏观的历史叙述,从大脑一直谈到人工智能可能带来的结果。比方说大家现在议论比较多的超级智能,更多的是历史性的描述。下面我会谈现在人工智能正在发生什么,或者我个人觉得人工智能将来或者在可预见的未来会发生什么。

先说一下,我参与在做一个非盈利机构,我们用数据的手段来研究产业,用人工智能的技术手段来研究产业,发表各种产业的报告,我们关于人工智能方面的报告,目前应该是全球最权威的,英国的《经济学人》、《金融时报》、《华尔街日报》以及90%中文媒体上,你看到关于人工智能产业数据方面的东西几乎源头都是我们这儿。我们搜集了人类有史以来所有的专利,从有专利制度开始一直到上个月,所有的专利没有落下的,还有所有的投融资数据。投融资数据有以下这些,比方说什么时候投的、投了多少钱、哪一个合伙人投的、这个合伙人什么教育背景、什么星座、老婆、孩子等家庭及其他数据我们都有。所有上市公司,包括中国在内所有的上市公司的情况以及所有的法院判例的数据我们也有。因为那些数据不光是对人工智能领域的,我有人工智能的自然语言处理的技术手段,可以找到所有跟人工智能相关的专利,人工智能相关的公司,人工智能相关的论文。

有了这些数据,做一个时间维度分析的话,大家可以发现年开始一直到现在,全球整个人工智能企业的发展趋势,特别是中国发展的速度越来越快。年时候人工智能这个产业在全球基本上在三个地方:美国、欧洲、中国。印度曾经在20年前比中国要发达,但是现在中国已经远远的超越了印度。80年代的时候,中国还没有专利局,90年代中国慢慢开始有专利制度,中国有越来越多的专利,而美国专利很明显集中在东西海岸。我们的数据表明,中国在人工智能方面的专利总数在年、年的时候就已经超越美国了,而且大概也是在年,中国所有的发明专利加起来在总数上已经超越美国,这是非常令人惊奇的数字,但是质量上还不行。质量上我们也有各种算法和方式来测度这个专利的质量。

我刚刚其实已经讲到,人工智能有一些细分的行业,比方说专家系统。专家系统曾是最热门的东西,但是现在已经没有人碰专家系统了。90年代日本第五代计算机项目,那个时候是人工智能第一次泡沫破灭,到年深度学习出来之后,整个机器学习行业突然变得热门了,甚至很多人就把机器学习等价于人工智能。还有计算机视觉,最近很多炒得很热的人工智能公司都是人脸识别的公司,而且融资的规模巨大,还有就是自然语言处理。目前热门的这些人工智能技术、自然语言处理、机器学习、计算机视觉,在几十年前没有什么研究工作,但是几十年前热门的人工智能现在没有什么人碰了。人工智能是飞速发展的。

从投融资方面我们看了一直到年底的数据。在年之前的15年,人工智能整个行业的VC投资只有亿美金。从公司的数目上或者其他的衡量上差不多类似,过去五年是人工智能高速发展的时候。摩尔定律告诉我们一个非常有意思的东西:比摩尔定律速度还快的是超算五百强。全球最快的五百台计算机加起来,他的速度增长比摩尔定律的增长还要快。美国在人工智能VC的投入比摩尔定律还要快,而中国在人工智能方面的投入跟摩尔定律令人惊奇的吻合。我们可以看看全球人工智能企业和投融资整个的发展趋势,总的来讲美国还是最领先的,但是在年美国第一次在人工智能的发展趋势上降到全球的30%以下,因为年和年,中国在这方面投资巨大。

我们来看看亚洲,亚洲的趋势变化得更明显。亚洲在过去15、16年一共有46亿美金的VC投融资(不算并购)。过去5年,其在全球大概占到80%,但是在亚洲占到90%。亚洲我们挑两个国家和中国做对比,这个也是让我们有点儿吃惊的数字:中国在过去五年,整个在人工智能方面VC的投入才是以色列的四倍,以色列是万人口的国家,他大概跟北京一个区的体量差不多。中国领先印度很多,我们也做过类似的研究,做过物联网的研究。物联网中国大概是以色列的30倍到40倍,什么意思呢?物联网跟人口、制造密切相关的东西,以色列肯定不行。但是在高端的人工智能的核心技术,以色列在全球是有一席之地的。大家也知道最近的几个最大的并购案子都是以色列的,百亿美金以上级别。

对于中国我们又做了进一步的分析,过去10年中国一共投入了27.6亿美金,几乎27亿都是过去5年投入的。也就是说几乎中国在5年之前,在人工智能方面从投资的角度来讲没有什么投入,几乎95%以上都是在过去几年发生的。中国人工智能企业,我们也做了一个摸底,毫无疑问北京是中国人工智能企业最聚集的地方,这个跟我们做物联网或者其他的研究不太一样。

其他的研究,比方说我们做物联网,整个全国的分布大概北京、珠三角、长三角各30%左右,但是在人工智能这块儿北京占到全国70%。无论是人才、资金的投入、研究成果各方面,北京大概都是在全国遥遥领先的。北京一个城市的体量都要远超英国,无论是从各个测度,我们刚刚讲的论文、专利、公司、公司数、投融资的数目都是超过的。这个结果被英国经济学杂志反复引用,自然杂志大概在一个月前采访我两个小时,他们拼命问一个问题“你觉得中国和美国在人工智能谁强”,一直让我表一个态。我觉得整个趋势是这样的,从数量上中国现在在接近美国的数量,但是质量上还不行,在质量上美国领先,无论是在原创的研究、专利,还是最核心技术的公司。从数量上,中国在某些子领域,人工智能的子领域方面已经超过美国了,从整个投融资的数据可以明确地看出来。

在这几个子领域里面,我们又做了更详实的研究,在某些核心技术的领域还是美国强。但是从数量上看,在很多应用领域,中国确实有领先美国的趋势。这个是几个月前了,香港科技局的领导一直在提一个新的概念——大湾区。大湾区珠三角加上香港和澳门,变成大湾区的概念。他们认为提了大湾区的概念就可以和硅谷旧金山湾区可以相提并论,数据跑出来有点儿让他失望。把香港和澳门加到整个珠三角,仍然没办法跟北京在这方面这么多年的优势相提并论。从产业结构、投融资、人才来看,最接近美国旧金山硅谷的是北京。这里面也提出了很多可以改进的空间,比如在人才上哪些方面落后。这个也给很多的地方政府提供了一些缩影,或者提供了一些方向——人才应该去哪儿找,公司应该去哪儿找,产业链怎么样去做。

总结一下,我一开始的那部分讲到的是从历史以及人类的很宏大的叙事,一直讲到计算机,以及什么是计算。我刚才这部分基本是在讲整个人工智能产业的现状是什么样的,哪些领域现在在中国,是可以有突破的。但是总的来讲,我们可以明确的看到全球人工智能目前美国还是领导者。但是毫无疑问,中国是第一梯队,第一梯队就是中国。全球其他地方,亚洲肯定毫无疑问是看中国,中国毫无疑问看北京。

我可以把人工智能整个行业再细分。我们又做了一个很有意思的工作,把科研、科技成果、公司、公司的退出这几条曲线放到一起的话,我们可以看到一个非常有意思的现象,就是人工智能这个行业和其他行业不一样。在其他行业这个曲线,每一个曲线之间的间隔比较大。比方说环保,从科研一直到有产出,大概会有7-10年的间隔。但是在人工智能这个特定的行业,我们看到就只需要3-5年,而且在过去这几年的时间间隔变得越来越小了,更新迭代的速度越来越快。宏观的感觉,总的来看人工智能是目前我们看到的,科技行业普遍要比非科技行业的迭代速度快,但是人工智能在科技行业里面有是迭代最快的行业之一,尤其在过去这几年,这个其实大家从媒体上等各个方面了解到的情况都是一样的。

大家总问我人工智能行业里面有没有泡沫,我没法正面回答这个问题,我只能讲就我们目前看到的数据,肯定是有一定程度的泡沫。但是我们也看到很多人工智能这个产业,他有很多非常扎实的工作,而且有很多应用是潜力巨大的。

提问互动环节

提问:您怎么看人工智能和大数据之间的关系?您提过主营收入50%以上是人工智能公司,那么百度是人工智能公司吗?

张晓东:先回答第一个,人工智能跟大数据的关系。人工智能一直有两派,一派是符号派,一派是统计派。过去这几年有突破的是统计派,统计派代表的主要是机器学习,机器学习数据就变成了统计学习不断进步的养料,尤其是在几种特定场景。机器学习有几种,其中之一是监督式的学习,监督式的学习必须有超级大量的数据,才能达到预期的效果。但是最近有一些新的研究,比方说强化学习。阿尔法狗用到的算法,最核心的算法是强化学习。恰巧我在美国的老师就是强化学习的发明人,几十年默默无闻,但是一直到阿尔法狗赢了之后,忽然全世界所有研究机器学习的人都去研究强化学习,我老师去年也得了人工智能终身成就奖,也是几十年耕耘的回报。

一直到几个月以前,阿尔法狗推出了新版本——阿尔法ZERO,阿尔法ZERO就是没有数据。没有数据他怎么样学呢?实际上是用两个阿尔法狗自己跟自己下,自己互相产生数据。因为他甚至认为,人类有史以来的棋谱有可能误导人类,所以阿尔法ZREO不需要数据,他就是自己跟自己生成,产生内部需要的数据。所以人工智能和大数据的关系,用学术一点的说法是:特定的人工智能的算法是需要大数据的,大数据给人工智能提供了手段。拥有大数据的公司,比方说BAT任何一家公司,就会比别人有不公平的优势。所以前几天在人工智能内部圈有一个争论,南京大学的周治华老师说人工智能的进步到底是数据、算例还是算法的进步,其实我觉得工智能走到今天这三个方面都会有。

第二个问题是百度,人工智能毕竟是一个手段,所以你说百度主营收入是广告,反过来说谷歌、脸书主营收入也是广告、这就要看你达到最优广告用的是什么手段。从国内来看,我内心觉得百度是最优秀的人工智能企业之一,原因就是从人工智能积累的人才,还有他现在在实施人工智能的战略。广告收入我想BAT任何一家都是一样的,不光是百度。

提问:阿尔法狗赢了之后,他们主设计师讲:我们人类都是谋事,尤其中国人最讲究谋事,不在乎一城一池的得失;阿尔法狗所有的计算就是从一百万、上百万计算当中优选,每次就是微弱的优势,就是微小的一点点优势把你击败了,这么看来人类的前景非常非常悲观。如果人工智能这么发展下去,人的社会、人的知识整个社会都会发生怎样的变化?

张晓东:这个问题其实我刚刚轻描淡写的说了一下,阿尔法狗这类东西出来之后,会不会发生某一天机器的智能水平超越人的现象,还是这个问题。现在有两派观点,能量的计算提到人脑里面有一些特定的数学装置,这些数学装置是现在的计算机还达不到的。更多的人可能认为至少在短期内,有可能形成人机共生的情况。“人机共生”就是有很多嵌入式设备,在你的身体上,有可能会植入你的记忆、你的大脑,他可以让你在智力方面得到很多增强。

AI还是IA,智能的增强,我猜在短期内智能增强的可能性已经在发生了。所谓强人工智能就是说你在所有方面都领先,是不是有可能我把人类现在造的所有弱人工智能东西都堆到一起,就能形成一个强人工智能的手段呢?比方说大家知道可以翻跟头的那个狗,可以把阿尔法狗装到翻跟头狗里,狗不就可以下棋了嘛,把所有人都想到的已经超越人的东西都放到里面,是不是就能够形成一个强人工智能的手段?还是回到刚才,如果什么东西能够超越人的话,这个事发生是迟早的。

所谓人类的创意,其实就是算例不够,你就认为他是创意。所以人工智能是什么问题呢,一旦这个问题机器解决了,大家就不认为是人工智能,人工智能往往是机器还没解决的问题。比如现在谁还研究计算机下象棋,阿尔法狗也不准备研究下去,而是准备做别的,用这套算法和思想做别的工作。所以这个问题看你怎么看,作为从业者的角度,你是站在中间看还是站在两边看,站两边有一派人说不可能,有一派人说马上来临。人是不是可以永生,这是人类的终极问题之一,所以你把所有的问题都在最简单的假设上考虑的话,可以得出结果。但是作为从业者,至少在目前短期内人机共生是已经在发生的事了。

提问:在人工智能未来的商业化或应用落地或者一些解决方案上,有哪些方向能真正给我们的企业或者个人创造一些明显可见的价值?

张晓东:在几个方面大家都已经看到,一是来钱最快的是金融。任何一个新技术,第一个接触的都是金融,金融行业离钱最近。第二个是医疗,也就是说某一天会有机器医生,并且是达到一定水准的机器医生。可以这么分析,有几个行业,尤其是人脸识别这个行业,过去这两三年有那么几家公司融了超级巨大的钱,而且这几家公司都是中国的或者是基于中国的。融到的钱如此之大,以至于很多上市公司的市值都不如他融的钱多。

其实中国做人脸识别这些人几乎都是跟微软有关系。那天他把这几个公司都叫到一起,他问大家一个同样的问题,就是说你们的应用场景,你们的落地方式都在哪儿。安防是其中一个领域,是那些做安防的企业更有优势还是人工智能更有优势来做安防呢?几年以前大家提概念是“互联网+”还是“+互联网”,在人工智能这个行业里面我们可以问同样的问题,是“人工智能+”还是“+人工智能”。在一些特定的人工智能行业,比方说人脸识别会不会出现头几年出现的情况,比方说共享单车、滴滴打车,几年前已经发生了几轮这样的事情,我只能说有过这样类似的,大量资本注入好几家公司,结果大家可以看到。

第二,从短期内我看到的方向,因为人脸识别和语音已经是相对成熟了,就是说在某些方面超过人现在的水平。比方说语音识别、人脸识别,人脸识现在识别的正确率在某些方面,某些维度上已经超过人。人工智能在近期内有没有新的领域涌出来,我想跟大家分享的就是,自然语言处理会是近期内一个有很大潜在应用的一个领域。目前我们还没有看到什么成熟的自然语言处理公司,人脸识别有很多了,语音处理有很多了,自然语言处理一个子分支就是机器翻译,但是自然语言处理无论从研究还是从落地、还是从产业方面都是有很大潜力的。

提问:IBM医疗,医疗方面的人工智能,在中国有可能实现吗?机器人和人工智能的关系?

张晓东:其实跟大家想象的相反,IBM医疗并没有读病例,读的是论文。现在有八种还是有几种,有重大的突破。它没有用病例原因之一是数据质量问题,数据质量问题是这样,我们研究过病例的质量这个领域,同一个病让不同的医生或者是同一个医生诊断,写出来的都是乱七八糟的,数据的质量没法保证。而论文对这个病的描述,用药有严格的格式,但是在病例里面是不同的,这些东西就导致因为你的数据质量不行。至于在中国,在这个领域里面有没有可能突破,可以这样说,中国在医疗信息化领域有很大的改进,而且我猜在这个领域,中国有可能做的比美国还要好。中国可以强行地规定一些东西,在美国定一个规矩,让所有医生都执行很难;中国你定一个东西,所有医生执行,那可能真就执行。医院以及一些大的央企介入,国内也开始做创新,我们也期待有更好的数据,肯定智能的水平就会提高。这是第一个问题。

第二个问题,机器人跟人工智能是什么关系,机器人跟人工智能之间的关系一直是一个动态的关系,比方说70年代、80年代,大家认为机器人都是工业机器人,比如说焊接手等是机器人,这些机器人现在在很多业内大家是不认同的。现在只能说越来越复杂的东西才是跟人工智能有关系的,工业机器人大家认为这不是我们该干的事,应该是机械系该干的事。

机器人在这个领域里面你要看几个东西,一个是机器人应用场景,而且现在机器人的定义,除了工业机器人之外,对机器人的定义很宽泛的,服务机器人本质上要解决的技术问题就是我刚刚讲的自然语言处理。聊天机器人面临最大的问题是基本上聊不过五句话,五句话范围内他是知道上下文的,但是超过五句话,你就不知道他在聊什么。你要问他一些特别简单的问题,他可以很快的回答,而且回答的会让你惊艳,这个不是人可以具备的。你可以问他很复杂的问题,比方你可以问他很八卦的问题,比如说“梁启超的儿媳妇是谁”,他马上会告诉你是谁。这种问题很容易回答,因为他底层有很强大的智库,但是你要给一个很长的对话就比较难。因为以下原因,一个现在很多研究,本身就是研究的课题;还有一些是工程方面。所以服务机器人目前要解决的问题就是我刚刚讲的自然语言处理。

提问:雄安提出了新的发展目标——想成为世界的绿色智慧发展的标杆城市,当雄安接近这些目标的时候,最具有标志性的场景或现象是什么?

张晓东:时间节点不能乱说,尤其像雄安这样的地方。我猜想雄安实际上是某种意义上的特区,人工智能有一些需要特定的,包括数据的隐私性还有很多问题,第一个我想到的智慧城市。智慧城市现在已经从咱们国家的国策上都有所反映,最近国家也提出新的体制。比如说自动驾驶,几家公司都有类似的考虑,自动驾驶这种东西就涉及到很多社会问题,这个问题并不是说车开的好还是不好,而是说有很多社会问题。谷歌的自动驾驶在美国做了这么长时间,但是没有推起来的主要原因就是社会问题,并不是说车开的水平不行。社会问题就是你出了事谁来做保险,谷歌在美国做过无穷多的企图,没有一家保险公司愿意给谷歌无人驾驶做保险,最后谷歌提了一条,我自己开保险公司行不行,结果所有保险公司都到国会去反对谷歌。那这事就没办法,我的车让你保险你不保,我有很高的信心自己做保险你又不让。

国内可能在这方面会有所突破,我们这样特定的法律制度和特定的社会状况,可能会在某些方面有所突破。我是用自动驾驶做一个例子,往大了想说智慧城市。谷歌当年投Ubr,曾经就畅想将来某一天打车就是用Ubr叫来无人驾驶车,用最好的方式将人送到地方。但是在美国实践起来,由于法律、社会这些因素,遇到的阻碍比在中国要大。

提问:对于像文学之类,机器翻译以后,是不是就没有特色了,失去了人思维当中的一些东西?现在大家都说物联网,物联网和人工智能是什么关系呢?

张晓东:机器翻译问题,其实你要这么看,谷歌翻译器翻译出来的东西和百度翻译器翻译出来的东西不一样。它们原来的训练方式以及数据源不一样,导致的结果自然不一样。翻译的水平,甚至说写作的水平可以到很高,并越来越高。目前看来,美国在这几个领域都是领先的,美国在很多领域的文章几乎都是机器写的。

有一位著名的人工智能专家前年去世的时候,联线杂志就找了一家人工智能企业,让其写一段讣告并且不要写常规的几句话,最后他们就写了一段,写的非常好。这些数据其实就是知识库来的,都做了整理。但是他也把在纽约时报上写讣告那段拿了出来,当然还是人写出来的文才飞扬一些。但是机器在写作方面的进步会越来越大,而且往往是在过去我们人认为很困难的东西,机器比人要强。比方说写诗,尤其是汉语的诗,这项工作最早是微软做的,最近清华在做,按照当时的心情写首诗出来,写的很工整,里面经常有让你惊艳的句子。机器可以把所有的名词跟所有名词的对仗都做一遍匹配,人有时候做不到这一点,机器可以千方百计做的更好,所以某些可能是人认为困难的事情是机器先做到。

第二个物联网,物联网看你从哪个角度看。智慧城市这个角度,各个地方装了传感器,装了传感器之后,你就会有更多的数据搜集。这个问题我猜有很多重的含义,一个技术手段来讲,提供了更多的数据来源,但是目前确实也有这样的问题,几乎就没有任何隐私了,在任何一个角落传感器都会知道你所有的行踪,比你自己都了解你自己。这种情况是不是会是一个问题,人的隐私一直不断地被剥夺,人不断地适应。所以我没法对这个事做一个社会的评论,但是我猜可能会出现这样的情况,你的隐私会越来越少,你维护你的隐私要付出的代价和成本会越来越高。

提问:人工智能在防范系统性金融风险上有什么用武之地,以什么样的方式存在于监管层面?

张晓东:人工智能跟金融的结合有几个方面。一个是在监管层面,监管层面其实不管是在国内还是在国外,比方说美国、欧洲、英国监管机构其实都有很强的手段,而且他的手段不断地被完善。一个比较直接的是风控,风控这方面其实有各种各样的人工智能,从80年代有专家系统的时候,就用专家系统做这块。现在又有一些新的手段,比方说知识图谱,可以做各种各样的关联,还可以看到风险点在什么地方。

这些不光是有研究也有实际的案例,我举一个跟这个不是那么直接,但是更普遍的例子探讨一下,这个例子就是说因果性的分析,因果性的分析是在金融行业最多的。比方说,你要马上知道台湾地震有什么后果,可能一个后果是某手机公司的某款手机推出延迟,这个推理时间是非常短的,因为如果某个企业里面两款核心芯片厂子正好在台湾某个地方就会发生以上现象。这个例子就是说在金融方面也可以做一些事件的预测,除了风控之外,有的人讲历史数据和数据时间颗粒度,也是可以探讨的。

提问:IBM医疗实际的用户体验很让人好奇,请您具体说一说。人工智能的应用安全上,在标准上有没有一个体系,他到底是人类的福祉还是会给人类带来毁灭?

张晓东:IBM医疗体验其实没那么神秘,其实就是一个看病,你就把你的症状告诉他,他会帮你做一些诊断。现在他主要集中看八种还是十一种不同的肿瘤,他在过去这几年都在不断的去考美国单科的医生执照。至少从一个病人的角度去考虑的话,因为其实我们如果生病的话,有过这样的体验,生病了之后你会看好几个不同医生。在这个特定场景下,把他当做两个三个其中的一个,给你提供一些建议。我们很有限的经验表明,曾经存在过这样的情况,就是他给出的诊断方案跟病例上医生给出的诊断方案完全不一样,医生看的那个病人看死了。我不举具体的例子,如果说你当时把他当做这几家医生之一,那有可能你会更早的得到帮助。

第二个问题,人工智能是不是对人类是威胁。有些人从进化论角度讲这个事,其实也很简单,人其实也是由其他物种演化来的,我们会不会再去演化成别的什么物种,或者说人工智能加速了我们演化的过程。这是一种宏观的理解,如果从这个角度你去理解的话,也许你内心并没有那么糟糕。但是在短期内人机共存的可能性更大,短期内已经或者马上发生了。

提问:开发区在人工智能产业引入的时候,在定位上应该怎么去把握呢?

张晓东:这个是很好的问题,从政府招商引资的角度来讲应该怎么把握什么样的产品或者什么样的公司。过去我们有很多政府方面的客户,你要考虑两个方面的东西:一个是他这个产品市场上第一有没有竞争力,第二从你本地角度来讲,您能给他们提供什么样的发展环境或者产业链的支持。往往我们会看到不同的区域,要求会是不一样的。有些企业的经济体量比较大,如果没有给他提供任何特定的政策,或者是特定产业链上下游支持的话,无论是自己长远发展还是短期利益,都很难来支撑被引入的企业。

提问:人工智能在艺术创作方面有没有超越我们人类的可能性?

张晓东:我刚刚已经谈到了在文学方面的可能性,美术上有但目前还不多,音乐方面有很多。计算机作曲的有很多,有各种各样的。人可以设定一些场景,比方说就帮我做一个交响,帮我做一个爵士的,在特定的场合下是有这样的应用。现在没有这么热门,可能跟他短期的商业利益还没有到,可能和这个有关系。

赵民:用一句话或者一段话看待年人工智能的公司上市或者说技术突破,会有什么奇点或者亮点,包括美国和中国的?

张晓东:我其实刚刚提到了一些,可能是几个方面。一个方面在技术突破方面,自然语言处理可能今年会是像人脸识别、语音处理一样流行的事情。公司上市目前还没有以人工智能主打的公司,这个跟我们刚刚提到的“人工智能+”还是“+人工智能”,更多的趋势是那些大的、有市场实力的公司越来越包容更多新的人工智能的技术。中国现在基本上是和美国一起在第一梯队,中国跟美国之间无论在技术上,在产业上,还是在投融资方面的距离会越来越短,今年有可能在几个特定的领域里面,中国甚至会更大程度的领先美国。

(注:本文根据现场录音整理,未经本人审阅,有部分删节。)

◆◆◆◆

编辑:Hrsr

责任编辑:LittlJ

本文为正略书院原创文章,如若转载,请联系正略书院小秘书(ID:zldsh1)。

点击下方“阅读原文”参与本次活动

↓↓↓

赞赏

长按







































北京哪家治疗白癜风医院最好
白癜风能不能治好



转载请注明:http://www.deudeguo.com/jyjs/14154.html


当前时间: