经济学原理

郭毅可论人工智能历史现状与未来发展战略


治疗白癜风花费 http://pf.39.net/bdfyy/bdfal/150527/4630319.html

人工智能问世60多年来,承载着人类对自己的智慧的无限自信。在这样的自信下,人工智能发展到了今天,人们在追求机器从事尽可能多的智力劳动的路上走得很快,也很远。今天人工智能的发展,实际上标志着人类第三次认知革命,即它的目标是通过探求人类智能认识自我而形成主观世界的机制,并把这样的能力赋予机器以改造客观世界,以实现人类智能的体外延伸。从这个意义上来说,人工智能的发展将会改变整个人类的文明进程。

香港浸会大学副校长郭毅可认为人工智能发展到今天所面临的主要问题是:“缺乏知识”。目前机器还没有掌握总结知识、积累知识、应用知识、传承知识和建立组织管理知识体系的能力。今天人工智能面临的挑战,也为中国人工智能的发展带来了难得的战略机遇。中国人工智能发展战略的关键就是直面挑战,大力发展人工智能的基础理论,确立自己的学术自信和话语权,在人工智能赋能上下大功夫,建立自己的人工智能工业体系,实实在在地在有选择的重点领域中,以人工智能技术作为推动力,实现革命性的产业创新。

重要观点

当前我国人工智能技术发展面临知识匮乏的问题,以佛学的“五明”理论来阐释,一是缺乏“声明”,人类智能对自己行为的解释以及和世界交流的能力依然不足;二是缺乏“因明”,无法揭示和演绎因果关系;三是缺乏“内明”,智能体没有主观能动性;四是缺乏“医方明”,需要形成系统观;五是缺乏“工巧明”,需加强对智能体行为的研究。

中国推动人工智能发展首先要明确研究的方向和切合实际的目标。我们在确定人工智能研究的发展道路和长期目标的时候,一定要对人工智能发展有一个正确客观的科学思考,这样才能避免许多由于盲目乐观或技术跟风而造成的时间和资源上的巨大浪费。

其次要切实重视人工智能基础理论的研究与创新,培养有创造力的人工智能人才。必须创造一个生态环境,使得科学家能够沉下心来,进行跨学科的深入的理论研究,并培养出具有扎实的理论素养、宽广的知识面、丰富的科学想象力创造力的人工智能研究型人才。

第三要建立人工智能发展的生态环境,需要建立具有中国特色的数据市场和数据经济体系、算力体系,以及加强对于人机二元社会的新的社会形态、准则、相关法律和道德伦理的研究。

第四是建立完整的人工智能化产业体系,应利用好我国在数据和算力上的优势,建设好我国基于大模型的“智能能源”和人工智能产业链,从而形成一个完整的人工智能赋能环境。

更多精彩观点

人工智能问世60多年来,承载着人类对自己的智慧的无限自信。图灵思想实验的哲学基础,就是认为人的智能是世上所有可能智能的极限,所以只要机器可以让人无法区分其智能行为与人的差异,那么机器就有了智能。在这样的自信下,人工智能发展到了今天,人们在追求机器从事尽可能多的智力劳动的路上走得很快,也很远。例如,让机器写新闻、让机器作音乐、让机器改照片等。根据世界经济论坛与诸多机构于年共同提出的“人工智能发展时间表”的若干预测:

年,人工智能可自行撰写Python代码(根据笔者判断,其实现在应该已经有这类的研究成果,所以机器在年可以自己编写程序的预估决不夸张,而如果机器能够写出好的程序的话,那么机器就能够自行发展和创造新的机器功能);年,人工智能可以创造出影片;年,人工智能写的小说会成为畅销书籍;年,人工智能甚至可以自己进行数学研究。

这些预测说明了人工智能的发展已经进入了一个新的历史阶段。根据斯坦福大学最近的报告,年全球企业对AI领域的投资增至近亿美元,比年增长了40%。人工智能的研究也在蓬勃发展:年,全球发表了超过12万篇关于AI的论文。年至年之间,人工智能的论文占所有同行评审论文的比例从0.8%上升到了3.8%。总之,人工智能的发展可谓方兴未艾。今天人工智能的发展,实际上标志着人类第三次认知革命,即它的目标是通过探求人类智能认识自我而形成主观世界的机制,并把这样的能力赋予机器以改造客观世界,以实现人类智能的体外延伸。从这个意义上来说,人工智能的发展将会改变整个人类的文明进程。

01

对人工智能发展的回顾

对人类智能的理解。作为生物链最顶层的人类,需要有更复杂、更强大的思维能力,来合理分配资源、优化自己的生存条件、预见和应对不断变化的威胁因素,为此人类进化出独特的能不断产生和运用智能的脑神经系统,近代神经科学的研究表明:人类大脑中具有的新皮层是学习和记忆功能的载体,从而开启了专门研究神经的思维机制的学科——认知神经学,它的核心就是研究大脑皮层中神经元的活动以及他们之间飞速传递的电脉冲与思维活动之间的关系。

认知神经学的产生和人工智能的发展同步。在人工智能发展的初期,正是借着对人脑机制的初步认识,开启了人工智能的第一个高潮。年,在标志性的达特茅斯会议之后仅仅2年,美国学者弗兰克·罗森布拉特就提出了感知器,这是一种参数可变的单层神经网络模型,是人类第一次把自己所具备的学习功能用算法模型的形式表达出来,第一次赋予了机器可以从数据中学习知识的能力,它是今天神经网络的雏形,提出了许多今天机器学习的核心概念。美国军方认为感知器可以识别坦克,从而投资进行研究,但很快人们就认识到了这样简单学习模型的局限性,从而结束了人工智能研究的第一次高潮。在以后的研究中,人们对于认知神经科学的研究有了巨大的进展,特别是90年代发展成熟的核磁共振技术,可以通过对人脑神经细胞中血氧的变化,来衡量人脑神经元在思维过程中神经元的活动和神经元之间信号的传递,从而使认知神经学的研究真正成了基于脑神经大数据的实验科学。今天,我们对于产生智能的人脑发展有了较深刻的认识,提出了许多有关思维的机制理论,我们普遍认识到,大脑的皮质层是有自我组织能力的模式识别器,谷歌的首席创新官雷·库兹韦尔,在他的名著《如何创造思维》一书中,提出了思维模式认知理论,其核心思想在于思维机制的模块化所组织起来的神经元网络的信号传递,而模块化的互联互动形成智能,这个思想和马克拉姆的乐高式模块组织形成智能的观念是一致的。这种模块化神经元组织机制形成智能的思想,也是近来兴起的深度学习的神经学理论基础。

对机器智能的发生发展的机制的理解。人工智能发展之初,机器的计算和存储能力都非常有限,同时,机器也缺乏感知外部世界活动的功能及手段,所以机器智能的范围只限于对在有限的问题求解空间中的搜索。因此,机器智能的机制,早期被局限于搜索。而逻辑推理是一个典型的应用范例。用逻辑推理对符号进行演绎,以模仿人类的逻辑思维,成为人工智能的一大流派,称之谓“符号主义”。从早期纽维尔、西蒙、王浩等人在机器定理证明的工作,到年罗宾逊发明了归结算法,即把一阶逻辑推理变成一个机械的搜索算法,符号主义的工作使推理成为机器智能的主要机制。这些工作,直接导致了20世纪80年代初的以日本第五代计算机为代表的人工智能研究的第二次高潮。以推理作为机器智能的机制,要求人类把知识以逻辑的形式告诉计算机,然而人们很快就认识到,这样靠人工获取知识的手段是机器智能的一大瓶颈,机器的智能,只有在具有自动地从客观世界中获取知识的能力之后,才能取得革命性的进步。

步入21世纪,人类进入了互联网时代。这时不仅计算机的计算和存储能力得到了巨大的提升,而且世界的万物互联和传感技术的发展,使人们在量化世界的道路上飞速前进,人类步入了量化万物的大数据时代,这样的量化世界所提供的无尽的数据资源以及以云计算技术组织起来的空前的计算能力,终于使得我们有可能使知识的自动获取成为现实。于是,从大数据中自动获取知识的机器学习,成为新一代人工智能的主要机制和技术驱动力。年辛顿和谢诺夫斯基发表了《玻尔兹曼机的一种学习算法》一文,提出多层神经网络的学习机制,年罗姆哈特和辛顿发表的《通过误差的传播学习内在表示》一文,提出了反向传播算法,从而使神经元网络具有了可以自动调节神经元连接的权重,进而实现了不断优化目标函数的学习功能。后来十几年,计算机科学家们提出了包括像卷积神经网络等一系列神经元网络结构,使得神经元网络可以自动提取对学习有意义的数据特征。这一系列的成果使得今天我们称之为深度学习的人工智能技术,成为机器智能的主要内在机制。

人工智能对人类社会发展产生深刻影响。在人工智能的发展历程中,每一次前进都受到了世界主要经济体政府的积极推动。这样的推动都来自它们对人工智能在经济发展中的领导力的战略考虑。在我们谈论人工智能技术在今天的经济发展中的重要作用时,不能仅仅着眼于当前的人工智能技术在今天的经济和社会生活环境下的应用,更重要的是要把人工智能作为一种新的发展中的生产力。这样的新生产力和以往导致生产力革新的技术,如蒸汽机、电力计算机和互联网有着本质不同,它是一种可以反作用于人类的生产力,是可以和人类一起共生、共长的生产力,它的发展可以促进人类自身的智能的进步和拓展,而这样的进步反过来又会增进机器智能的进一步发展。

所以,我们不能简单地把人工智能在经济上的作用,用一个“人工智能+”来总结,人工智能不只是一个赋能技术,其本身在创造崭新的社会形态和经济结构,对现在和未来生活的影响无处不在,我们正在进入一个人工智能“Inside”的时代。今天人工智能的产业化,正在走向“智能能源化”的产业模式,即通过设计先进算法,整合多模态大数据,汇聚大量算力,训练出通用的、可迁移的大模型,来服务于不同的应用领域和解决实际问题。这样的“大模型”作为对于大数据的归纳和抽象,成为一种“预训练模型”,作为构造各种人工智能解决方案的基础。从年10月Google发布了3.4亿参数的BERT模型,年5月OpenAI发布了亿参数的GPT-3模型,到年6月北京智源人工智能研究院发布了1.75万亿参数的“悟道2.0”模型,以及年6月阿里达摩研究院仅用片GPU实现了国内第一个商业化的万亿多模态大模型,这样的大模型把大数据转化成了一种“智能能源”,在通用的大模型基础之上,应用方可以使用自己特有的数据对模型进行小计标量的微调迁移,以达到目的。这是一个人工智能很有希望的产业化途径。

02

人工智能面临的问题

人工智能发展到今天,硕果累累。但是,我们必须清晰地认识到,人工智能技术今天依然面临着许多根本性的问题,一言以蔽之就是:它缺乏知识。现阶段,我们的机器并没有掌握总结知识、积累知识、应用知识、传承知识和建立组织管理知识体系的能力。人工智能在知识上的缺乏,可以用佛学的“五明”理论来阐释。佛学把世间的一切学问归结为五种学问,称为“五明”:即语文学的“声明”、工艺学的“工巧明”、医药学的“医方明”、科学的“因明”、哲学的“内明”。“五明”被视为道行者的基本功,是佛教对人间知识的总结,行道要从“五明”入手,来传播佛法普度众生。用“五明”来观察人工智能今天面临的知识匮乏问题,实际上是很贴切的。我们可以把佛学“五明”的涵义加以扩展:“声明”指的是人类智能对自己行为的解释以及和世界交流的能力;“工巧明”指的是人类智能对行为的指导;“医方明”指的是人类智能的系统观;“因明”指的是人类智能的因果推理能力;“内明”指的是人类智能的主观能动性。今天的机器智能,恰恰缺乏的就是这“五明”!

缺乏“声明”:今天的机器智能与人交流的根本障碍。机器智能作为一个与人共存的智能体,和人的交流是一项根本的要求,这样的交流不是指今天的Siri或“度秘”以及智能手机或智能音箱的这种简单的人机对话,而是在学习层面上,人可以准确地告诉机器学习的目的、学习的环境、学习的要求,而机器也可以与人交流学习的过程、学习的结果和得到结果的缘由。也就是说机器学习目标的正确性、合理性是可以表达的,而学习结果和学习目标的一致性是可以论证的。只有这样的人工智能才是可信的,才能形成构造于人类共生、共存的智能体的基础。今天所进行的人工智能的可解释性、可论证性的研究,正反映了人工智能在今天所面临的巨大挑战。目前的深度学习技术,说到底就是对一个由神经元网络所构成的非线性函数在大数据上做拟合,这种学习行为使得它在应用的普适性上有很大的优势,满足了我们对让机器“做得多”的要求,但是,它的结果的合理性、可靠性无法得以完备的验证,因为我们无法完全理解机器学习结果生成的逻辑,无法完美解释学习的认知行为。所以它的稳定性分析和可靠性验证都是有待解决的难题。我们可以在许多应用中用到深度学习的技术,但我们无法对这样的智能加以“对或错”的评价。这个问题在“大模型”中尤为突出。从这个意义上来讲,我们离图灵对智能的期望还很远,因为当我们向人和机器共处的黑屋提问,并无法区分得到的回答是从人还是机器来的时候,我们可以再加上一句:请告知你是如何得到这个问题的答案?人是能回答这个问题的,而今天的机器对此则往往茫然无措。

缺乏“因明”:无法揭示和演绎因果关系。人类可以在自然界和社会中发现规律,并抽象出规律之间的逻辑联系,这样的归纳和演绎的能力是人类智能的一个重要的特征,也是人类文明发展的一个伟大结晶。作为一个人类社会中与人共存的智能体——人工智能,应当也必须具备这种对因果的发现和演绎能力。而今天在数据驱动的学习系统中,我们还只能发现事物之间的相关关系。这样的相关性对于组成一个知识体系来理解世界是远远不够的,在大数据发展之初,曾有“因果无用,相关万能”的说法,现在看来,如果一个智能体仅仅具备了对相关性的理解,那么它对于这个世界的认识将远远低于一个一般的儿童,所以,如何让智能体具有发现因果关系的“因明”,是人工智能今天的又一个大难题。

事实表明,和所有过去的人工智能系统一样,今天的深度学习系统,即使有了一些迁移学习、无样本学习、知识图谱、图神经网络等先进技术,可以在一定程度上实现知识查询推理等功能,但在面对与训练数据完全不同的新数据的时候,依然会表现出不可避免的脆弱性,也就是说,由于算法是从训练数据中挖掘其特征间的统计关联性,而这些关联关系并没有抓住数据背后的因果实质,算法无法得出关于这些数据内在关系的归纳。换句话说,这些算法没有学习到我们真正需要的概念和概念间的映射关系,而是在走捷径,仅在训练集中完成学习任务,而往往无法学习到具有普遍意义的抽象概念,从而无法使它们能够将所学到的知识应用到新的情况或任务中。这些系统很容易受到“对抗性扰动”的攻击,即人们对系统的输入进行特定的选择,从而导致系统犯错误。

缺乏“内明”:智能体没有主观能动性。人是有主观能动性的,人的思想是人对于客观世界的主观认识,而人又是通过这样的主观认识来指导自己的行动,从而对客观世界作出改变。著名认知神经学和理论物理学家弗雷斯顿曾提出过一个机器智能的认知学模型,在这个模型中,人的知识形成一个主观的世界模型,而这样的模型和观察之间的一致性衡量决定了对世界的认识和对世界本身的改变,这个模型具有相当的普遍性。今天基于神经元网络的机器学习系统中被视为金律的“反向传播”,正是这种宏观认知模型中对模型修正的一个简单的实现方法,而模型和观察一致性衡量恰恰又是机器学习中常用的“损失函数”提出的基础,更进一步,今天的强化学习也是在模型和观察上一致性的推动,在策略模型的驱动下,针对环境观察作出相应行动,以求达到回报激励机制下的一种有益的状态。但从总体而言,今天的智能体依然没有形成主观意志的能力。这也是为什么今天人工智能虽然可以完成一些艺术创作,但是,这些创作也仅仅在于对人类已有的作品和形式的模仿、形变和叠加,尚无法在艺术美学和表达意义层面上进行真正的创作。

人工智能研究中,有一个以机器人学家莫拉韦茨命名的悖论:机器对于那些人做起来非常困难的任务,往往可以驾轻就熟,而对于一些对人来说非常简单的事情,却无能为力。莫拉韦茨这样解释这一悖论:“人类经历了上亿年的进化,大脑中深深烙印着一些原始的生存技能,其中包含了高度进化的感官和运动机制,这些都是人类关于世界本质以及如何在其中生存的上亿年的经验。我相信,执行这种需要深思熟虑的思考过程是人类最外在的表现,而其背后深层次和有效的推动力,则是源于这种更古老和更强大的感知和运动能力的本能反应。而这种本能反应通常是无意识的。换句话说,因为我们祖先的强大进化,我们每个人都是感性理解、人情世故和运动领域的杰出运动员,我们实在是太优秀了,以至于我们在面对实际上十分困难的任务时还能驾轻就熟。”

中国人工智能学者李德毅院士指出:新一代人工智能的硬核是交互学习和记忆。记忆的本质不是存储,而是对知识的不断凝炼而形成主观意志(或称为知识)。在贝叶斯理论框架中,这个主观意志是认知的先验,而观察就是在这个先验下,产生对认知的可信度的修正(后验概率),如何在这样的一个认知体系中,实现对主观意志的组织、进化和有效作用?在今天的人工智能研究中,这还是一个处女地。

缺乏“医方明”:智能体需要系统观。作为一个社会的原子,每个人生活在系统中,人对于系统的理解是深刻的,究其原因是在今天的社会中人类对于系统的认知和依赖是前所未有的,这样的系统观也深深地影响着人工智能的研究。以自动驾驶为例,研究的开始是以视觉的感知出发,把“认路”作为自动驾驶的重点,但随着研究和发展,人们认识到,自动驾驶的发展瓶颈并不是认路,而是对“路况”以及“路权”这样的交通系统的概念的理解。如人一样,一个认路的人不是一个好司机的充分条件,一个好司机的关键是可以很好地适应交通系统,可以作出符合系统,而又有利于自己的目标的判断,李德毅院士对这个方向的研究提出了发展“驾驶脑”的总结,一个驾驶脑的关键就是系统观,前面有车,超不超车,这不仅仅是一个视觉的判断,还是一个对所处环境下,对自己所处的状态和未来的目标的一个整体判断,今天的自动驾驶研究的关键就是系统观下的智能行为的研究,人工智能的系统观研究是一个大挑战,也是一个大方向。

缺乏“工巧明”:智能体行为研究的重要性。在人机二元社会中,智能机器的行为对世界的改变和对社会的影响,使得今天对人工智能伦理研究成为一个重要的课题,这个问题涉及面很广,人机一起从事社会活动,机器行为必须合乎伦理是个起码的要求。人们已经普遍认识到,我们对机器“做得多”的要求也许不难实现,但要机器“做得对”,则不那么简单了。从“对抗攻击”到“深度作假”,一次又一次地证明,今天的技术不仅不牢靠,而且很容易做坏事。从埃塞俄比亚航空号班机的坠毁,到自动驾驶车的事故,人们开始认识到机器是有行为的,而机器的行为也不一定是有益的,很可能会带来危害。于是,人们开始提出了人工智能伦理性、有益性的问题,开始


转载请注明:http://www.deudeguo.com/jyxl/25376.html


当前时间: