心智智能为认知智能发展带来新突破
人认识世界的本质·人类是如何认识世界的?哲学告诉我们人类是通过实践活动认识世界的;生物学告诉我们人类是通过身体各种器官来感知世界的;心理学告诉我们人类是通过自身心灵来认知世界的。人类在实践过程中,通过感知、思维、决策和行为,对事物的整体有一定的认知,从而认识到事物的本质和事物之间的内在联系。感知是人对外界信息的觉察、感觉、注意和知觉的一系列过程。思维是以感知为基础,也就是在认知和感觉的基础上,对新增信息和已知信息重新进行归纳总结的逻辑运算过程。决策是以思维为基础,在两个或两个以上对资源不可取消分配的方案之间所做出的选择。而行为则是在决策的基础上付诸行动,同时行为也会进一步对我们的感知产生新的影响,相互作用,从而产生对事物的认识。最终,人类通过这种对事物的认识来指导日常的实践活动,改造客观世界。·认知与心智信息技术超速发展的今天,推陈出新的智能产品把人类推向一个信息爆炸时代。这使人们的认知模式发生翻天覆地的变化,改变了人们的思维模式、工作和生活。人工智能是研究和开发能够模拟、延伸和扩展人类智能的理论。人工智能技术根据不同的发展阶段分为了计算智能、感知智能和认知智能。·一直以来,科学家们也在试图回答机器是否拥有心智的问题,但是对于心智的定义和标准界定则是比较复杂的,在本文中,主要是澄清和探讨认知和心智的区别与联系,进一步将人工智能的实现路径细分,最终实现机器心智。认知的定义·认知,指的是人类等智慧生命体对信息的获取、存储、转化和运用。认知心理学认为,认知的心理活动包括知觉、注意、回忆、思考、分类、推理和决策。人类认知系统包括了3个层级,分别是复杂行为,如解决问题、形成概念和言语表达等;信息加工过程,如对声音的感知、形成图像知觉等;生理方面,如神经过程和结构等。心智的定义·心智指的是人们对已知事物的沉淀和储存,通过生物反应而实现动因的一种能力总和。而心智模型(Mental Models)就是隐藏在我们一切行为方式、思考方式背后的那些形式和规律。心智模型是由肯尼思·克雷克(Kenneth Craik)在1943年所著的《解释的本质》(The Nature of Explanation)这本书中首次提出。在1986年,苏珊·凯里(Susan Carey)在《认知科学与科学教育》(Cognitive Science and Science Education)中将心智模型定义为一个人对某事物运作方式的思维过程,也就是一个人对世界的理解。心智模型的基础是不完整的现实、过去的经验甚至直觉感知。它有助于形成人的动作和行为,影响人在复杂情况下的关注点,并确定人们如何着手解决问题。例如在使用软件时,人们就创建了一个心智模型,来帮助他们使用。
认知与心智的区别·认知指的是我们通过教育和学习获取到对于世界的基本认知,而心智主要指的是两方面:一方面是我们根据已拥有的心智模型,通过类比的方式,构建新的模型,举一反三;另一方面是我们通过对外部世界的观察,接收到外部信息的刺激,自身整理后形成了对外部事物的解释,通过行动进行验证并获得信息反馈,从而形成新的心智模型。认知是我们对信息的获取、处理并输出的过程。心智则是人们脑海中对万事万物的解析,属于更上一个台阶的认知。人们的心智模型来自于以往的经验,也会不断地接收新的消息刺激,强化或更新原有的心智模型。
·认知与心智的关系一般来说,信息从进入人类大脑到信息输出,会经历注意、信息接收、信息处理、计划执行等过程,每个过程中也包含了多个子过程,具体如下图所示。http://cdn1.ccidcom.com/attach/image/20230602/1685667360734113.jpg·认知主要包含了注意、信息接收和信息处理,属于较为早期的信息加工和处理阶段。心智过程主要包含了计划执行,属于较为深度的信息加工和处理。人类通过视觉、听觉、触觉等方式输入的信息会首先进入注意阶段,通过将注意力分配和抗干扰等方式维持注意的稳定性;经过注意阶段后,会进入信息接收阶段,人类会对进入的信息进行存储,如对视觉、听觉等感官信息进行存储,形成记忆从而供后续阶段使用;存储的信息会进入到信息处理阶段,人类会通过模式识别和逻辑推理等方式将信息转化为知识。这就是人类形成认知的过程。而进入计划执行阶段后,人类通过对知识的推理分析,进行策略的生成和筛选,同时与环境的业务系统相结合,执行决策,也就实现了我们最终的信息输出。这就是从认知形成心智的过程。·借用经济学中的DIKW模型(Data-to-Information-to-Knowledge-to-Wisdom Model),它能帮我们很好地理解数据(Data)、信息(Information)、知识(Knowledge)和智慧(Wisdom)之间的关系,还向我们生动地展示了数据是如何一步步转化为信息、知识乃至智慧的,也就是很形象地诠释了认知和心智间的区别与联系。http://cdn1.ccidcom.com/attach/image/20230602/1685667383673093.jpg在DIKWI模型中(如上图所示),分散的数据经过计算和挖掘,通过分类处理形成信息,信息通过连接形成知识,基于知识的推理形成智慧,智慧通过提升认知带来影响。这就是人类从计算、感知提升到认知从而实现心智影响的过程。也就是说,随着认知过程的不断深入,我们开始进入心智过程,心智属于更高级的认知。·机器心智理论(Machine Theory of Mind)机器心智理论是Deep]实验主要是让人类和机器在Psychlab上进行视觉搜索任务,对比两者反应时之间的差异。具体的结果如上图所示,我们可以看出在这3种情况下,人类的反应时间均有所不同,而机器的反应时间则大致相同。这个实验说明了当识别的东西有干扰的时候,人类的注意力会被分散,而机器的注意力则更为集中,不容易被分散。这也从侧面说明了机器的心智能力和人类的认知有着显而易见的差异,给我们发展机器认知心理学指出了新的方向。我们希望人工智能能被人类所解释,而机器心智理论能以一种人们更易理解的形式来让人们理解人工智能。同时,这项理论也有很多潜在的应用,基于此开发的多智能体AI系统,构建机器-人机交互的中介技术,这是推进可解释AI发展的重要一步。这也能推进人机交互更有效和便捷,最终使得人工智能更好地理解和服务于人类。
·心智层人工智能是强人工智能的必由之路在人工智能领域,我们将其发展阶段进一步细分为计算层智能、感知层智能、认知层智能和心智层智能。计算层智能是通过清晰的规则进行数值运算,感知层智能则是模拟人的视觉、听觉和触觉等感知能力,认知层智能使机器具有人类思维理解,对分散数据和知识进行治理等核心特征,心智层智能则能够针对性地进行策略构建和决策,提升人与机器、人与人、人与业务的协同、共享和博弈等能力。·因此,从产业实践的角度,认知层人工智能是在计算智能和感知智能的基础之上,完成对业务状态的全面认知和知识推理;心智层人工智能则在认知智能的基础之上,生成业务策略和对策略进行筛选并输出可执行的策略。如在用户营销服务场景中,认知层人工智能输出动态的客户画像,心智层人工智能则在客户画像基础上提升营销导购中的话术和商品推荐能力,实现机器千人千面的销售策略。心智层人工智能是一种以特定方式模拟人类的意识和思维,将机器学习和数据分析技术相结合,赋予机器强人工智能的技术。在当前技术不断创新和突破的背景下,心智层强人工智能技术也会逐渐引起了金融业、制造业、安防、政府管理等领域的极大关注,并被引入到不同的领域。拥有心智层的人工智能不仅会带动人类科技的新一轮改革,而且会成为提高社会发展水平的新力量。·参考文献Parker,]Biocca, Harms, & Burgoon. (2003). Toward a more robust theory and measure of social presence: review and suggested criteria. Presence.Hong,]Youm, J. , &Black, J. . (2005). Object-Oriented Thinking for Mental Model Development.肖仰华.]陈昭然. (2009). 高级脑功能:情绪与心智——认知脑科学(摘要). 青岛大学医学院学报.蔡曙山. (2016). 人类的心智与认知:当代认知科学重大理论与应用研究:on the theories and applications of cognitive sci. 人民出版社.
丹尼尔·卡尼曼在《思考,快与慢》这本书中指出,人类的思维活动有两套系统。
[*]系统1是我们的快速、直觉式、自动、无意识的思维方式。它处理日常生活中的大部分任务,如识别物体、表情、语言理解和做出简单的决策。系统1常常以经验为基础,通过关联和模式识别来实现快速决策。然而,这种快速决策往往容易受到认知偏差的影响。
[*]系统2是我们的缓慢、分析式、有意识的思维方式。这个系统需要更多的注意力和努力来运作,因为它负责处理复杂的问题、逻辑推理、规划和长期决策。系统2可以纠正系统1的错误,但它的运作速度较慢。
今天的大语言模型本质上是系统1的模拟,它根据输入的文字直接按照一个概率分布来输出文字,这很像是人类凭直觉作出判断时的操作。比如一个数学运算,GPT-4可以根据你的指令,给出推导过程,但是如果你直接让它给出结果,它并不是自己在“脑中”进行这个推导过程再给出结果,而是直接凭“直觉”给出结果的。这就是为什么在给GPT-4下达“写出推导过程”的指令时,它的计算准确率会明显提高。从这个例子我们可以看出,GPT-4已经懂得运用语言,但它只是用语言跟人类交流,而没有用语言来思考。用语言来思考,就是系统2和系统1的最主要差别。https://swarma.org/wp-content/uploads/2023/06/wxsync-2023-06-e02ecf8dd470800084f257d8f1a4fd37.png
图 3 具有系统1(直觉判断)和系统2(用语言思考)的人工智能系统的简单示意图。
要想让语言模型学会思考,需要两个前提:(1)它需要有长期记忆。现在的GPT-4对于对话的上下文会有一定的记忆,但在开始一个新的对话时这些记忆就清除了。它虽然“记得”大量的知识,但那些并不是在对话中获得的记忆。如果和人类类比,GPT的知识更像是人类先天自带的能力,例如婴儿知道哭和吃奶。如果想让语言模型能够像人类一样在经验中学习,首先必须让它对于自己的历史有长期的记忆。(2)语言模型要能够对于长期记忆进行处理,吸取经验为自己所用。人类如果一道数学题做错了,学到正确解法之后就会改正,因为正确解法已经存在记忆里,并且知道在下次遇到类似问题的时候调用出来,而GPT虽然也会改正错误,下次却仍然会再犯,除非通过进一步的训练来改变模型的参数。
意识有何用处?为什么我们要研究意识?这里可以从我们人类的思维模式来找到一些证据。人类的思维有一个很重要的特点是,会做高层次信息的整合。在《思考,快与慢》这本书中,也提到人类的大脑有2个系统,一个是快系统(系统1),一个是慢系统(系统2)。粗浅地理解的话,快系统更偏直觉,慢系统更偏逻辑。 那么,为什么逻辑思维一定要慢系统执行?为什么在人类的进化和日常生活中,它一定要整合信息?这是因为,世界本质上由很多并行的 agent 构成,这些并行的部分要形成一个整体(integration)的时候,就需要整合信息了,这就是串行化,也就是“我”这个个体的形成。所以,世界有了“我”,也就从并行转变为串行了。与此同时,“我”也必然需要与其它的整体传输信息的方式,这便是语言的形成。除了信息传递和信息处理,意识可能还有其它用处。如果我们能意识到“我”,我们就可以“自我反思”“自我改进”甚至”自我解释“——这些对于生命都是很重要的。同样,我列出来的这几篇论文也都是目前关于大模型的最新改进方向的论文,它们的共同特点就是都存在着“自我”的字样。
自我反思
Self-Refine: Iterative Refinement with Self-Feedbackhttps://arxiv.org/abs/2303.17651Reflexion: an autonomous agent with dynamic memory and self-reflectionhttps://arxiv.org/abs/2303.11366自我改进
Large Language Models Can Self-Improvehttps://arxiv.org/abs/2210.11610自我解释Self-explaining AI as an alternative to interpretable AIhttps://arxiv.org/abs/2002.05149
特别值得一提的是这个“自我解释”,它对于构建一个我们可信赖的AI系统至关重要,同时要想让AI具备解释能力,让它了解因果推理也是很自然的,这是因为它不仅要做出预测、判断和决策,还要能跟我们说出来,它为什么这么做——这就是“自我解释”。尽管这种解释并不一定是它对自己决策过程的真实反应,而完全可能是它自己编的一个故事,但是问题的关键在于它给出了一种解释,这就让我们人类对它会产生信赖感。这也是我们人类人际交往关系的存在基础。
在《What is consciousness, and could machines have it?》这篇论文研究中,作者提到,意识至少有3重含义:1. C0,无意识加工和意识状态。即,什么工作在什么条件下,必须有意识参与?作者做了很多实验,来验证无意识加工的存在。这个领域的研究相对成熟。2. C1,总体可用性。即信息整合、同一性。这一方面的内容与“整合信息论”的理论相关,主要研究了信息整合是如何发生的,以及如何定量衡量。3. C2,自我监控——即自我意识的核心。
页:
[1]