【心理学和AI】2020-06-12第二章整合笔记

如题所述

第1个回答  2022-07-20
摘要

生物是感觉运动系统。世界上的事物与我们的感官表面接触,我们与它们的互动是基于感觉运动接触所能提供的“affordances”。我们所有的分类都包含了我们对不同事物的不同行为方式——我们吃或不吃、配合或逃避的事物;或者我们用语言描述的事物,比如质数,绝对可区分的事物,或者真理。分类——用正确的东西做正确的事——很大程度上是认知的内容和目的。

2.1感觉运动系统

生物体是感觉运动系统。世界上的事物与我们的感官表面接触,根据Gibson(1979)的说法,我们与它们的互动是基于感觉运动接触所“提供的(afford)”。

2.2不变的感觉运动特征(“affordances”)

一个感觉运动系统能做什么,取决于从其与感觉输入的运动相互作用中能提取什么。 光刺激为我们这些拥有正确感觉器官的人提供了色觉。当我们移动时,附近物体投射在视网膜上的“阴影”比其他物体的阴影移动得更快, 这一几何事实意味着,对于我们这些视力正常的人来说,我们的视觉输入提供了深度感知。

对于三维形状,即使它在视网膜上的阴影的大小和形状随着我们和它的关系变化而变化,但实际上可以保持相同的形状和大小。我们的视觉系统可以检测并提取这种不变性,并将其转化为 视觉恒定性 。

2.3 分类

感觉运动机器人学和感觉运动生理学迄今为止只复制和解释了我们感觉运动能力子集的一小部分,但是已经进入了分类(categorization)的范畴。

分类是一个自主的、适应性的感觉运动系统和世界之间的任何系统性的差异互动(systematic differential interaction)。 任意的相互作用,如风对沙漠中的沙子的影响,不算作分类。风和沙都不是一个自主的感觉运动系统,它们只是动态系统。

分类是一种特殊的动态系统。 分类也会随着时间的推移而发生变化。

自主系统(autonomous system)中的自适应变化是指自主系统内的内部状态随时间而系统地变化,因此,简单地说,相同的输入不会产生完全相同的输出。 类别(categories)是种类(kinds),当相同的输出与相同kinds的输入(而不是完全相同的输入)发生时,就会发生分类。不同的输入会产生不同的输出。这就是“差异”的来源。

2.4 学习

自适应性与实时性相适应。 自主的、自适应的感觉运动系统对不同类型的输入有不同的反应,但是,要证明它们确实是自适应系统,它也并非总是像现在这样作出不同的反应。换句话说(尽管很容易将其视为完全相反), 分类与学习密切相关。

分类的问题并不是确定存在什么样的事物,而是像我们这样的感觉运动系统是如何检测出它们能检测到和确实检测到的那些事物的;它们是如何对它们做出不同的反应的。

2.5 固有分类(innate categories)

也许我们生来就有能力对我们做的所有事情做出不同的反应,而不需要去学习。也许所有我们能检测到的不变性,我们已经可以本能地检测到,而不需要任何依赖于时间的内部变化。不需要任何复杂的差异互动,我们称之为“学习”。

分类能力起源的“生活大爆炸理论”:

分类的能力在我们的大脑中以某种方式预先形成,就像碳原子的结构在大爆炸中预先形成一样,不需要像达尔文进化论那样通过变异和自然选择来塑造它。

对 分类能力的一个特殊子集 做出类似的推理:即 根据构成所有可能自然语言基础的通用语法(UG),生成和检测所有且仅检测语法上的字符串的能力。

UG依从性 是所讨论的潜在不变量,我们检测和生成UG依从字串的能力既不是通过学习也不是通过进化形成的;相反,它在某种程度上是我们大脑结构中固有的,作为一种结构必然性,直接源于大爆炸。

就UG而言,有相当多的 “缺乏刺激(poverty-of-the-stimulus)” 的证据表明,根据儿童在学习第一语言所需的时间内所听到和产生的数据,他们无法通过反复试验来学习UG。

2.6 后天习得的类别

证据表明,我们的大多数类别都是后天习得的 。

对于感官系统来说,一个个体(专有名词)和一个内容词所指的事物都是种类(kind)。

2.7 监督学习

分类是一种感觉运动技能,其中很大一部分是通过分析感觉输入来决定做/不做什么。 输出是分类的,非连续的 。像所有的技能一样, 分类是习得的 。但是不像游泳或绘画这样的连续技能,分类是离散的,要么全有,要么全无:要么做这个,要么做那个。

什么是学习?描述“一个系统什么时候做什么”比描述“它如何做”更容易。当一个系统根据材料和误差模拟输入并产生相应的输出时,学习就发生了。它的性能由正确的反馈来指导。我们 从自己行为的后果中得到反馈,在此基础上学会做什么 。然而,这只是描述输入和感觉运动的相互作用,而不是感觉运动系统实际上如何做这些事情——“how”(感觉运动能力的内在机制)。

2.8 操作性(工具性)学习

操作性或工具性学习: 由一个自动适应系统执行对不同类型输入的系统的不同反应,最初随机响应,但在纠错反馈的指导下学会适应其反应 (这是由于其内部状态的某种功能变化)。

当一只鸽子看到黑色圆圈时,它会啄一个键,当它看到白色圆圈时,它会啄另一个键(给食物是反应正确的反馈,没有食物是反应错误的反馈)。在只对黑和白进行训练之后,逐渐“变形”为灰色阴影,并在没有反馈的情况下测试中间的阴影,图像将显示出平滑的“综合梯度”,在“黑”键上啄得越多,灰色输入就越接近黑色,在白键上啄得越多,灰色输入就越接近白色,并在两者之间接近一个偶然的表现水平。在这种情况下,人类也是如此。

2.9 颜色类别

然而,如果动物有色觉,用蓝色和绿色作为输入,图像就会不同。在蓝色-绿色的中点仍会有最大的混乱,但是在边界的两边,按键的正确选择和按压的次数会比灰色阴影更突然地增加——甚至可以说是“分类的”。原因是黑色和白色之间没有天生的类别界限,而绿色和蓝色之间有(在蓝-绿色觉正常的动物中)。

2.10 分类感知

这种在边界上相对突然的感知变化被称为“分类感知”(CP,categorical perception) ,在颜色感知的情况下,这种影响是与生俱来的。如果我们没有颜色分类感知,那么从红色到紫色的连续光谱看起来很像灰色的阴影,中间没有任何由中性混合物分隔的定性“带”。

颜色类别是通过一种复杂的感觉感受机制来检测的(该机制尚未被完全理解),不仅包括光的频率和其他属性(比如亮度和饱和度),还包括一个内部机制——三个专门的检测器选择性地调谐到频谱的某些区域(红、绿、蓝),而且之间存在相互抑制的“反过程”关系(红色—绿色,蓝色—黄色)。这种机制会导致一些频率范围被自动“压缩”。每一个颜色范围内都有一个压力,它们之间也有一个膨胀。因此,大小相等的频率差异在同一个颜色类别内时看起来比跨越不同颜色类别的小得多。

虽然颜色CP是天生的,并非习得的,但仍符合我们对分类的定义 。我们的祖先能够根据颜色进行快速、准确的区分,他们比那些不能区分的人活得更久、复制得更好。自然选择作为基因试错变异的“纠错”反馈。

2.11 学习的算法

人工智能研究中的机器学习算法(Michalski,Carbonell和Mitchell,2013),人工生命研究中的遗传算法(Mitchell & Forrest,1994)和神经网络研究中的连接主义算法(Schmidhuber,2015)都为执行分类的“how”提供了候选机制:我们的大脑是如何学习抽象、不变的特征,如何区分每个类别的成员和非成员,如何使得我们用正确的事情做正确的事情。

总的来说,有两种学习模型:“监督(supervised)”和“无监督(unsupervised)”模型。

无监督模型通常是基于假设输入的“affordances”已经非常显著,因此正确的分类机制将能够根据输入landscape的形状来进行选择(无需要任何外部纠错反馈)。然而这首先需要大量的重复exposure和处理,其次这种假设还存在普遍的不确定性问题——相同的事物往往可以用许多不同的方式进行分类。

2.12 无监督学习

物体的感觉痕迹(sensory shadow)中既有形态不变量,也有几何不变量,特别是当我们与物体发生相对移动时。这些不变量可以通过对结构和相关性进行采样的非直观学习机制来提取。这种机制根据事物的结构相似性和差异性对事物进行分类,增强相似性和对比性。无监督对比度增强和边界发现机制的一个例子是“相互抑制”,即视觉空间中一点的活动抑制周围点的活动,反之亦然。这种内部竞争倾向于将输入所固有的和提供的结构集中化。

2.13 监督学习

根据其他环境(依赖于上下文的分类)采用对相同的感觉痕迹进行分类的不同方法,需要通过纠错反馈进行监督。因此,有监督的分类比无监督的分类更加模糊。两种分类都是不确定的,因为它们成员的感觉痕迹由大量的特征或维度组成,存在无数的潜在组合,很难找到能够提供正确分类的子集。但是有监督的分类更难,对于同一组感觉痕迹,有许多正确的分类。

不仅所有的事物都是无限多个不同类别的成员,而且它们的每一个特征和特征的每一种组合都是一种潜在的affordances,可以把事物分配到更多的类别中。当试图解释感觉运动系统如何工作的理论问题时,感觉输入就是无数不同种类事物的感觉痕迹。

监督学习的算法往往适用于:当不变特征是不确定的,且找到它们的问题不是“NP-complete问题”(即,只要有足够的数据、反馈和时间来找到不变特征)。 数据不足和时间不足的一个例子是UG(通用语法),儿童学习语言的时间较短,他们无法学习区分与UG相符和与UG不相符的话语的不变量,然而,所有的孩子都会UG法,这意味着他们生来就必须遵守已经在大脑中编码的通用语法规则。但是, 我们的大部分分类,不是天生的而是后天习得的 。

我们的分类算法必须能够做到我们所能做到的。因此,如果我们能够正确地对一组输入进行分类,那么这些输入不仅必须具有能够提供正确分类的特征,而且还必须有一种方法来发现和使用这些affordances。

2.14  vanishing intersections

福多(Fodor)和其他人认为,大多数分类学习既不能通过反复试验(监督学习,supervised learning)来习得,也不能通过逐渐改变的反复试验来发展(*即分类学习能力大程度上是先天的),重要的原因就是vanishing intersections问题 。如果回到字典里,挑一些实义词,会发现寻找不到那些词所指定事物的感官阴影区(sensory shadows)所共有的不变性,因为它们的“intersection”是空的。

(A)向神经网络提供三组刺激:左边刺激的垂直臂比水平臂长得多;中间垂直和水平臂大约相等;右的水平臂比垂直臂长得多。(B)在无监督自动关联之后但在监督学习之前,这三类中的每一个类别的隐藏单元表示的位置(多维数据集表示具有长垂直臂的Ls;金字塔Ls具有几乎相等的臂;而球体Ls具有长的水平臂 )。 (C)类内压缩和类间分离时网已经学会了分离三类输入

2.15 DIRECT SENSORIMOTOR INVARIANTS

不变理论家们同意了福多等人的部分观点,他们认为在正确地分类字典指定的所有类别的成员时的确受到了能力的限制,但是他们否认“先天论”这种神秘的观点。他们假设,如果个体可以进行分类,那么该技能必须具有感觉运动基础,其来源必须是进化发展,学习或两者都有,这意味着shadows中必须有足够的空间来承担我们所有的分类能力。

2.16 ABSTRACTION AND HEARSAY

不仅仅是直接的感觉运动是否不变的问题,通过追溯抽象的源头,分类研究从直接的感官经验获得的范畴,进入到到那些通过语言传闻(linguistic hearsay)获得的范畴。人可以对事物做五种操作——看到它们,识别它们,操纵它们,给它们命名以及描述它们。但其中,识别(Recognizing)是较特殊的,当我们识别出某种事物时,我们将其视为一种我们以前见过的事物(或个体),即类别的成员。 从识别事物(作为一种事物或作为一个个体)到通过为其赋予名称来识别它只是一小步。 “看见”需要感觉运动基础,而“识别”则需要更多抽象的能力,不是简单的被动感知。

2.17  ABSTRACTION AND AMNESIA

2.16提出一个问题:“有非抽象的感觉运动吗?”为了回答,2.17利用小说的内容进行解释。一篇小说《记忆中的福内斯》中描述了一个无法进行抽象的人:他再也不能忘记任何事情,有超强的死记硬背能力。他的生活经历的每一个连续的瞬间都被永久地储存起来;之后,他可以在脑海中重放日常经历,而持续重新体验它们所花费的时间甚至比一开始就经历它们所花费的时间还要长。

无限的死记硬背因此成为障碍,而不是优势——他无法忘记。然而,为了识别和命名事物所需要的是选择性的忘记,或者至少是选择性的忽略。他只能是一个被动的感觉运动系统,受到周围环境的影响。作者将该角色描述为难以掌握抽象概念的人,然而如果他真的拥有无限的记忆和完全丧失选择性遗忘的能力,那么他根本就不会说话,因为我们的词汇都是基于抽象的分类。

2.18 INVARIANCE AND RECURRENCE

2.17描述的是一位小说中的角色,而神经心理学家亚历山大·卢里亚描述了一个真实的人:他有类似的残疾,但并没有延伸到拥有无限的死记硬背能力。在《记忆大师的头脑》(1968)中,罗瑞亚描述了一个舞台记忆艺术家S,他在S还是记者的时候就注意到了这个人,因为S从不做笔记。S不像小说中那样有无穷无尽的死记硬背,而是比普通人更强大更持久的记忆力;但是他强大的硬记能力也是一个障碍——他在阅读小说时遇到了麻烦,因为当描述一个场景时,他会形象地看到自己曾经实际看到过的场景,不久他迷失在依靠自己生动的思想记忆中,无法跟随小说的内容。对于抽象概念,比如数字,甚至是我们不难做出的普通概括,S也很难做到。

S等的故事表明,生活中人需要检测重复发生的能力,而这又需要忘记或至少忽略了什么使每个瞬间变得独特且无法准确重复。如前所述,吉布森的“负担”概念很好地体现了必需的能力:物体在我们的身体与人体之间提供一定的感觉运动相互作用。这些承受能力是感觉输入或感觉运动与输入的相互作用的所有不变特征,并且生物体必须能够选择性地检测这些不变变量,即抽象化它们并忽略其余的变化。如果所有感觉运动特征都可以相提并论,并且每个变化都是无限、独特的,那么就不可能有不变量的抽象来允许我们识别相同或相似之处或识别种类或个体。

2.19 FEATURE SELECTION AND WEIGHTING

丑小鸭定理”也有相同的见解。从逻辑上讲,没有理由说“丑小鸭”可以说与任何小鸭都比更像天鹅。丑小鸭看起来比其他鸭子更相似的唯一原因是我们的视觉系统对某些特征的重视程度高于其他特征,换句话说,它是选择性地将某些特征抽象为特权。当然,我们的感觉运动系统不能对所有功能给予同等的重视。 他们甚至没有检测到所有功能。 在它们检测到的特征中,某些特征(例如形状和颜色)比其他特征更显着(例如空间位置和羽毛数量)。 而且不仅检测到的特征是有限的和差分加权的,而且我们对它们的记忆甚至更加有限:当它们存在时,我们看到的特征远远超过我们以后所记得的——这被称为“降维,它可以通过进化选择产生于固有的不变性检测器,也可以通过无监督和监督产生的学习获得不变性。

2.20 DISCRIMINATION VERSUS CATEGORIZATION

一个来自心理物理学的经典例证是米勒强调的相对区分和绝对区分(relative and absolute discrimination)之间的区别—— The Magical Number 7 Plus or Minus 2。假设你给一个人看一个随机的,不熟悉的形状。紧接着,你再给他们看一遍同样的形状,或者另一个稍微不同的形状。这个人应该能够告诉你这两个连续的形状是相同的还是不同的。这是一种相对区分,基于同时的或快速连续的两两比较。JND(just noticeable-difference)被视作两两相对比较中能够检测到的最小差异。如果差异小于JND,则图形将被视为相同。

假设不是快速连续地展示它们以进行比较,而是单独展示两个图形中的一个,然后问它是两个图形中的哪一个。孤立地识别一个形状是要进行绝对区分的分类。米勒指出,我们进行绝对歧视的能力远比相对歧视的能力受到更大的限制。

米勒把相对区分称为描述(discrimination),把绝对区分称为分类(categorization)。两个刺激(或两个种类的刺激)需要有更多的差异,使我们能够确定两个刺激是独立显示的(分类)还是同时(或快速连续)看到的,我们要做的是判断是否相同。米勒指出,如果这两种刺激只在一个感觉维度上有差异,比如长度,那么我们可以辨别(相对区分)的最小差异JND的大小就可以很小,而我们可以辨别的JND差异的数量沿着维度增加可以是巨大的,我们可以区分的规模和数量取决于感官维度。

相比之下,如果每个刺激都是单独呈现的(绝对区分),米勒估计,对于任何一个感官维度,我们都可以用不同的名称将单个感官维度细分为7个类别,但如果我们试图将维度细分得更细,分类的错误就会随之增加。对分类能力的限制在存储容量上也有相应的要求——如果给我们要记住的一串数字,我们只能记住大约7个数字。 如果数字字符串较长,记忆的错误则会增加。之后科恩重新估计了米勒限制,将其限制为接近四个而不是七个。

【总述】分类可以通过将某些特征抽象化及忽略其他特征而进行,且训练后类内差距缩小而类间差距增大。

1、重新编码和特征选择

有两种增强分类能力的方法。其一是增加对事物认识的维度,有联觉的人因为可以对事物从多个感觉进行识别,所以其分类能力高。但其局限性在于每个维度都无法达到单一维度的精确率。第二种方法是 重新编码 ,正如我们将0和1组成的二进制数据编码为十进制时能够记忆原先3倍的数据一样。类似地, 事物特征 可以帮助分类。如果两个事物只有几个特征是相同的,我们不确定其是否归为一类,这就涉及到上述的“不确定性underdetermination”、“信用分配credit-assignment”问题。

监督学习 (强化学习)即在正确的反馈指导下学习,可以解决信用分配问题,并将事物的特征抽象化。如果学习成功,则特征被重新编码、重新加权,与无关特征相比,同类事物的相同特征具有更大的权重,导致 类内差距缩小而类间差距增大 。

2、习得的分类知觉

突然的感知变化称为“类别感知”(categorical perception,CP)。

3、信息可以减少相互混淆的事物之间分类的不确定性。当我们分类并收到反馈时,我们正在对混淆的事物进行辨别。对新生雏鸡的性别分类比较困难,因为这种分类方法无法用语言表达,需要经过数年的反复强化训练。但并不是完全没有办法。Biederman和Shiffrar对新生雏鸡进行了计算机分析,确定了一个分类的特征“geon”,使得一些有经验的人也能像大师一样分类小鸡。所以分类取决于选择性地抽象某些特征而忽略其他特征。

一般来说,对特征进行抽象的结果直接作用在分类上,但大部分应用于符号(如语言表达),通过他人对抽象结果的传授,别人也可以间接地获得分类知识而不需要强化学习。

2.27 语言的适应性特征

在分类学习中,对于一些复杂的分类,往往是内隐的,我们无法用语言表达为何会这样分类,能说出来的一些特征也往往不是,因此在实践中我们无法将我们的隐性知识变得显式。但是如果能用语言表达的经验,往往会省去很多反复试验的麻烦,因此语言教学是有强大是适应性优势的。

图A是一个人工模拟的蘑菇采集模型,有两种方式,一种是不断的试错,获得反馈;一种是通过语言获取一些可描述的信息。结果是语言描述更具有优势,可以更快掌握规则类别。但是语言的基础也是感觉运动的试错,不可能一直靠语言获取就行。

2.28 GROUNDING INSTRUCTION IN INDUCTION

对于一些完全陌生的新分类,例如樱花草,我们可以(1)直接的试错经验,通过反馈纠正我们的猜测;(2)从大师、网络、百科全书等获得语言上的信息。但是这些语言信息也需要我们已经有了一些基础的分类(例如在理解樱花草是什么,基础是对花、草的理解),通过这些需要直接的感觉运动感应学习的基础信息,我们可以重新组合间接学习其他的分类。

2.29 NUMBERS’ AFFORDANCES

对于数字这个分类,例如质数是什么,光靠语言描述是不够的,需要我们进行切实的时间,得到反馈,例如质数和因子有关,我们需要尝试不同的数字分解因子是什么样,然后找到类别的特征。

2.30 绝对的可辨性和affordances

在樱花草和质数两个例子中,有没有关联和比较?Miller(1956)认为他们都具有绝对的可变性,而且都具有感觉运动感应的affordances。我们可以通过隐性的和显性的方式认识他们,例如直接的试错时间,语言的指示和描述。

2.31 认知科学不是本体论(ontology)

纯粹的认知科学家都不会觉得本体论是一切。但在感觉运动感应理论里,我们能看到,辨别,命名都是感觉器官接受了输入的结果,这里就是有本体论的影子。

2.32 “抽象”的类别

类别都是抽象的,但是也有一些更加“抽象”的,例如美,真,善。这些类别被教育家等等用语言进行了很多描述。但是在具体的视觉中,我们更多地会用到感觉体验,比如品尝好和不好,通过直接的感觉经验我们可以获得大量取样,而那些专家的语言描述也会有一定的影响。

2.33 认知就是分类

归根结底,分类就是我们对不同的事物有不同的行为方式。