人工智能探索2浅谈人类视觉系统的物体识别( 二 )


腹侧通路VP
位于中层皮质区(Midtier Cortical area)的V4主要向VP映射信号,对于物体识别至关重要[7] 。V4可以识别不同曲率和颜色亮度变化 。与V2相比,V4的感受野更大,处理信号包含参照物信息 。尽管V4主要参与VP , 仍然有近三分之一的V4神经元对方向敏感,这可能和在运动的情况下区分边界、完成物体背景分离有关(下图D) 。

人工智能探索2浅谈人类视觉系统的物体识别

文章插图
V4参与物体识别的场景 Figure from Ref[7]
与V2、V3不同的是,V4接收更多来自高等皮层的反?。‵eedback,或Top-down)信号 。在视觉注意(Visual Attention)这一现象中,反馈信号对特定区域的前?。‵eedforward , 或Bottom-up)信号进行增强,进而改变感知 。我们还会专门写文章介绍这一现象 。
腹侧通路VP主要位于下颞叶皮层(Inferior Temporal Cortex,IT) 。2005年 , MIT的Tomaso Poggio和JamesJ. DiCarlo两位知名神经和计算科学家共同发表文章[8],实验同时监控了两只猕猴IT区域的256个位点的神经元电信号 。实验人员给猕猴展示了8大类别的77个不同物体图片,每个物体重复10次 。下图为其中5个物体和3个位点的信号 。基于256个位点的信号训练的线性分类器,在交叉验证的情况下 , 可以做到94±4%的分类准确度,和72±3%的识别物体准确度 。实验证实腹侧通路在IT区域完成了物体识别和分类的功能 。
人工智能探索2浅谈人类视觉系统的物体识别

文章插图
Figure from Ref[8]
背侧通路DP
MT区与运动感知深度相关,超过90%的MT神经元识别时域信号 , 其感受野约为V1的十倍,所以MT有能力感知更大范围的运动[9] 。MT还能感知双目视差和景深,这有助于在三维空间识别物体和运动 。另外MT还负责控制眼球运动,和内侧颞上区(Medial Superior Temporal area,MST)协同眼球转动[2] 。
背侧通路DP位于运动额叶(Premotor Area in Frontal Lobe) , 主要接收MT和V3A的信号,包括6个功能区:MST、CIP、LIP、VIP、MIP和AIP 。MST神经元可以检测图案的放大和旋转运动,还能感知光流,进而检测自我运动(Self-motion) 。在眼球转动的瞬间,一些MST神经元抵消自运动方向上的信号 。顶叶内尾区(Caudal Intraparietal area , CIP)识别倾斜的平面,同时在眼球扫视(Saccade)的运动中,CIP神经元停止响应 。
侧壁内区(Lateral Intraparietal area,LIP)位于视觉皮层和运动皮层之间,同时接收来自VP和DP的信号,向额叶的运动中枢映射 。LIP是协调视觉和运动的核心区域,同时参与高等认知活动,比如形成决策(Decision Formation)、处理奖励(Reward Processing)、计时(Timing)、分类(Categorization)、运动计划(Motor Planning)、专注(Attention)等等 。
腹壁内区(Ventral Intraparietal area,VIP)神经元接收来自视觉、听觉、触觉和前庭体感的多模态(Multimodal)信号 。VIP的感受野超出视觉,还包括近身周边空间(Near-extrapersonal Space) 。VIP很有可能负责头部运动的控制 。MST,CIP,LIP和VIP都参与到了眼球扫视运动中,我们将写专题介绍相关机理 。
人工智能探索2浅谈人类视觉系统的物体识别

文章插图
灵长目视觉系统功能区和通路 Figure from Ref[2]
内侧顶叶内区(Medial Intraparietal area,MIP)编码了运动计划 。当肢体按照运动计划,向目标方向移动的时候,MIP神经元会响应 。如果肢体运动偏离运动计划,MIP神经元则不响应 。顶叶内前区(Anterior Intraparietal area , AIP)对于手部运动和抓取物体响应 。
双通路卷积网络