人工智能探索2浅谈人类视觉系统的物体识别( 四 )


[4] Karen Simonyan, Andrew Zisserman. Two-Stream Convolutional Networks for Action Recognition in Videos. arXiv:1406.2199
[5] Oliver W. Layton, Ennio Mingolla andArash Yazdanbakhsh. Dynamic Coding of Border-ownership in Visual Cortex. J Vis.2012 Jan 1;12(13):8. doi: 10.1167/12.13.8.
[6] Michele Furlan and Andrew T. Smith. Global Motion Processing in Human Visual Cortical Areas V2 and V3. J Neurosci. 2016 Jul 6;36(27):7314-24. doi: 10.1523/JNEUROSCI.0025-16.2016.
[7] Anna W. Roe, Leonardo Chelazzi, Charles E. Connor, Bevil R. Conway, Ichiro Fujita, Jack L. Gallant, Haidong Lu and Wim Vanduffel. Toward a unified theory of visual area V4. Neuron. 2012 Apr 12;74(1):12-29. doi: 10.1016/j.neuron.2012.03.011.
[8] Chou P. Hung, Gabriel Kreiman, Tomaso Poggio and James J. DiCarlo. Fast readout of object identity from macaque inferior temporal cortex. Science. 2005 Nov 4;310(5749):863-6.
[9] Christopher C. Pack and Richard T. Born. Temporal dynamics of a neural solution to the aperture problem in visualarea MT of macaque brain, Nature. 2001 Feb 22;409(6823):1040-2.
[10] Alex Krizhevsky, Ilya Sutskever, and Geoffrey E. Hinton. ImageNet classification with deep convolutional neural networks. InNIPS, pages 1106–1114, 2012.

人工智能探索2浅谈人类视觉系统的物体识别

文章插图
人们识别图像是靠形状,那AI是怎么识别图像的?德国研究团队给出一个原因,这个原因出乎意料:人类会关注图中对象的形状,深度学习计算机系统所用的算法不一样,它会研究对象的纹理 。
首先人类向算法展示大量图片,有的图片有猫,有的没有 。算法从图片中找到“特定模式” , 然后用模式来做出判断,看看面对之前从未见过的图片应该贴怎样的标签 。
神经网络架构是根据人类视觉系统开发的,网络各层连接在一起,从图片中提取抽象特点 。神经网络系统通过一系列联系得出正确答案,不过整个处理过程十分神秘,人类往往只能在事实形成之后再解释这个神秘的过程 。研究人员修改图片,欺骗神经网络,看看会发生什么事 。研究人员发现,即使只是小小的修改,系统也会给出完全错误的答案,当修改幅度很大时,系统甚至无法给图片贴标签 。还有一些研究人员追溯网络,查看单个神经元会对图像做出怎样的反应,理解系统学到了什么 。
德国图宾根大学科学家Geirhos领导的团队采用独特方法进行研究 。去年,团队发表报告称,他们用特殊噪点干扰图像,给图像降级,然后用图像训练神经网络,研究发现,如果将新图像交给系统处理,这些图像被人扭曲过(相同的扭曲),在识别扭曲图像时,系统的表现比人好 。不过如果图像扭曲的方式稍有不同 , 神经网络就无能为力了,即使在人眼看来图像的扭曲方式并无不同,算法也会犯错 。当你在很长的时间段内添加许多噪点,图中对象的形状基本不会受到影响;不过即使只是添加少量噪点,局部位置的架构也会快速扭曲 。研究人员想出一个妙招,对人类、深度学习系统处理图片的方式进行测试 。
算法将图像分成为小块,接下来 , 它不会将信息逐步融合 , 变成抽象高级特征,而是给每一小块下一个决定,比如这块包含自行车、那块包含鸟 。再接下来,算法将决定集合起来,判断图中是什么,比如有更多小块包含自行车线索,所以图中对象是自行车 。算法不会考虑小块之间的空间关系 。结果证明,在识别对象时系统的精准度很高 。
人工智能探索2浅谈人类视觉系统的物体识别

文章插图
人类视觉的核心应用有哪些1、人脸识别,人脸识别是人工智能视觉与图像领域中最热门的应用 , 《麻省理工科技评论》发布的2017年全球十大突破性技术榜单中,来自中国的刷脸支付技术位列其中 。这是该榜单创建16年来首个来自中国的技术突破 。到今天为止,人脸识别技术目前已经广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等行业 。平时大家手机上都会使用人脸识别功能 。2、安防,人工智能技术可以对结构化的人、车、物等视频内容信息进行快速检索、查询,这使得公安系统可以在繁杂的监控视频搜寻罪犯 。在大量人群流动的交通枢纽,这一技术被广泛用于人群分析、防控预警等方面 , 可以根据采集到数据,快速检测到人、车、物,从而大大地提高检索速度 。3、农业领域,农业是计算机视觉技术的发展和应用在农业,尤其是精确农业领域产生了巨大影响 。