2月22日CNNs和人类视觉的区别

棠香
精选回答

“CNN 端到端地学习一切。他们通过布线获得了巨大的胜利,因为如果一个功能在一个地方很好,它在其他地方也很好。这使他们能够结合证据并很好地概括不同的立场,”Hinton 在他的 AAAI 演讲中说。“但它们与人类的感知非常不同。”

计算机视觉的关键挑战之一是处理现实世界中数据的变化。我们的视觉系统可以从不同的角度、不同的背景和不同的照明条件下识别物体。当物体被其他物体部分遮挡或以古怪的方式着色时,我们的视觉系统会使用线索和其他知识来填充缺失的信息和我们所看到的原因。

事实证明,创建可以复制相同对象识别功能的 AI 非常困难。

“CNN 旨在应对翻译,”Hinton 说。这意味着一个训练有素的卷积网络可以识别一个物体,而不管它出现在图像中的什么位置。但是它们不太擅长处理改变视点的其他影响,例如旋转和缩放。

根据 Hinton 的说法,解决这个问题的一种方法是使用 4D 或 6D 地图来训练 AI,然后执行对象检测。“但这只会变得非常昂贵,”他补充道。

目前,我们最好的解决方案是收集大量图像,将每个对象显示在不同的位置。然后我们在这个庞大的数据集上训练我们的 CNN,希望它能看到足够多的对象示例进行泛化,并能够在现实世界中以可靠的准确度检测对象。ImageNet 等数据集包含超过 1400 万张带注释的图像,旨在实现这一目标。

“这不是很有效,”Hinton 说。“我们希望神经网络能够毫不费力地推广到新的观点。如果他们学会了识别某样东西,你把它放大 10 倍,然后旋转 60 度,那根本不会给他们带来任何问题。我们知道计算机图形学就是这样,我们想让神经网络更像那样。”

事实上,目前评估计算机视觉系统的首选基准 ImageNet 已被证明存在缺陷。尽管数据集规模巨大,但无法捕获对象的所有可能角度和位置。它主要由在理想照明条件下和从已知角度拍摄的图像组成。

这对于人类视觉系统来说是可以接受的,它可以很容易地概括其知识。事实上,当我们从几个角度看到某个物体后,我们通常可以想象它在新的位置和不同的视觉条件下会是什么样子。

但是 CNN 需要他们需要处理的案例的详细示例,而且它们没有人类思维的创造力。深度学习开发人员通常尝试通过应用称为“数据增强”的过程来解决这个问题,在该过程中,他们在训练他们的神经网络之前翻转图像或少量旋转图像。实际上,CNN 将在每张图像的多个副本上进行训练,每个副本都略有不同。这将有助于 AI 更好地概括同一对象的变化。数据增强在某种程度上使 AI 模型更加健壮。

但数据增强不会涵盖 CNN 和其他神经网络无法处理的极端情况,例如翻转的椅子或躺在床上的皱巴巴的 T 恤。这些是像素操作无法实现的现实情况。

已经努力通过创建计算机视觉基准和训练更好地代表现实世界混乱现实的数据集来解决这个泛化问题。但是,虽然它们将改善当前 AI 系统的结果,但它们并没有解决跨观点泛化的根本问题。总会有这些新数据集不包含的新角度、新光照条件、新颜色和姿势。这些新情况甚至会迷惑最大、最先进的人工智能系统。

郁金香 2023-08-20 11:27:39

相关推荐

雾莲要不要去皮

莲雾不需要去皮。莲雾是可以连皮一起食用的水果,但前提是要将其洗干净。从市场买回来的莲雾可先用流水冲洗一遍,再将其放入有少量食盐的清水中浸泡15分钟左右,再用清水冲洗1-2遍即可食用。雾莲雾莲一般指洋蒲桃,也叫莲...
展开详情

茂县有多少人口

茂县,在2015年末,户籍人口为11.16万;茂县,隶属于四川省阿坝藏族羌族自治州。位于四川省西北部、阿坝藏族羌族自治州东南部的青藏高原东南边缘,地跨岷江和涪江上游高山河谷地带,属高原性季风气候;全县总面积39...
展开详情

板式家具设计需要学习哪些软件

CAD:主要绘制工具,此软件是家具设计师的重点学习软件。3DMAX:产品建模,场景建模主要展示出产品的特质构造。Vray:配合3DMAX,渲染出产品展示产品三维和各种材质的特点。Coreldraw:产品包装图纸...
展开详情

如何带好一支优秀的幼儿教师团队

实行人为管理,充分尊重和信任教师。实行人性化管理,让每一位教师都参与到管理中去。切实关心教师的生活,解决教师的后顾之忧。尊重和信任教师。善于用人,充分发挥团队的力量。注重教师培训,提高业务水平。按计划定期让老师...
展开详情

XP系统怎么进安全模式

安全模式是Windows系统中的一种特定模式,XP系统进入安全模式的方法:1、如果感觉系统出现问题,或者有一些无法卸载的软件,需要到安全模式中解决,那请先重新启动;2、?在系统未启动之前,一直不停地按F8键,直...
展开详情

精选推荐更多>

小聪明是什么意思

小聪明,汉语词汇,拼音:xiǎo cōng ming,释义:在小事情上或枝节方面显露出来的聪明,多损伤大局或不利于长远。常含贬意。是指此人虽聪明伶俐,但不能做到大智若愚,为人处事时总以为别人想不到,而运用自己的谋划和行动来达到自己的目的。
引证解释:
1、元·汤式《湘妃引·和陆进之韵》曲:“使聪明休使小聪明,学志诚休学假志诚。”
2、清·金松岑、曾朴《孽海花》第十四回:“威毅伯笑道:‘只是小儿女有点子小聪明,就要高着眼孔,这结亲一事,老夫倒着实为难。’”
3、鲁迅《故事新编·非攻》:“我们的老乡公输般,他总是倚恃着自己的一点小聪明,兴风作浪的。”
4、艾芜《人生哲学的一课》:“我得弄点小聪明,就是装假也不要紧。”
造句:
1、张剑总喜欢在同学们面前卖弄那点儿小聪明。
2、耍小聪明的人,往往聪明反被聪明误,常常把事情弄糟。
3、你就爱耍这种小聪明,但哪一次不是弄巧成拙,整了自己?

反常必有妖怪的前一句是什么

前一句是“事出”,全句是“事出反常必有妖”。意思是事情反常就一定有奇怪的地方。
出自清朝纪昀《阅微草堂笔记玉马精变》,原文是:越七八日乃萎落,其根从柱而出,纹理相连,近柱二寸许,尚是枯木,以上乃渐青。先太夫人,曹氏甥也,小时亲见之。咸曰瑞也,外祖雪峰先生曰:物之反常者为妖,何瑞之有!曹氏亦式微。
译文:
花叶繁茂下垂,过了七八天才枯萎谢落。花的根从柱生出,纹理与柱相连;靠近柱子二寸光景,还是枯木,往上才渐渐发青。先母太夫人是曹氏的外甥女,小时亲眼见过厅柱的牡丹,当时都认为是吉祥征兆。我的外祖雪峰先生说:“反常的物就是妖,哪有什么吉祥征兆?”后来曹氏门庭也衰落了。
纪昀(1724.7.26-1805.3.14),字晓岚,一字春帆,晚号石云,道号观弈道人,直隶献县(今河北沧州市)人。清代政治家、文学家,乾隆年间官员。历官左都御史,兵部、礼部尚书、协办大学士加太子太保管国子监事致仕,曾任《四库全书》总纂修官。

诫子书是什么体裁

《诫子书》的体裁是书信,《诫子书》是政治家诸葛亮临终前写给他儿子诸葛瞻的一封家书。
原文:
夫君子之行,静以修身,俭以养德。非淡泊无以明志,非宁静无以致远。夫学须静也,才须学也,非学无以广才,非志无以成学。淫慢则不能励精,险躁则不能治性。年与时驰,意与日去,遂成枯落,多不接世,悲守穷庐,将复何及!
译文:
君子的行为操守,从宁静来提高自身的修养,以节俭来培养自己的品德。不恬静寡欲无法明确志向,不排除外来干扰无法达到远大目标。学习必须静心专一,而才干来自学习。不学习就无法增长才干,没有志向就无法使学习有所成就。放纵懒散就无法振奋精神,急躁冒险就不能陶冶性情。年华随时光而飞驰,意志随岁月而流逝。最终枯败零落,大多不接触世事、不为社会所用,只能悲哀地坐守着那穷困的居舍,其时悔恨又怎么来得及?
文章阐述修身养性、治学做人的深刻道理。从文中可以看出诸葛亮是一位品格高洁、才学渊博的父亲,对儿子的殷殷教诲与无限期望尽在此书中。全文通过智慧理性、简练谨严的文字,将普天下为人父者的爱子之情表达得非常深切,成为后世历代学子修身立志的名篇,并入选中国义务教育语文教材。

正余弦公式互换

正余弦公式互换有:
sin(π/2-α)=cosα。
cos(π/2-α)=sinα。
sin(π/2+α)=cosα。
cos(π/2+α)=-sinα。
cos(π-α)=-cosα。
sin(3π/2-α)=-cosα。
cos(3π/2-α)=-sinα。
sin(3π/2+α)=-cosα。
cos(3π/2+α)=sinα。
互换口诀:奇变偶不变,符号看象限。
正弦(sine),数学术语,在直角三角形中,任意一锐角∠A的对边与斜边的比叫做∠A的正弦,记作sinA(由英语sine一词简写得来),即sinA=∠A的对边/斜边。
余弦(余弦函数),三角函数的一种。在Rt△ABC(直角三角形)中,∠C=90°(如概述图所示),∠A的余弦是它的邻边比三角形的斜边,即cosA=b/c,也可写为cosa=AC/AB。余弦函数:f(x)=cosx(x∈R)。
常见热点问答
热点搜索
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200
作文大全
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200