如何在物理层面上运作的理解是我们视觉系统的关键组成部分之一

黎明前的暖怀
精选回答

从婴儿时期起,我们就开始探索世界,其中大部分是通过观察来探索的。我们了解重力、对象持久性、维度等事物,然后我们使用这些概念来推理视觉场景。

“感知、预测并因此与物理世界中的物体进行适当交互的能力依赖于对环境的快速物理推断,”《黑暗,超越深度》的作者写道。

快速浏览一个场景,我们可以快速了解哪些物体支撑或悬挂在其他物体上。我们可以相当准确地判断一个物体是否能够承受另一个物体的重量,或者一堆物体是否可能倾倒。我们不仅可以推理刚性物体,还可以推理液体和沙子的特性。例如,如果您看到一个倒置的番茄酱瓶,您可能会知道它的位置可以利用重力来轻松分配。

虽然物理关系在大多数情况下在图像中可见,但在没有直观物理模型的情况下理解它们几乎是不可能的。例如,无论您是否了解打台球,您都可以根据您对物理世界的一般知识快速推断出哪个球导致其他球在接下来的场景中移动。您还可以从不同的角度理解同一场景或任何其他台球桌场景。

当前的人工智能系统需要改变什么?“为了构建类似人类的常识知识,一个直观物理学的计算模型可以支持任何涉及物理学的任务的表现,而不仅仅是一项狭窄的任务,必须在代理的环境理解中明确表示,”作者写道。

这与 AI 中当前的端到端范式背道而驰,其中神经网络被赋予视频序列或图像及其相应的描述,并期望将这些物理属性嵌入到它们的权重中。

最近的工作表明,与纯基于神经网络的系统相比,包含物理引擎的人工智能系统在推理对象之间的关系方面要好得多。

因果关系

因果关系是当今人工智能算法的最终缺失部分,也是所有 FPICU 组件的基础。是公鸡啼叫使太阳升起还是日出使公鸡啼叫?温度升高会增加温度计中的汞含量吗?拨动开关是开灯还是反之?

我们可以看到同时发生的事情,并假设一个原因是另一个原因还是它们之间没有因果关系。另一方面,机器学习算法可以跟踪不同变量之间的相关性,但无法推断因果关系。这是因为因果事件并不总是可见的,它们需要对世界的了解。

因果关系使我们不仅能够推理场景中发生的事情,还能推理反事实,即尚未发生的“假设”情景。“观察者利用他们的反事实推理能力来解释视觉事件。换句话说,解释不仅基于观察到的内容,还基于会发生但没有发生的事情,”人工智能研究人员写道。

为什么这很重要?到目前为止,人工智能系统的成功很大程度上依赖于提供越来越多的数据来弥补因果推理的不足。在强化学习中尤其如此,在强化学习中,AI 代理被释放以通过反复试验来探索环境。谷歌等科技巨头利用其纯粹的计算能力和无限的财务资源,通过数百万个场景来暴力破解他们的人工智能系统,以期捕捉到所有可能的组合。这种方法在棋盘和视频游戏等领域取得了很大的成功。

然而,正如“Dark, Beyond Deep”的作者所指出的,强化学习程序没有捕捉因果关系,这限制了它们将功能转移到其他问题的能力。例如,一个可以在冠军级别玩星际争霸 2的AI如果给它魔兽争霸 3 或更早版本的星际争霸,它会傻眼。它甚至无法将其技能推广到它所训练的地图和种族之外,除非它在新设置中经历了数千年的额外游戏。

“解决这一挑战的一种方法是学习环境的因果编码,因为因果知识固有地编码了世界的可转移表示,”作者写道。“假设世界的动态是恒定的,无论观察到环境如何变化,因果关系都将保持真实。”

功能

如果您想坐下而找不到椅子,您会寻找一个可以支撑您体重的平坦而坚固的表面。如果您想在墙上钉钉子而找不到锤子,您将寻找具有可抓握部分的坚固而重的物体。如果你想运水,你会寻找一个容器。如果您想爬墙,您会寻找可以充当把手的物体或突出物。

我们的视觉系统主要是任务驱动的。我们根据它们可以执行的功能来反思我们的环境和我们看到的物体。我们可以根据对象的功能对对象进行分类。

同样,今天的人工智能缺少这一点。深度学习算法可以在同一对象的图像中找到空间一致性。但是,当他们必须处理种类繁多的对象时会发生什么?

既然我们从功能的角度来看对象,我们马上就会知道上面的对象都是椅子,尽管很奇怪。但是对于已经在传统椅子图像上训练的深度神经网络,它们会混淆大量像素,这些像素最终可能会被归类为其他东西。

“对于现代计算机视觉和人工智能系统来说,在如此大的类内差异中进行推理是极难捕捉和描述的。如果没有一致的视觉模式,为给定任务正确识别工具是一个长尾视觉识别问题,”作者指出。

意图

麻省理工学院和加州大学洛杉矶分校的人工智能研究人员写道:“对意图的感知和理解使人类能够更好地理解和预测其他智能体的行为,并与他人一起参与具有共同目标的合作活动。”

推断意图和目标在我们理解视觉场景中起着非常重要的作用。意图预测使我们能够概括我们对场景的理解,并能够在不需要先前示例的情况下对新情况进行推理。

我们倾向于将有生命的物体拟人化,即使它们不是人类——我们下意识地同情它们以了解它们的目标。这使我们能够推理他们的行动方针。我们甚至不需要丰富的视觉线索来推理意图。有时,一个眼神、一个身体姿势或一个运动轨迹就足以让我们推断出目标和意图。

以下面的视频为例,这是一个古老的心理学实验。你能说出发生了什么吗?实验中的大多数参与者很快就在简单的几何形状之间建立了社会关系,并赋予它们诸如欺凌者、受害者等角色。

这是无法从像素模式中完全提取的东西,需要有关社会关系和意图的补充知识。

公用事业

最后,作者讨论了理性代理人做出最大化其预期效用的决策的趋势。

“给定模型中的每一个可能的动作或状态都可以用一个单一的、统一的值来描述。这个值,通常被称为效用,描述了该动作在给定上下文中的有用性,”人工智能研究人员写道。

例如,在寻找坐的地方时,我们试图找到最舒适的椅子。许多 AI 系统都包含实用功能,例如在游戏中获得更多分数或优化资源使用。但是如果不结合 FPICU 的其他组件,效用函数的使用仍然非常有限。

“这些认知能力已显示出潜力,进而成为认知 AI 的基石,因此应该成为构建这种认知架构的未来努力的基础,”《Dark, Beyond Deep》一书的作者写道。

当然,这说起来容易做起来难。为编纂论文中提到的一些组件付出了很多努力,作者提到了该领域正在进行的一些有希望的工作。但到目前为止,进展一直是渐进式的,社区在哪种方法最有效的问题上存在很大分歧。

“Dark, Beyond Deep”一书的作者认为,结合神经网络和经典智能算法的混合 AI 系统最有可能实现支持 FPICU 的 AI 系统。

“实验表明,当前基于神经网络的模型在学习后无法获得数学推理能力,而配备额外感知模块的基于搜索的经典算法以更少的搜索步骤实现了显着的性能提升。”

云淡天高 2023-08-19 12:27:41

相关推荐

电脑如何添加域

先点击计算机,然后单击右键,选择属性项,更改设置选择更改。计算机名字更改为使用者名字,这样是为了区分域中的计算机,域填写需要加进去的域名,点击确定,弹出对话框,填写域管理员的账号密码。点击计算机,然后单击右键,...
展开详情

雾莲要不要去皮

莲雾不需要去皮。莲雾是可以连皮一起食用的水果,但前提是要将其洗干净。从市场买回来的莲雾可先用流水冲洗一遍,再将其放入有少量食盐的清水中浸泡15分钟左右,再用清水冲洗1-2遍即可食用。雾莲雾莲一般指洋蒲桃,也叫莲...
展开详情

茂县有多少人口

茂县,在2015年末,户籍人口为11.16万;茂县,隶属于四川省阿坝藏族羌族自治州。位于四川省西北部、阿坝藏族羌族自治州东南部的青藏高原东南边缘,地跨岷江和涪江上游高山河谷地带,属高原性季风气候;全县总面积39...
展开详情

板式家具设计需要学习哪些软件

CAD:主要绘制工具,此软件是家具设计师的重点学习软件。3DMAX:产品建模,场景建模主要展示出产品的特质构造。Vray:配合3DMAX,渲染出产品展示产品三维和各种材质的特点。Coreldraw:产品包装图纸...
展开详情

如何带好一支优秀的幼儿教师团队

实行人为管理,充分尊重和信任教师。实行人性化管理,让每一位教师都参与到管理中去。切实关心教师的生活,解决教师的后顾之忧。尊重和信任教师。善于用人,充分发挥团队的力量。注重教师培训,提高业务水平。按计划定期让老师...
展开详情

精选推荐更多>

志存高远的意思是什么形容哪些人

“志存高远”形容有远大的志向、追求远大的理想,或者对事业上有远大抱负的人。
志存高远,汉语成语,拼音是zhì cún gāo yuǎn,意思是追求远大的理想、事业上的抱负。出自三国·诸葛亮《勉侄书》:“夫志当存高远,慕先贤,绝情欲,弃凝滞,使庶几之志,揭然有所存,恻然有所感。”
造句:
1、志存高远,从小事做起,顽强拼搏,共同进步,创造华彩人生!
2、前程似锦,勇攀书山甘洒汗水放飞心中梦想;志存高远,泛游学海竞逐群雄一朝金榜题名。

渔歌子寄托了作者怎样的情怀

《渔歌子》寄托了作者爱自由、爱自然的情怀。
原文:西塞山前白鹭飞,桃花流水鳜鱼肥。青箬笠,绿蓑衣,斜风细雨不须归。
译文:西塞山前白鹭在自由地翱翔,江水中,肥美的鳜鱼欢快地游着,漂浮在水中的桃花是那样的鲜艳而饱满。渔翁头戴青色的箬笠,身披绿色的蓑衣,冒着斜风细雨。
此词在秀丽的水乡风光和理想化的渔人生活中,寄托了作者的理想。词中更吸引读者的不是一蓑风雨,从容自适的渔父,而是江乡二月桃花汛期间春江水涨、烟雨迷蒙的图景。雨中青山,江上渔舟,天空白鹭,两岸红桃,色泽鲜明但又显得柔和,气氛宁静但又充满活力。而这既体现了作者的艺术匠心,也反映了他高远、冲澹、悠然脱俗的意趣。此词吟成后,不仅一时唱和者甚众,而且还流播海外,为东邻日本的汉诗作者开启了填词门径,嵯峨天皇的《渔歌子》五首及其臣僚的奉和之作七首,即以此词为蓝本改制而成。

文章之道必先立本本丰则末茂的作者

“文章之道,必先立本,本丰则末茂”的作者是明末清初魏禧。
这句话释义:写文章的基本思路,必须先立意,定主题,陈述中心思想。根基主干丰富了,叶子才能茂盛。立意健康,文章才能妙笔生花。
魏禧论文主张经世致用,积理、练识,他长于策、论等以广大胸怀而谋天下之事的文体,同时对其它文体的创作也都有所心得,并且写出了煌煌百万字的作品。他的文章多颂扬民族气节人事,表现出浓烈的民族意识。
著有《魏叔子文集》22卷,《诗集》8卷,《日录》3卷,《左传经世》10卷,《兵谋》、《兵法》各1卷,《兵迹》12卷。散文作品有《邱维屏传》和《大铁椎传》等。

色是独体字还是上下

“色”是上下结构,汉语常用字(一级字),读作sè,最早见于金文。其本义表示由物体发射、反射的光通过视觉而产生的印象;引申义有脸上表现出的神气、样子;情景;景象等。
会意字。《说文》:“色,颜气也。从人,从卩。”何琳仪《战国古文字典》:“色,春秋金文作(墨敢镈),左从爪,右从卩(与上爪下卩之印字不同),会面部颜色之意。战国文字承袭春秋金文,或卩旁加短横为与印字区别。秦汉金文爪旁讹作形。”色字习见于战国楚竹简,“卩”形多有省变,或加“页”旁以显示颜面之义,《说文》色字古文就从这一形体讹变而来。色字最初形体从爪在卩左侧,战国楚简色字已有讹为从“刀”形者,但秦简中仍有从爪者,不过已在右上,失去会意意味。从秦简开始,色字上部已大多讹为从刀形,汉隶皆如此形体,为楷书所继承。色字形体虽然最早见于春秋金文,但《诗经》常见,《大雅·烝民》:“令仪令色,小心翼翼。”《大雅·皇矣》:“不大声以色”。皆为西周时代文献,可见色字出现于西周时代。
常见热点问答
热点搜索
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200
作文大全
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200