如何教人工智能推理视频

小成熟
精选回答

你可能认为这些问题非常愚蠢。但有趣的是,当今最先进的人工智能系统将难以回答这些问题。诸如上面提出的问题需要能够推理对象及其行为和关系随着时间的推移。这是人类智能的一个组成部分,但几十年来,人工智能科学家仍然难以捉摸。

IBM、麻省理工学院、哈佛和 DeepMind 的研究人员在 ICLR 上发表的一项新研究强调了当前人工智能系统在处理视频因果关系方面的缺点。在他们的论文中,研究人员介绍了 CLEVRER,一个新的数据集和基准,用于评估 AI 算法在推理视频序列方面的能力,以及神经符号动态推理 (NS-DR),一个混合 AI 系统,标志着因果关系的重大改进在受控环境中进行推理。

为什么人工智能不能对视频进行推理

对于我们人类来说,检测和推理场景中的物体几乎是齐头并进的。但是对于当前的人工智能技术,它们是两个根本不同的学科。

在过去的几年里,深度学习给人工智能领域带来了巨大的进步。深度神经网络是深度学习算法的主要组成部分,可以在大量数据中找到复杂的模式。这使他们能够执行以前计?算机软件禁止或非常困难的任务,例如检测图像中的对象或识别语音。

单靠模式识别可以实现的效果令人惊讶。神经网络在我们每天使用的许多应用程序中都发挥着重要作用,从在 Google 图片中查找对象和场景到检测和阻止社交媒体上的不当内容。神经网络在生成关于视频和图像的描述方面也取得了一些进展。

但是,您可以将模式识别推到什么程度也有非常明显的限制。虽然是人类视觉的重要组成部分,但模式识别只是其众多组成部分之一。当我们的大脑解析本文开头的棒球视频时,我们对运动、物体持久性、实体性和运动的了解开始发挥作用。基于这些知识,我们可以预测接下来会发生什么(球会去哪里)和反事实情况(如果球棒没有击中球会怎样)。这就是为什么即使是从未看过棒球比赛的人也会对这段视频有很多话要说。

然而,深度学习算法会检测场景中的对象,因为它们在统计上与它在训练期间看到的数千个其他对象相似。它对材料、重力、运动和冲击一无所知,其中一些概念使我们能够对场景进行推理。

视觉推理是人工智能研究的一个活跃领域。研究人员开发了几个数据集来评估人工智能系统对视频片段进行推理的能力。仅靠深度学习能否解决问题是一个悬而未决的问题。

一些人工智能科学家认为,如果有足够的数据和计算能力,深度学习模型最终将能够克服其中的一些挑战。但到目前为止,在需要常识和推理的领域取得的进展很小而且是渐进的。

CLEVRER 数据集

在 ICLR 上引入的新数据集被命名为“用于视频表示和推理的碰撞事件”或 CLEVRER。它的灵感来自CLEVR,在2017年CLEVR在斯坦福大学开发出一种视觉答疑数据集是一组的问题,固体物体的存在静止图像。AI 代理必须能够解析场景并回答有关对象数量、属性和空间关系的多项选择题。

CLEVRER 由固体物体相互移动和碰撞的视频组成。将测试 AI 代理回答有关场景的描述性、解释性、预测性和反事实问题的能力。例如,在下面的场景中,人工智能将被问到如下问题:

描述:最后一个物体与圆柱体碰撞的材料是什么?

解说:橡胶缸与红色橡胶球的碰撞是否会导致橡胶与金属缸的碰撞?

预测:金属球体和灰色圆柱体会碰撞吗?

反事实:如果我们从场景中移除青色圆柱体,红色橡胶球和灰色圆柱体会碰撞吗?

就像本文开头就视频提出的问题一样,这些问题对您来说可能听起来微不足道。但它们是使用当前混合的 AI 完成的复杂任务,因为它们需要对场景的因果理解。

正如论文作者总结的那样,解决 CLEVRER 问题需要三个关键要素:“识别视频中的对象和事件;建模对象和事件之间的动态和因果关系;以及对问题背后的符号逻辑的理解。”

“CLEVRER 是第一个视觉推理数据集,专为视频中的随意推理而设计。以前的视觉推理数据集主要关注事实问题,例如什么、何时、何地和是/是。但最基本的推理能力是理解'为什么'”麻省理工学院-IBM沃森人工智能实验室的研究科学家、CLEVRER论文的合著者Chuang Gan告诉TechTalks。

受控环境

根据论文作者的说法,CLEVRER 是“一个完全受控的合成环境”。对象的种类和材料很少,所有问题都设置在一个平面上,并且问题中使用的词汇有限。这一点细节非常重要,因为当前的人工智能系统在处理可能发生的事件组合是无限的开放环境方面非常糟糕。

受控环境使 CLEVRER 的开发人员能够提供带有丰富注释的示例来评估 AI 模型的性能。它允许人工智能研究人员将他们的模型开发集中在复杂的推理任务上,同时消除其他障碍,如图像识别和语言理解。

但这也意味着,如果一个 AI 模型在 CLEVRER 上的得分很高,这并不一定意味着它能够处理现实世界中任何事情都可能发生的混乱局面。但是,该模型可能适用于其他有限的环境。

“在视频中使用时间推理和因果推理可以在机器人和自动驾驶应用中发挥重要作用,”甘说。“例如,如果发生交通事故,可以使用 CLEVRER 模型来分析监控视频并找出导致事故的原因。在机器人应用中,如果机器人可以遵循自然语言命令并采取相应的行动,这也很有用。”

神经符号动态推理 AI 模型

该论文的作者在基本深度学习模型上测试了 CLEVRER,例如卷积神经网络 (CNN)结合多层感知器 (MLP) 和长短期记忆网络 (LSTM)。他们还在高级深度学习模型 TVQA、IEP、TbDNet 和 MAC 的变体上对它们进行了测试,每个模型都经过修改以更好地适应视觉推理。

基本的深度学习在描述性挑战中表现一般,而在其他方面表现不佳。一些高级模型在描述性挑战中表现不错。但在其他挑战中,准确率大幅下降。基于纯神经网络的 AI 模型缺乏对对象及其行为之间的因果关系和时间关系的理解。他们还缺乏一个世界模型,可以让他们预见接下来会发生什么,并弄清楚替代的反事实场景是如何运作的。

作为解决方案,研究人员引入了神经符号动态推理模型,这是神经网络和符号人工智能的结合。随着深度学习的兴起,符号人工智能,也称为基于规则的人工智能,已经被淘汰了。与神经网络不同,符号 AI 系统在处理视觉数据和书面文本等非结构化信息方面非常糟糕。但另一方面,基于规则的系统非常擅长符号推理和知识表示,这一领域一直是机器学习算法的痛点。

NS-DR 充分利用了神经网络和符号推理系统:

卷积神经网络从图像中提取对象。

LSTM 处理问题并将它们转换为程序命令。

传播网络从 CNN 提取的对象数据中学习物理动力学,并预测未来的对象行为。

最后,一个 Python 程序将从神经网络获得的所有结构化信息汇集在一起?以编译问题的答案。

NS-DR 在解释性、预测性和反事实挑战方面的性能明显高于纯深度学习模型。然而,反事实基准仍然保持在 42% 的适度准确率,这说明了开发能够像我们一样理解世界的人工智能所面临的挑战。但与性能最佳的基线深度学习模型 25% 的准确率相比,它仍然是一个显着的进步。

NS-DR 的另一个显着优势是它在训练阶段需要的数据要少得多。

结果表明,将神经网络和符号程序结合在同一个 AI 模型中,可以结合它们的优点并克服它们的缺点。“符号表示为视觉、语言、动态和因果关系提供了强大的共同基础,”作者指出,并补充说符号程序使模型能够“明确捕捉视频因果结构和问题逻辑背后的组合性”。

NS-DR 的好处确实伴随着一些注意事项。用于训练模型的数据需要额外的注释,这在实际应用中可能过于耗能和昂贵。

左顾右看 2023-08-19 12:27:41

相关推荐

艺术生什么时候集训好 有必要去集训吗

艺术生集训指的是艺术类学生在完成学业水平测试之后,由学校或自己向学校申请,暂时停掉学校的文化课,到专业的艺术培训学校进行封闭式训练,直到校考结束。美术生集训时间美术生集训,通常从高二下学期开始,5月份开始报名,...
展开详情

艺术生集训注意事项有哪些 需要注意什么

艺术生在集训的时候也要同步文化课学习,夯实文化基础。考生在专业课集训期间,文化课千万不要丢,专业课和文化课的学习一定要兼顾。艺术生集训的注意事项一定要选择一个靠谱的培训学校。因为一个好的培训学校,懂得怎么以最快...
展开详情

提高生物成绩的方法是什么 窍门有哪些

即通过分析教材,找出要点,将知识简化成有规律的几个字来帮助生物知识记忆。例如DNA的分子结构可简化为“五四三二一”,即五种基本元素、四种基本单位、每种基本单位有三种基本物质、很多基本单位形成两条脱氧核酸链、成为...
展开详情

艺考生集训注意事项 有什么要了解知道的

艺术生集训不要忽略了文化课,作为艺术生必须要做到文化课和专业课双赢,才能被心中理想大学录取,在这期间需要付出很大的努力。文化课也是非常重要的,不要忽略文化课,要一直学习专业课。艺考生集训注意什么学会针对性强化技...
展开详情

投档会参考学考成绩吗 学考成绩有什么用

将成绩符合的学生的档案投给招生院校。这就是投档,投档不参考于学生的其他条件,只参考他的总成绩和志愿。而根据学校的调档比例省教育考试院确定他的投档比例,只要学生的档案被投档,决定他是否被录取的因素就会包含他的学考...
展开详情

精选推荐更多>

霍尔系数计算公式

霍尔系数计算公式:η=G/nF。霍尔效应(Halleffect)是指当固体导体放置在一个磁场内,且有电流通过时,导体内的电荷载子受到洛伦兹力而偏向一边,继而产生电压(霍尔电压)的现象。电压所引致的电场力会平衡洛伦兹力。
科学上把单位时间里通过导体任一横截面的电量叫做电流强度,简称电流,电流符号为I,单位是安培(A),简称“安”(安德烈·玛丽·安培,1775年—1836年,法国物理学家、化学家,在电磁作用方面的研究成就卓著,对数学和物理也有贡献。电流的国际单位安培即以其姓氏命名)。

立冬喝茶的诗句

立冬喝茶的诗句:
1、《寒夜》宋代杜耒:
寒夜客来茶当酒,竹炉汤沸火初红。
寻常一样窗前月,才有梅花便不同。
2、《暮雪》清代大须:
日夕北风紧,寒林噤暮鸦。
是谁谈佛法,真个坠天花。
呵笔难临帖,敲床且煮茶。
禅关堪早闭,应少客停车。
3、《和翁灵舒冬日书事》宋代徐照:
石缝敲冰水,凌寒自煮茶。
梅迟思闰月,梅远误春花。
贫喜田新长,吟令鬓已华。
城中寻小屋,岁晚欲移家。
4、《晚起》唐代白居易
烂熳朝眠后,频伸晚起时。暖炉生火早,寒镜裹头迟。
融雪煎香茗,调酥煮乳糜。慵馋还自哂,快活亦谁知。
酒性温无毒,琴声淡不悲。荣公三乐外,仍弄小男儿。
5、《春日山中对雪有作》唐代杜荀鹤:
竹树无声或有声,霏霏漠漠散还凝。
岭梅谢后重妆蕊,岩水铺来却结冰。
牢系鹿儿防猎客,满添茶鼎候吟僧。
好将膏雨同功力,松径莓苔又一层。

希腊神话中,谁是最高神?

“宙斯”是古希腊神话中的众神之王。宙斯是古希腊神话中的第三代神王,统治世间万物至高无上的天神,奥林匹斯十二主神之首。是希腊神话中最伟大的神。罗马神话中对应宙斯的神祇是朱庇特(Jupiter或Jove)。
宙斯被称为“众神之王”或“奥林匹斯之王”,同时也是天空与雷电之神。当他心情好的时候,天上就阳光明媚、晴空万里。当他愤怒时,天空就会乌云密布、电闪雷鸣。
因为古希腊人及罗马人崇拜宙斯,因此在神话里将宙斯说成是自己的祖先,奥林匹斯的许多神祇和许多希腊英雄都是他和不同女子生下的子女。他以雷电为武器,维持着天地间的秩序,公牛和鹰是他的标志。他的两个兄弟波塞冬和哈迪斯分别掌管海洋和冥界。宙斯守护的星座是射手座。

辛弃疾名字的由来

辛弃疾名字的由来:辛弃疾的祖父辛赞希望他成为大将之才,很崇拜西汉的名将霍去病,所以就给他取名叫“弃疾”。辛弃疾从小就习武练剑,饱读诗书,也一直把霍去病当成了自己的偶像。

人物简介:

辛弃疾(1140年5月28日-1207年10月3日),原字坦夫,后改字幼安,中年后别号稼轩,山东东路济南府历城县(今山东省济南市历城区)人。南宋官员、将领、文学家,豪放派词人,有“词中之龙”之称。与苏轼合称“苏辛”,与李清照并称“济南二安”。

出生时山东已为金人所占,早年与党怀英齐名北方,号称“辛党”。青年时参与耿京起义,擒杀叛徒张安国,回归南宋,献《美芹十论》《九议》等,条陈战守之策。先后在江西、湖南、福建等地为守臣,平定荆南茶商赖文政起事,又力排众议,创制飞虎军,以稳定湖湘地区。由于他与当政的主和派政见不合,故而屡遭劾奏,数次起落,最终退隐山居。开禧北伐前后,宰臣韩侂胄接连起用辛弃疾知绍兴、镇江二府,并征他入朝任枢密都承旨等官,均遭辞免。开禧三年(1207年),辛弃疾抱憾病逝,享年六十八岁。宋恭帝时获赠少师,谥号“忠敏”。

辛弃疾一生以恢复为志,以功业自许,却命运多舛,壮志难酬。但他始终没有动摇恢复中原的信念,而是把满腔激情和对国家兴亡、民族命运的关切、忧虑,全部寄寓于词作之中。其词艺术风格多样,以豪放为主,风格沉雄豪迈又不乏细腻柔媚之处,题材广阔又善化用典故入词,抒写力图恢复国家统一的爱国热情,倾诉壮志难酬的悲愤,对当时执政者的屈辱求和颇多谴责,也有不少吟咏祖国河山的作品。现存词六百多首,有《稼轩长短句》等传世。

主要影响:

一、文学:

1、词:

辛词现存六百多首,是两宋存词最多的作家。其词多以国家、民族的现实问题为题材,抒发慷慨激昂的爱国之情。辛词以其内容上的爱国思想,艺术上有创新精神,在文学史上产生了巨大影响。与辛弃疾以词唱和的陈亮、刘过等,或稍后的刘克庄、刘辰翁等,都与他的创作倾向相近,形成了南宋中叶以后声势浩大的爱国词派。后世每当国家、民族危急之时,不少作家从辛词中汲取精神上的鼓舞力量。

2、诗:

辛弃疾的诗,据辛启泰所辑《稼轩集抄存》收诗111首。邓广铭辑校《辛稼轩诗文抄存》清除误收,增补遗漏,得诗124首。其后,孔凡礼的《辛稼轩诗词补辑》又新补诗19首。现存辛诗,共133首。辛诗从各个不同的侧面,反映了作者的生活和思想情感,可与其词相证,其中《送别湖南部曲》,自写政治遭遇,可与《鹧鸪天·壮岁旌旗拥万夫》对读;“有时思到难思处,拍碎栏干人不知”(《鹤鸣亭绝句》),感叹英雄失意,也与《水龙吟·登建康赏心亭》合拍,而“竹杖芒鞋看瀑回,暮年筋力倦崔嵬”《同杜叔高祝彦集观天保庵瀑布主人留饮两日且约牡丹之饮》),与《鹧鸪天·鹅湖归病起作》合拍。正是置闲期间所反复咏吟的歌词题材。“剩喜风情筋力在,尚能诗似鲍参军”(《和任师见寄之韵》),辛弃疾以鲍照自许。他的诗风格俊逸,在当时“江西”“江湖”两派之外,自有掉臂游行之致。而且,他的某些抗战诗,悲壮雄迈,也未必在其抗战词之下,但是,辛弃疾毕竟是以词之余作诗,其诗作成就,自然无法与词相比拟。

3、文:

除去诗词方面的成就之外,辛弃疾的文笔势磅礴,充满豪情,颇为值得称道。辛弃疾的文,据邓广铭所辑,计17篇其中除几篇启札和祭文外,多为奏硫。这类奏疏,在一定程度上揭示了当时所存在的尖锐的民族矛盾和阶级矛盾,较为深刻地反映了社会现实;并系统地陈述了辛弃疾对于抗金、恢复事业的见解及谋略,充分体现了他经纶天下的“英雄之オ”和“刚大之气”。辛弃疾曾明确宣称:“论天下之事者主乎气。”(《九议》其二)辛弃疾其文,犹如其人,世充满着虎虎生气。所谓“笔势浩落,智略辐湊,有权书衡论之风”(《后村先生大全集》卷九十八),正体现了辛文的特色。后人视他为南宋时期政论文的大手笔,只是为词名所掩,不为人熟知。

二、书法:

辛弃疾有《去国帖》,今藏故宫博物院。纸本,行书十行,为酬应类信札。末署“宣教郎新除秘阁修撰权江南西路提点刑狱公事辛弃疾札子”。中锋用笔,点画规矩,书写流畅自如,于圆润爽丽中不失挺拔方正之气象。

《去国帖》曾经过元人赵孟頫,明人黄琳、项元沛及清人永瑆等鉴藏,《书画鉴影》著录。

三、军事:

1、军事活动:

辛弃疾不仅是词中高手,同时还是一个不可多得的将帅之才,为将,可冲锋陷阵,有万军之中勇擒张安国之壮举;为帅,可指挥若定,有一月平定茶商军之功绩。

辛弃疾曾提出大规模跨海登陆作战,这种登陆作战是与陆地进攻相配合的。他的这一构想,富有军事创意,他自己说这与当年楚汉战争时韩信绕过中原、直取齐地,有异曲同工之效。

2、军事思想:

辛弃疾的军事理论主要体现在《美芹十论》中。《美芹十论》又名《御戎十论》,是辛弃疾的一篇军事政论文。该书从第一论以至于第十论,无一不是精辟之论,有着很高的研究价值。同时,这也是一部很好的军事论著,陈述抗金救国、收复失地、统一中国的大计。在辛弃疾向宋孝宗进献《美芹十论》后,后人将“美芹”作为忧国忧民、悲国家之颠覆的代名。《美芹十论》分为十个篇章,分别为《审势》《察情》《观衅》《自治》《守淮》《致勇》《防微》《久任》《详战》,详细构建了从精神到物质再到军队管理的治国策略,陈述任人用兵之道。最后一步步地向孝宗展现了南宋进攻金国的战略构想,系统地表现了辛弃疾高瞻远瞩的战略方针与远见卓识,足以体现其军事战略水平与军事谋略。

常见热点问答
热点搜索
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200
作文大全
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200