当前可解释的AI方法有什么问题

飘零的心

精选回答

2022年1月14日整理发布：经典的符号 AI 系统基于开发人员创建的手动规则。无论它们变得多么庞大和复杂，他们的开发人员都可以逐行跟踪他们的行为，并调查错误，直至错误发生的机器指令。相比之下，机器学习算法通过比较训练示例和创建统计模型来发展它们的行为。因此，即使对他们的开发人员来说，他们的决策逻辑也常常是模棱两可的。

机器学习的可解释性问题既是众所周知的，也是经过充分研究的。在过去的几年里，它引起了著名学术机构和国防部研究机构 DARPA的兴趣。

该领域的努力一般分为两类：全局解释和局部解释。全局解释技术专注于寻找对机器学习模型如何工作的一般解释，例如它认为其输入数据的哪些特征与其决策更相关。局部解释技术专注于确定特定输入的哪些部分与 AI 模型做出的决策相关。例如，他们可能会生成对特定决策做出贡献的图像部分的显着性图。

埃尔顿写道，所有这些技术“都有缺陷，并且在如何正确解释解释方面存在混淆”。

Elton 还挑战了另一个关于深度学习的流行信念。许多科学家认为，深度神经网络从其潜在问题域中提取高级特征和规则。这意味着，例如，当您在许多标记图像上训练卷积神经网络时，它将调整其参数以检测它们之间共享的各种特征。

这是真的，这取决于您所说的“功能”。有大量研究表明，神经网络实际上确实可以学习图像和其他数据类型中的重复模式。同时，有大量证据表明深度学习算法无法学习其训练示例的一般特征，这就是为什么它们严格限于其狭窄领域的原因。

“实际上，深度神经网络是‘愚蠢的’——它们似乎在内部捕获的任何规律性都完全是由于提供给它们的数据，而不是一个自我导向的‘规律性提取’过程，”埃尔顿写道。

Elton引用了发表在同行评审科学杂志Neuron上的一篇论文，认为事实上，深度神经网络“通过数据点的插值而不是外推来发挥作用”。

一些研究的重点是开发“可解释的”人工智能模型来取代当前的黑匣子。这些模型使他们的推理逻辑对开发人员可见和透明。在许多情况下，尤其是在深度学习中，将现有模型替换为可解释模型会导致准确性权衡。这将是一个弄巧成拙的目标，因为我们选择更复杂的模型，因为它们首先提供了更高的准确性。

“在处理复杂的现实世界数据(如图像或人类语言)时，尝试将深度神经网络压缩成具有同等精度的更简单的可解释模型通常会失败，”Elton 指出。

你的大脑是一个黑匣子埃尔顿的主要论点之一是采用不同的观点来理解人工智能决策。大多数努力都集中在打破“人工智能黑匣子”，并在非常低的技术层面上弄清楚它是如何工作的。但当谈到人工智能研究的最终目的地——人脑时，我们从未有过这样的保留。

“人脑似乎也是一个过度拟合的‘黑匣子’它执行插值，这意味着我们对大脑功能的理解也需要改变，”他写道。“如果进化选择了一个无法解释的模型(大脑)，那么我们预计高级人工智能也属于这种类型。”

这意味着在理解人类决策时，我们很少研究神经元的激活。神经科学有很多研究可以帮助我们更好地理解大脑的运作，但几千年来，我们一直依赖其他机制来解释人类行为。

“有趣的是，虽然人脑是一个‘黑匣子’但我们能够相互信任。这种信任的一部分来自于我们用对我们有意义的术语‘解释’我们的决策的能力，”埃尔顿写道。“至关重要的是，要产生信任，我们必须相信一个人不会故意欺骗，并且他们的口头解释实际上映射到他们大脑中用于做出决定的过程。”

有一天，科学可能使我们能够在神经元激活水平上解释人类的决定。但就目前而言，我们大多数人依赖于对我们的决定和我们必须建立彼此信任的机制的可理解的口头解释。

然而，深度学习的解释侧重于研究激活和参数权重，而不是高级的、可理解的解释。“当我们试图准确解释深度神经网络如何插值的细节时，我们会进一步远离可能被认为与用户相关的内容，”埃尔顿写道。

可自我解释的人工智能

基于人类之间存在的信任和解释模型，埃尔顿呼吁“自我解释人工智能”，它可以像人类一样解释自己的决定。

一个可解释的 AI 会产生两条信息：它的决定和对该决定的解释。

这是之前已经提出和探索过的一个想法。然而，埃尔顿提出的是自我解释的人工智能，它仍然保持其复杂性(例如，具有多层的深度神经网络)，并且不会为了可解释性而牺牲其准确性。

在论文中，Elton 提出了如何从神经网络中提取相关的因果信息。虽然细节有点技术性，但该技术的基本作用是从神经网络的层中提取有意义的信息并呈现信息，同时避免虚假的相关性。他的方法建立在其他研究人员开发的当前自我解释人工智能系统的基础上，并验证其神经网络中的解释和预测是否对应。

在他的论文中，Elton 还讨论了指定 AI 算法限制的必要性。神经网络倾向于为它们接收到的任何输入提供输出值。当结果“超出模型的适用范围”时，可自我解释的 AI 模型应该“发出警报”，Elton 说。“适用领域分析可以被视为一种简单的人工智能自我意识形式，一些人认为这是高级人工智能中人工智能安全的重要组成部分。”

可自我解释的 AI 模型应为其输出和解释提供置信度。

适用性和领域分析对于“对于鲁棒性和信任很重要的 AI 系统来说尤其重要，因此如果系统要求他们在适用领域之外工作，系统可以提醒他们的用户，”Elton 总结道。一个明显的例子是医疗保健，其中的错误可能对健康造成无法弥补的损害。但是还有很多其他领域，例如银行、贷款、招聘和刑事司法，我们需要了解人工智能系统的限制和边界。

其中大部分仍然是假设性的，Elton 在实现细节方面提供的很少，但随着可解释的 AI 领域的发展，这是一个很好的方向。

黎明前的暖怀 2023-08-15 16:27:40

精选推荐更多>

辛弃疾名字的由来

青春依旧

辛弃疾名字的由来：辛弃疾的祖父辛赞希望他成为大将之才，很崇拜西汉的名将霍去病，所以就给他取名叫“弃疾”。辛弃疾从小就习武练剑，饱读诗书，也一直把霍去病当成了自己的偶像。

人物简介：

辛弃疾（1140年5月28日－1207年10月3日），原字坦夫，后改字幼安，中年后别号稼轩，山东东路济南府历城县（今山东省济南市历城区）人。南宋官员、将领、文学家，豪放派词人，有“词中之龙”之称。与苏轼合称“苏辛”，与李清照并称“济南二安”。

出生时山东已为金人所占，早年与党怀英齐名北方，号称“辛党”。青年时参与耿京起义，擒杀叛徒张安国，回归南宋，献《美芹十论》《九议》等，条陈战守之策。先后在江西、湖南、福建等地为守臣，平定荆南茶商赖文政起事，又力排众议，创制飞虎军，以稳定湖湘地区。由于他与当政的主和派政见不合，故而屡遭劾奏，数次起落，最终退隐山居。开禧北伐前后，宰臣韩侂胄接连起用辛弃疾知绍兴、镇江二府，并征他入朝任枢密都承旨等官，均遭辞免。开禧三年（1207年），辛弃疾抱憾病逝，享年六十八岁。宋恭帝时获赠少师，谥号“忠敏”。

辛弃疾一生以恢复为志，以功业自许，却命运多舛，壮志难酬。但他始终没有动摇恢复中原的信念，而是把满腔激情和对国家兴亡、民族命运的关切、忧虑，全部寄寓于词作之中。其词艺术风格多样，以豪放为主，风格沉雄豪迈又不乏细腻柔媚之处，题材广阔又善化用典故入词，抒写力图恢复国家统一的爱国热情，倾诉壮志难酬的悲愤，对当时执政者的屈辱求和颇多谴责，也有不少吟咏祖国河山的作品。现存词六百多首，有《稼轩长短句》等传世。

主要影响：

一、文学：

1、词：

辛词现存六百多首，是两宋存词最多的作家。其词多以国家、民族的现实问题为题材，抒发慷慨激昂的爱国之情。辛词以其内容上的爱国思想，艺术上有创新精神，在文学史上产生了巨大影响。与辛弃疾以词唱和的陈亮、刘过等，或稍后的刘克庄、刘辰翁等，都与他的创作倾向相近，形成了南宋中叶以后声势浩大的爱国词派。后世每当国家、民族危急之时，不少作家从辛词中汲取精神上的鼓舞力量。

2、诗：

辛弃疾的诗，据辛启泰所辑《稼轩集抄存》收诗111首。邓广铭辑校《辛稼轩诗文抄存》清除误收，增补遗漏，得诗124首。其后，孔凡礼的《辛稼轩诗词补辑》又新补诗19首。现存辛诗，共133首。辛诗从各个不同的侧面，反映了作者的生活和思想情感，可与其词相证，其中《送别湖南部曲》，自写政治遭遇，可与《鹧鸪天·壮岁旌旗拥万夫》对读；“有时思到难思处，拍碎栏干人不知”（《鹤鸣亭绝句》），感叹英雄失意，也与《水龙吟·登建康赏心亭》合拍，而“竹杖芒鞋看瀑回，暮年筋力倦崔嵬”《同杜叔高祝彦集观天保庵瀑布主人留饮两日且约牡丹之饮》），与《鹧鸪天·鹅湖归病起作》合拍。正是置闲期间所反复咏吟的歌词题材。“剩喜风情筋力在，尚能诗似鲍参军”（《和任师见寄之韵》），辛弃疾以鲍照自许。他的诗风格俊逸，在当时“江西”“江湖”两派之外，自有掉臂游行之致。而且，他的某些抗战诗，悲壮雄迈，也未必在其抗战词之下，但是，辛弃疾毕竟是以词之余作诗，其诗作成就，自然无法与词相比拟。

3、文：

除去诗词方面的成就之外，辛弃疾的文笔势磅礴，充满豪情，颇为值得称道。辛弃疾的文，据邓广铭所辑，计17篇其中除几篇启札和祭文外，多为奏硫。这类奏疏，在一定程度上揭示了当时所存在的尖锐的民族矛盾和阶级矛盾，较为深刻地反映了社会现实；并系统地陈述了辛弃疾对于抗金、恢复事业的见解及谋略，充分体现了他经纶天下的“英雄之オ”和“刚大之气”。辛弃疾曾明确宣称：“论天下之事者主乎气。”（《九议》其二）辛弃疾其文，犹如其人，世充满着虎虎生气。所谓“笔势浩落，智略辐湊，有权书衡论之风”（《后村先生大全集》卷九十八），正体现了辛文的特色。后人视他为南宋时期政论文的大手笔，只是为词名所掩，不为人熟知。

二、书法：

辛弃疾有《去国帖》，今藏故宫博物院。纸本，行书十行，为酬应类信札。末署“宣教郎新除秘阁修撰权江南西路提点刑狱公事辛弃疾札子”。中锋用笔，点画规矩，书写流畅自如，于圆润爽丽中不失挺拔方正之气象。

《去国帖》曾经过元人赵孟頫，明人黄琳、项元沛及清人永瑆等鉴藏，《书画鉴影》著录。

三、军事：

1、军事活动：

辛弃疾不仅是词中高手，同时还是一个不可多得的将帅之才，为将，可冲锋陷阵，有万军之中勇擒张安国之壮举；为帅，可指挥若定，有一月平定茶商军之功绩。

辛弃疾曾提出大规模跨海登陆作战，这种登陆作战是与陆地进攻相配合的。他的这一构想，富有军事创意，他自己说这与当年楚汉战争时韩信绕过中原、直取齐地，有异曲同工之效。

2、军事思想：

辛弃疾的军事理论主要体现在《美芹十论》中。《美芹十论》又名《御戎十论》，是辛弃疾的一篇军事政论文。该书从第一论以至于第十论，无一不是精辟之论，有着很高的研究价值。同时，这也是一部很好的军事论著，陈述抗金救国、收复失地、统一中国的大计。在辛弃疾向宋孝宗进献《美芹十论》后，后人将“美芹”作为忧国忧民、悲国家之颠覆的代名。《美芹十论》分为十个篇章，分别为《审势》《察情》《观衅》《自治》《守淮》《致勇》《防微》《久任》《详战》，详细构建了从精神到物质再到军队管理的治国策略，陈述任人用兵之道。最后一步步地向孝宗展现了南宋进攻金国的战略构想，系统地表现了辛弃疾高瞻远瞩的战略方针与远见卓识，足以体现其军事战略水平与军事谋略。

当前可解释的AI方法有什么问题

相关推荐

精选推荐更多>

精选问答