早期的神经网络剪枝效果如何

朝阳的向日葵
精选回答

2022年1月24日整理发布:在他们的工作中,人工智能研究人员将早期修剪方法的性能与两个基线进行了比较:训练后的幅度修剪和彩票倒带 (LTR)。幅度剪枝是在神经网络完全训练后去除过多参数的标准方法。彩票倒带使用 Frankle 和 Carbin 在早期工作中开发的技术来重新训练最优子网络。如前所述,这些方法证明次优网络存在,但它们仅在训练完整网络后才会这样做。这些预训练修剪方法应该在训练神经网络之前在初始化阶段找到最小网络。

研究人员还将早期修剪方法与两种简单技术进行了比较。其中之一从神经网络中随机删除权重。检查随机性能对于验证方法是否提供显着结果非常重要。人工智能研究人员写道:“随机剪枝是一种幼稚的早期剪枝方法,其性能任何新提议都应该超越。”

另一种方法是根据参数的绝对权重删除参数。“幅度剪枝是一种标准的推理剪枝方法,也是早期剪枝的另一个简单比较点,”作者写道。

这些实验是在 VGG-16 和 ResNet 的三个变体上进行的,这两个变体是两个流行的卷积神经网络(CNN)。

在 AI 研究人员评估的早期修剪技术中,没有一种早期方法脱颖而出,其性能因选择的神经网络结构和执行的修剪百分比而异。但他们的研究结果表明,在大多数情况下,这些最先进的方法比粗略的随机修剪要好得多。

然而,没有一种方法与基准训练后修剪的准确性相匹配。

“总体而言,这些方法取得了一些进展,总体上优于随机修剪。然而,在整体准确度和可能匹配完全准确度的稀疏度方面,这一进展仍远未达到训练后的幅度,”作者写道。

研究早期修剪方法

为了测试修剪方法表现不佳的原因,人工智能研究人员进行了几项测试。首先,他们测试了“随机洗牌”。对于每种方法,他们随机切换从神经网络的每一层移除的参数,看看它是否对性能有影响。如果像剪枝方法所建议的那样,它们根据参数的相关性和影响来删除参数,那么随机切换应该会严重降低性能。

令人惊讶的是,研究人员发现随机洗牌并没有对结果产生严重影响。相反,真正决定结果的是他们从每一层中移除的权重数量。

“所有方法在随机洗牌时都保持准确性或改进。换句话说,这些技术提取的有用信息不是要删除哪些单个权重,而是要修剪网络的分层比例,”作者写道,并补充说,虽然分层修剪比例很重要,但它们并不重要足够的。证明是,训练后剪枝方法通过选择特定的权重并随机改变它们来达到完全准确度,这会导致剪枝后网络的准确度突然下降。

接下来,研究人员检查了重新初始化网络是否会改变修剪方法的性能。在训练之前,神经网络中的所有参数都使用来自所选分布的随机值进行初始化。以前的工作,包括 Frankle 和 Carbin 的工作,以及本文前面提到的生命游戏研究,表明这些初始值通常对训练的最终结果有相当大的影响。事实上,“彩票”一词是基于这样一个事实创造的,即有一些幸运的初始值可以使小型神经网络在训练中达到高精度。

因此,参数的选择应该基于它们的值,如果它们的初始值发生变化,将会严重影响修剪后网络的性能。同样,测试没有显示出显着的变化。

“所有早期剪枝技术都对重新初始化具有鲁棒性:无论网络是使用原始初始化还是新采样的初始化进行训练,准确性都是相同的。与

随机改组,这种对初始化的不敏感可能反映了这些方法用于修剪的信息的限制,从而限制了性能,”人工智能研究人员写道。

最后,他们尝试反转修剪后的权重。这意味着对于每种方法,他们将权重标记为可移动,而不是删除应该保留的权重。这个最终测试将检查用于选择修剪权重的评分方法的效率。其中两种方法,SNIP 和 SynFlow,对反演表现出极高的敏感性,其准确性下降,这是一件好事。但 GraSP 的性能在反转剪枝后的权重后并没有下降,在某些情况下,它甚至表现得更好。

从这些测试中得出的关键结论是,当前的早期修剪方法无法检测到在深度学习模型中定义最佳子网的特定连接。

让深度学习研究更容易获得

看看该领域的研究如何展开将会很有趣。我也很想知道这些和未来的方法将如何在其他神经网络架构(如 Transformer)上执行,这些架构的训练计算成本远远高于 CNN。另外值得注意的是,这些方法已经针对监督学习问题进行了开发和测试。希望我们会看到类似技术的类似研究,用于更昂贵的 AI 分支,例如深度强化学习。

该领域的进展可能会对人工智能研究和应用的未来产生巨大影响。随着训练深度神经网络的成本不断增长,研究领域的某些部分越来越集中在拥有大量财务和计算资源的富裕科技公司中。

在训练神经网络之前修剪神经网络的有效方法可以为更广泛的人工智能研究人员和实验室创造新的机会,这些研究人员和实验室无法访问非常大的计算资源。

点灯的心灵 2023-08-17 14:27:40

相关推荐

电脑如何添加域

先点击计算机,然后单击右键,选择属性项,更改设置选择更改。计算机名字更改为使用者名字,这样是为了区分域中的计算机,域填写需要加进去的域名,点击确定,弹出对话框,填写域管理员的账号密码。点击计算机,然后单击右键,...
展开详情

XP系统怎么进安全模式

安全模式是Windows系统中的一种特定模式,XP系统进入安全模式的方法:1、如果感觉系统出现问题,或者有一些无法卸载的软件,需要到安全模式中解决,那请先重新启动;2、?在系统未启动之前,一直不停地按F8键,直...
展开详情

如何带好一支优秀的幼儿教师团队

实行人为管理,充分尊重和信任教师。实行人性化管理,让每一位教师都参与到管理中去。切实关心教师的生活,解决教师的后顾之忧。尊重和信任教师。善于用人,充分发挥团队的力量。注重教师培训,提高业务水平。按计划定期让老师...
展开详情

板式家具设计需要学习哪些软件

CAD:主要绘制工具,此软件是家具设计师的重点学习软件。3DMAX:产品建模,场景建模主要展示出产品的特质构造。Vray:配合3DMAX,渲染出产品展示产品三维和各种材质的特点。Coreldraw:产品包装图纸...
展开详情

茂县有多少人口

茂县,在2015年末,户籍人口为11.16万;茂县,隶属于四川省阿坝藏族羌族自治州。位于四川省西北部、阿坝藏族羌族自治州东南部的青藏高原东南边缘,地跨岷江和涪江上游高山河谷地带,属高原性季风气候;全县总面积39...
展开详情

精选推荐更多>

鸿鹄之志岂燕雀能知是什么意思

鸿鹄之志岂燕雀能知,即“燕雀安知鸿鹄之志”,意思是:燕雀怎么能知道鸿鹄的远大志向,比喻平凡的人不知道英雄人物的志向。
出自《史记·陈涉世家》,又见《庄子·内篇·逍遥游》,原文是:陈涉少时,尝与人佣耕,辍耕之垄上,怅恨久之,曰:“苟富贵,勿相忘。”佣者笑而应曰:“若为佣耕,何富贵也?”陈涉叹息曰:“嗟乎,燕雀安知鸿鹄之志哉!”
翻译:陈涉年轻的时候,曾经同别人一起被雇佣耕地。(有一天)陈涉停止耕作走到田畔高地上(休息),因失望而愤慨叹息了很久,说:“如果(有朝一日我们谁)富贵了,可不要忘记老朋友啊。”雇工们笑着回答说:“你是个被雇佣耕地的人,哪来的富贵呢?”陈涉长叹一声说:“唉,燕雀怎么知道鸿鹄的志向呢!”
使用示例:
1、《吕氏春秋·士容》:“夫骥骜之气,鸿鹄之志,有谕乎人心者诚也。” 
2、唐·卢肇《鸜鹆舞赋》:“况乃意绰步蹲,然后知鸿鹄之志,不与俗态而同尘。”
3、元·郑光祖《王粲登楼》第一折:“大丈夫仗鸿鹄之志,据英杰之才。”亦省作“鸿鹄志”。
4、《北史·张定和张奫等传论》:“当其郁抑未遇,亦安知有鸿鹄志哉!” 
5、宋·陆游《庵中杂书》诗:“辍耕垄上鸿鹄志,长啸山中鸾凤音。”
6、郁达夫《己未秋应外交官试被斥仓卒东行返国不知当在何日》诗:“燕雀岂知鸿鹄志,凤凰终惜羽毛伤!” 

言有物而行有恒是什么意思

言有物而行有恒(yán yǒu wù ér xíng yǒu héng)是一个文化术语,说话要言之有物,做事要持之以恒。“言有物”即说话或写文章要有实际根据和内容,语言、文字要与实际情况相符,不能想当然,不能假大空;“行有恒”即做任何事情都应该有恒心、有原则,说到做到,专心一意,坚持到底,不朝三暮四或半途而废。此术语实际所包含的是一种务真求实的科学态度和专一持守的诚信精神。
出处:《易经·象下》:“君子以言有物而行有恒。”
象,易经用语,是《易经》中非常重要的一个用语。《三易》之一(另有观点:认为易经即三易,而非易经),是传统经典之一,相传系周文王姬昌所作,内容包括《经》和《传》两个部分。《经》主要是六十四卦和三百八十四爻,卦和爻各有说明(卦辞、爻辞),作为算卦之用。《传》包含解释卦辞和爻辞的七种文辞共十篇,统称《十翼》,相传为孔子所撰。
春秋时期,官学开始逐渐演变为民间私学。易学前后相因,递变发展,百家之学兴,易学乃随之发生分化。自孔子赞易以后,《易经》被儒门奉为儒门圣典,六经之首。儒门之外,有两支易学与儒门易并列发展:一为旧势力仍存在的筮术易;另一为老子的道家易,易学开始分为三支。

举目见日不见长安表达了什么

“举目见日,不见长安”表达了对长安的怀念,对前朝的眷恋。出自南朝·宋·刘义庆《世说新语》:“明日,集群臣宴会,告以此意,便重问之。乃答曰:‘日近。’元帝失色,曰:‘尔何故异昨日之言邪?’答曰:‘举目见日,不见长安。’”
译文:第二天,召集群臣宴饮,就把明帝这个意思告诉大家,并且再重问他一遍,不料明帝却回答说:“太阳近。”元帝惊愕失色,问他:“你为什么和昨天说的不一样呢?”明帝回答说:“现在抬起头就能看见太阳,可是看不见长安。
《世说新语》是南朝宋文学家刘义庆撰写(一说刘义庆组织门客编写)的文言志人小说集,是魏晋轶事小说的集大成之作,是魏晋南北朝时期“笔记小说”的代表作。其内容主要是记载东汉后期到魏晋间一些名士的言行与轶事。通行本6卷36篇。有梁刘孝标注本。

小学体测项目有哪些

小学一、二年级体测项目有身高体重、肺活量、50米跑、坐位体前屈、1分钟跳绳。小学三、四年级体测项目比一、二年级体测项目多了1分钟仰卧起坐。小学五、六年级体测项目比三、四年级多了50米×8往返跑。
身高体重:测量身高、体重可以判断人的生长发育和体型。
肺活量:指一次尽力吸气后,再尽力呼出的气体总量,它是一次呼吸的最大通气量,在一定意义上可反映呼吸机能的潜在能力。
50米跑:是一个能体现快速跑能力和反应能力的体育项目。
坐位体前屈:它的测试目的是测量在静止状态下的躯干、腰、髋等关节可能达到的活动幅度,主要反映这些部位的关节、韧带和肌肉的伸展性和弹性及身体柔韧素质的发展水平。
1分钟跳绳:目的在于训练下肢耐力和协调性。
1分钟仰卧起坐:用于测量腹部肌肉的力量,及一个人的体力、耐力。
50米×8往返跑:是有效反映学生灵敏及耐力素质发展水平的常用指标。
常见热点问答
热点搜索
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200
作文大全
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200