麻省理工学院提出了可以压缩模型并鼓励代理商探索的AI框架

天天开心
精选回答

在2020年国际学习表示会议(ICLR)接受的两篇论文中,麻省理工学院的研究人员研究了激励软件代理探索其环境的新方法和修剪算法,以使AI应用程序运行得更快。总体而言,这两种方法可以促进自主工业,商业和家用机器的发展,这些机器需要的计算量更少,但同时也比目前的野外产品具有更高的功能。(例如,考虑在Raspberry Pi上构建一个库存检查机器人,该机器人可以快速学习如何导航杂货店的小岛。)

“好奇心”算法

一个团队创建了一个元学习算法,该算法生成了52,000个探索算法,或驱动代理广泛探索其周围环境的算法。他们确定的两个是全新的,并进行了探索,从而改善了一系列模拟任务的学习-从登上月球车,举起机械臂到移动类似蚂蚁的机器人。

团队的元学习系统首先选择一组高级操作(例如,基本程序,机器学习模型等)来指导座席执行各种任务,例如记住以前的输入,比较和对比当前和过去的输入,并使用学习方法来更改自己的模块。元学习系统从总共近三打的操作中采购,一次最多合并七个,从而创建了描述上述52,000种算法的计算图。

测试所有算法将需要数十年的时间,因此合著者通过消除根据其代码结构预测性能不佳的算法,从而限制了他们对最佳算法的搜索。然后,该团队在一项基本的网格级导航任务上测试了最有前途的候选人,该任务需要大量的探索但计算量最少。表现出色的候选人的表现成为新的基准,随着时间的推移,甚至淘汰了更多的候选人。

研究人员称,四台机器搜索了十多个小时以找到最佳算法。超过100个是高性能的,前16个既有用又新颖,性能与人工设计的算法一样好(或优于人工设计的算法)。

该团队将前16个模型的性能归因于他们共享的两个探索功能。首先,特工在有机会搬家的新地方获得奖励。在第二个模型中,一个AI模型学习预测代理的未来状态,而第二个模型则回忆过去,并且协同工作以预测当前,这样,如果该预测是错误的,则双方都会奖励自己,以表明他们拥有发现了一些新东西。

研究人员指出,由于元学习过程会生成高级计算机代码作为输出,因此可以对这两种算法进行剖析,以了解其决策过程。麻省理工学院的研究生马丁·施耐德(Martin Schneider)在一份声明中说:“我们生成的算法可以被人类读取和解释,但是要真正理解我们必须通过每个变量和操作进行推理的代码,以及它们如何随着时间演变。”他与研究生Ferran Alet和MIT计算机科学与电气工程教授Leslie Kaelbling和TomásLozano-Pérez共同撰写了这项研究。“利用计算机评估大量算法的能力以及我们人类解释和改进这些思想的能力,设计算法和工作流程是一个有趣的公开挑战。”

缩小AI模型

在两项研究的第二项中,麻省理工学院的团队描述了一个框架,该框架可以可靠地压缩模型,从而使其能够在资源受限的设备上运行。尽管研究人员承认他们不理解为什么它会如此出色地工作,但他们声称比其他压缩方法(包括那些被认为是最先进的压缩方法)更容易,更快地实现。

该框架是“彩票假设”的产物,该论文表明,如果在训练过程中识别出正确的子模型,则模型可以减少90%的元素,从而表现良好。这项研究的合著者(不是巧合地撰写了“彩票假设”)建议将模型“倒带”到其早期训练状态,而无需任何参数(例如,模型内部的配置变量,其值可以根据给定值进行估算)数据)再进行培训。这种修剪方法通常会导致模型随着时间的流逝变得不那么精确,但是这种方法设法将其恢复到接近其原始精度。

对于更广泛的AI研究领域而言,这是个好消息,其广泛的可访问性和可持续性问题仍未解决。去年6月,马萨诸塞州大学阿默斯特分校的研究人员发布了一项研究,估计训练和搜索某种模型所需的电量涉及约626,000磅的二氧化碳排放,相当于平均寿命的近5倍。美国车。根据最近的Synced报告,华盛顿大学的Grover机器学习模型旨在生成和检测虚假新闻,在两周的培训中花费了25,000美元。

麻省理工学院助理教授宋涵说:“我很高兴看到新的修剪和再培训技术不断发展。”他建立了行业标准的修剪算法AMC,但并未参与这项特殊研究。他最近与他人合着了一篇论文,描述了一种AI培训技术,该技术可以通过大型模型提高效率,该大型模型包含可以针对各种平台定制的许多预训练子模型。“ [它将使更多的人访问高性能AI应用程序。”

麻省理工学院博士学生Alexa Renda与MIT助理教授和博士生合着了这项研究。学生乔纳森·弗兰克(Jonathan Frankle)。两者都是麻省理工学院计算机科学和人工科学实验室(CSAIL)的成员。

花自芬芳 2023-12-04 12:54:49

相关推荐

电脑如何添加域

先点击计算机,然后单击右键,选择属性项,更改设置选择更改。计算机名字更改为使用者名字,这样是为了区分域中的计算机,域填写需要加进去的域名,点击确定,弹出对话框,填写域管理员的账号密码。点击计算机,然后单击右键,...
展开详情

XP系统怎么进安全模式

安全模式是Windows系统中的一种特定模式,XP系统进入安全模式的方法:1、如果感觉系统出现问题,或者有一些无法卸载的软件,需要到安全模式中解决,那请先重新启动;2、?在系统未启动之前,一直不停地按F8键,直...
展开详情

如何带好一支优秀的幼儿教师团队

实行人为管理,充分尊重和信任教师。实行人性化管理,让每一位教师都参与到管理中去。切实关心教师的生活,解决教师的后顾之忧。尊重和信任教师。善于用人,充分发挥团队的力量。注重教师培训,提高业务水平。按计划定期让老师...
展开详情

板式家具设计需要学习哪些软件

CAD:主要绘制工具,此软件是家具设计师的重点学习软件。3DMAX:产品建模,场景建模主要展示出产品的特质构造。Vray:配合3DMAX,渲染出产品展示产品三维和各种材质的特点。Coreldraw:产品包装图纸...
展开详情

雾莲要不要去皮

莲雾不需要去皮。莲雾是可以连皮一起食用的水果,但前提是要将其洗干净。从市场买回来的莲雾可先用流水冲洗一遍,再将其放入有少量食盐的清水中浸泡15分钟左右,再用清水冲洗1-2遍即可食用。雾莲雾莲一般指洋蒲桃,也叫莲...
展开详情

精选推荐更多>

上坡路难走诗句励志

指上坡路难走的诗句励志:
1、屈原(先秦)《离骚》:
路曼曼其修远兮,吾将上下而求索。
译文:
前面的道路啊又远又长,我将上上下下追求理想。
2、李白(唐代)《行路难·其一》
金樽清酒斗十千,玉盘珍羞直万钱。
停杯投箸不能食,拔剑四顾心茫然。
欲渡黄河冰塞川,将登太行雪满山。
闲来垂钓碧溪上,忽复乘舟梦日边。
行路难,行路难,多歧路,今安在?
长风破浪会有时,直挂云帆济沧海。
译文:
金杯中的美酒一斗价十千,玉盘里的菜肴珍贵值万钱。
心中郁闷,我放下杯筷不愿进餐;拔出宝剑环顾四周,心里一片茫然。
想渡黄河,冰雪却冻封了河川;想登太行山,莽莽风雪早已封山。
像姜尚垂钓溪,闲待东山再起;又像伊尹做梦,乘船经过日边。
人生道路多么艰难,多么艰难;歧路纷杂,如今又身在何处?
相信乘风破浪的时机总会到来,到时定要扬起征帆,横渡沧海!
3、李白(唐代)《蜀道难》:
噫吁嚱,危乎高哉!
蜀道之难,难于上青天!
蚕丛及鱼凫,开国何茫然!
尔来四万八千岁,不与秦塞通人烟。
西当太白有鸟道,可以横绝峨眉巅。
地崩山摧壮士死,然后天梯石栈相钩连。
上有六龙回日之高标,下有冲波逆折之回川。
译文:
唉呀呀!多么高峻伟岸!
蜀道难以攀越,简直难于上青天。
传说中蚕丛和鱼凫建立了蜀国,开国的年代实在久远无法详谈。
从那时至今约有四万八千年了吧,秦蜀被秦岭所阻从不沟通往返。
西边太白山高峻无路只有飞鸟可以飞过此山,直到蜀国的峨眉山巅。
山崩地裂,埋葬了五位开山英雄壮士,这样以后高险的山路和栈道才相互勾连。
蜀中上有挡住太阳神六龙车的山巅,下有激浪排空迂回曲折的大川。

汉字是音节文字吗

汉字是音节文字,音节文字(Syllabary)是表音文字的一种,以音节为单位的文字。代表性的有日语的假名。像假名一样并非音素的组合,各音节有独自形状的音节文字,在世界上也是相当稀少的。
元音区别:
两个音节如果有相同的声母,元音附标文字将有相同的基字,通过不同的附标表示音节内有不同的韵母;而音节文字则无相同符号。比如音节(ka)、(ki),日文片假名写作カ、キ两个截然不同的字符,所以算音节文字,而印地语写作क、कि,都有共同的基字क,所以算元音附标文字。
音素区别:
韩文(谚文)将表示音素的字母按音节组合起来写成一个方块字,但其实它并不属于学术定义上的音节文字,而和拉丁字母一样属于全音素文字,只不过它的字母排列不是线形拼写,而是依照音节块形拼写而已。

高考报名只能在电脑上报吗

高考填报志愿在手机上填和电脑上都可以。但是手机上填容易出现乱码,造成填报错误。电脑操作方便,不容易出现数据失误。因为用手机填报志愿,系统不同,容易造成填报错误,为了更为直观方便的进行志愿填报建议还是使用电脑。
填报志愿注意事项:
1、认真做好填报志愿的准备工作,慎重考虑并准确填报志愿预填表。考生可运用“志愿辅助系统”生成夏季高考平行志愿的志愿预填表。
2、考生志愿是投档和录取的重要依据,必须由考生本人亲自填报,不得由任何人代替。学校和教师不得代替学生统一设置报考密码,不得干预考生填报志愿,不得代替考生填报志愿,也不得接受考生委托填报志愿。

齐侯陈诸侯之师,与屈完乘而观之翻译

“齐侯陈诸侯之师,与屈完乘而观之”翻译:齐桓公让诸侯国的军队摆开阵势,与屈完同乘一辆战车观看军容。出自先秦左丘明的《齐桓公伐楚盟屈完》,此文作为记叙外交斗争的一段史体散文,在语言的运用上也达到了炉火纯青的艺术境界。
原文节选:
夏,楚子使屈完如师。师退,次于召陵。齐侯陈诸侯之师,与屈完乘而观之。齐侯曰:“岂不穀是为? 先君之好是继,与不穀同好,如何?”对曰:“君惠徼福于敝邑之社稷,辱收寡君,寡君之愿也。”齐侯曰:“以此众战,谁能御之!以此攻城,何城不克!”对曰:“君若以德绥诸侯,谁敢不服? 君若以力,楚国方城以为城,汉水以为池,虽众,无所用之!”
此文在记述春秋时代齐楚两国的这场外交斗争时,并不是用叙述语言来记述它的过程,而是把“出场”人物放在双方的矛盾冲突中。并通过他们各自的个性化语言和“交锋”方式,把这场外交斗争一步步引向深入,直到双方达成妥协,订立盟约。这样,即使我们明白了这场外交斗争的性质及其过程,又让我们看到了各具情貌的四位历史人物。楚国两位使者,特别是作为楚成王“特命全权代表”的屈完,沉稳冷静、不卑不亢的外交风度,坚毅果敢、不为威武所屈的外交风范,机智灵敏、随机应对的外交智慧,都给我们留下了深刻印象。而作为政治家的管仲,他那熟悉历史、谙于事故、无理也能说出理来的外交才情,以及齐桓公那种虽然骄横霸道、软硬兼施,却也不失身份的霸主形象,也都让我们过目难忘。总之,阅读欣赏此文,不像是读史,倒像是看一场高潮迭起、精彩纷呈的外交斗争话剧。
常见热点问答
热点搜索
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200
作文大全
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200