少于一个示例的机器学习

溺人深海
精选回答

2022年1月10日整理发布:如果我让你想象一匹马和一只鸟之间的某种东西——比如说,一匹飞马——你需要看一个具体的例子吗?这样的生物并不存在,但没有什么能阻止我们用我们的想象力创造一个:飞马。

人脑有各种机制,通过结合它对现实世界的抽象和具体知识来创造新概念。我们可以想象我们可能从未见过的现有事物(一匹长脖子的马——长颈鹿),以及现实生活中不存在的事物(一条会喷火的有翼蛇——一条龙)。这种认知灵活性使我们能够通过很少甚至有时没有新示例来学习新事物。

相比之下,众所周知,机器学习和深度学习是当前人工智能的领先领域,需要许多示例来学习新任务,即使它们与他们已经知道的事物相关。

克服这一挑战导致了机器学习方面的大量研究工作和创新。尽管我们离创造出能够复制大脑理解能力的人工智能还有很长的路要走,但该领域的进步是显着的。

例如,迁移学习是一种技术,它使开发人员能够针对新任务微调人工神经网络,而无需许多训练示例。Few-shot 和one-shot 学习使在一项任务上训练的机器学习模型能够使用单个或很少的新示例执行相关任务。例如,如果您有一个经过训练可以检测排球和足球的图像分类器,您可以使用一次性学习将篮球添加到它可以检测的类别列表中。

滑铁卢大学的人工智能科学家最近开发的一种被称为“少于一次学习”(或 LO-shot 学习)的新技术将一次性学习提升到一个新的水平。LO-shot 学习背后的想法是,要训练机器学习模型来检测 M 个类别,每个类别需要少于一个样本。该技术在 arXiv 预处理器上发表的一篇论文中介绍,仍处于早期阶段,但显示出前景,并且可以在数据不足或类太多的各种场景中使用。

k-NN 分类器

研究人员提出的 LO-shot 学习技术适用于“k-最近邻”机器学习算法。K-NN 可用于分类(确定输入的类别)或回归(预测输入的结果)任务。但是为了这个讨论,我们将坚持分类。

顾名思义,k-NN 通过将输入数据与其k 个最近邻进行比较来对输入数据进行分类(k是一个可调整的参数)。假设您想创建一个对手写数字进行分类的 k-NN 机器学习模型。首先,您为其提供一组标记的数字图像。然后,当您为模型提供一个新的、未标记的图像时,它将通过查看其最近的邻居来确定其类别。

例如,如果您将k设置为 5,机器学习模型将为每个新输入找到五个最相似的数字照片。如果说其中三个属于“7”类,它会将图像分类为数字 7。

k-NN 是一种“基于实例”的机器学习算法。当您为每个类别提供更多标记示例时,其准确性会提高,但性能会降低,因为每个新样本都会添加新的比较操作。

在他们的 LO-shot 学习论文中,研究人员表明,您可以使用 k-NN 获得准确的结果,同时提供的示例少于类。人工智能研究人员写道:“我们提出了‘少于一次’学习(LO-shot learning),在这种设置中,模型必须学习N 个新类,只给定M < N 个示例,每个类少于一个示例。” “乍一看,这似乎是一项不可能完成的任务,但我们在理论上和经验上都证明了可行性。”

每类少于一个示例的机器学习

经典的 k-NN 算法提供“硬标签”,这意味着对于每个输入,它只提供它所属的一个类。另一方面,软标签提供输入属于每个输出类别的概率(例如,有 20% 的可能性是“2”,70% 的可能性是“5”,10% 的可能性是一个“3”)。

在他们的工作中,滑铁卢大学的人工智能研究人员探索了他们是否可以使用软标签来概括 k-NN 算法的能力。LO-shot 学习的主张是软标签原型应该允许机器学习模型对具有少于N 个标记实例的N 个类别进行分类。

该技术建立在研究人员之前在软标签和数据蒸馏方面所做的工作之上。该论文的合著者 Ilia Sucholutsky 告诉TechTalks: “数据集蒸馏是一个生成小型合成数据集的过程,这些数据集将模型训练到与在完整训练集上训练模型相同的准确度。” “在使用软标签之前,数据集蒸馏能够表示像 MNIST 这样的数据集,每个类只需使用一个示例。我意识到添加软标签意味着我实际上可以在每个类中使用少于一个示例来表示 MNIST。”

MNIST是一个手写数字图像数据库,通常用于训练和测试机器学习模型。Sucholutsky 和他的同事 Matthias Schonlau 在卷积神经网络LeNet上仅使用五个合成示例就成功地在 MNIST 上实现了 90% 以上的准确率。

“这个结果真的让我感到惊讶,这让我对这种 LO-?shot 学习设置进行了更广泛的思考,”Sucholutsky 说。

基本上,LO-shot 使用软标签通过划分现有类之间的空间来创建新类。在上面的示例中,有两个实例可以调整机器学习模型(以黑点显示)。经典的 k-NN 算法会在两个类之间分割两个点之间的空间。但是“软标签原型 k-NN”(SLaPkNN)算法,被称为 OL-shot 学习模型,在两个类之间创建了一个新空间(绿色区域),它代表了一个新标签(想想有翅膀的马)。在这里,我们用N-1 个样本实现了N 个类别。

在论文中,研究人员表明,LO-shot 学习可以扩大到使用N 个标签甚至更多标签来检测3N-2 个类别。

在他们的实验中,Sucholutsky 和 ?Schonlau 发现,通过正确配置软标签,LO-shot 机器学习可以提供可靠的结果,即使您有嘈杂的数据。

“我认为 LO-shot 学习也可以从其他信息源中工作——类似于许多零样本学习方法所做的——但软标签是最直接的方法,”Sucholutsky 说,并补充说已经有几个可以为 LO-shot 机器学习找到正确的软标签的方法。

虽然该论文展示了使用 k-NN 分类器进行 LO-shot 学习的强大功能,但 Sucholutsky 表示该技术也适用于其他机器学习算法。“论文中的分析特别关注 k-NN,因为它更容易分析,但它应该适用于任何可以利用软标签的分类模型,”Sucholutsky 说。研究人员将很快发布一篇更全面的论文,展示 LO-shot 学习在深度学习模型中的应用。

不甘堕落 2023-08-18 13:27:40

相关推荐

艺考生集训注意事项 有什么要了解知道的

艺术生集训不要忽略了文化课,作为艺术生必须要做到文化课和专业课双赢,才能被心中理想大学录取,在这期间需要付出很大的努力。文化课也是非常重要的,不要忽略文化课,要一直学习专业课。艺考生集训注意什么学会针对性强化技...
展开详情

投档会参考学考成绩吗 学考成绩有什么用

将成绩符合的学生的档案投给招生院校。这就是投档,投档不参考于学生的其他条件,只参考他的总成绩和志愿。而根据学校的调档比例省教育考试院确定他的投档比例,只要学生的档案被投档,决定他是否被录取的因素就会包含他的学考...
展开详情

提高生物成绩的方法是什么 窍门有哪些

即通过分析教材,找出要点,将知识简化成有规律的几个字来帮助生物知识记忆。例如DNA的分子结构可简化为“五四三二一”,即五种基本元素、四种基本单位、每种基本单位有三种基本物质、很多基本单位形成两条脱氧核酸链、成为...
展开详情

艺术生集训注意事项有哪些 需要注意什么

艺术生在集训的时候也要同步文化课学习,夯实文化基础。考生在专业课集训期间,文化课千万不要丢,专业课和文化课的学习一定要兼顾。艺术生集训的注意事项一定要选择一个靠谱的培训学校。因为一个好的培训学校,懂得怎么以最快...
展开详情

艺术生什么时候集训好 有必要去集训吗

艺术生集训指的是艺术类学生在完成学业水平测试之后,由学校或自己向学校申请,暂时停掉学校的文化课,到专业的艺术培训学校进行封闭式训练,直到校考结束。美术生集训时间美术生集训,通常从高二下学期开始,5月份开始报名,...
展开详情

精选推荐更多>

乔迁新居大门对联

乔迁新居大门对联:
1、横批:春意盎然。
上联:福星高照全家福;
下联:春光耀辉满堂春。
2、横批:吉祥如意。
上联:迎喜迎春迎富贵;
下联:接财接福接平安。
3、横批:可心就好。
上联:良辰吉日喜迁新居;
下联:人兴家旺宜住高楼。
4、横批:乔木莺迁。
上联:乔迁喜天地人共喜;
下联:新居荣福禄寿全荣。
5、横批:栋宇聿新。
上联:吉日迁居万事如意;
下联:良辰安宅百年遂心。
6、横批:方寸福地。
上联:添居室金玉满堂;
下联:栋梁起流芳百世。
7、横批:四海升平。
上联:一马平川进新居;
下联:珠光宝气福满堂。
8、横批:万象更新。
上联:和顺一门有百福;
下联:平安二字值千金。
9、横批:喜气盈门。
上联:福旺财旺运气旺;
下联:家兴人兴事业兴。

亏除去部首有多少画

“亏”字除去部首,还有两画。
亏(拼音:kuī),汉语一级通用规范汉字(常用字)。“亏”和它的繁体字“虧”原是音义都不同的两个字。简体“亏”原是“于”的异体字,字形、字义关系不详。清代王筠认为是“吁”的本字,假借为动词“往”义,并由此引申出“到达”、“在”、“比”义,进而虚化出一系列介词用法,这些意思后世多写作“于”。“亏”字后来成为“虧”的简化字。
“虧”始收录于《说文解字》,许慎认为是形声字,从亏雐(hū)声,本义指气不足,引申泛指缺损,再引申指短、少、差欠,又引申为毁坏,还引申为道义上的亏欠、对不起。又作幸好、幸亏讲。另外“亏”也表示讥讽。

疾行的意思

“疾行”读音jí xíng,汉语词语,意思是快速行走。
出处:
1、《素问·气厥论》:“水气客于大肠,疾行则鸣濯濯,如囊裹浆。”
2、明·冯梦龙《东周列国志》第七十二回:“伍员疾行,至于鄂渚,遥望大江,茫茫浩浩,波涛万顷,无舟可渡。伍员前阻大水,后虑追兵,心中十分危急。”
造句:
1、他骑马疾行,在父亲咽气前到达了家中。
2、大队骑马背枪的胡子在山道上一路疾行,偶尔一两个山中猎户看到这群胡子,无不躲得远远的。
3、适才我看到你骑在疾行的巨无霸背上,仍然谈笑自若引吭高歌,如此临危不惧,气定神闲的大将风骨,岂是平常人所能及的。
4、杨龙和林凤仙驾着火龙,在万丈虚空之上穿云破雾,瞬息千里,飞速地朝着东南方向疾行而去。

会操是什么意思

会操,读音为huì cāo,汉语词语,意思是会合举行操演。该词是一个军事术语,古今语意不同,在清朝末年,又称为秋操、大操,意指新军的军事演习,在今天,专指军队的队列训练。
出处:《大辞海·军事卷》:“会操:集中部属对已训课目、内容进行的操演。多用于队列训练,目的是检验训练效果,相互观摩,交流经验,取长补短,共同提高。通常由连、营、团级单位组织实施,并组成评判组,按指定的单位或个人顺序轮流操演,结束后进行讲评。”
造句:
1、每天早晨,同学们在操场上会操。
2、我今天感到非常高兴,能够以检阅官身分出席这次结业会操。
3、我非常高兴出席今天的结业会操,再一次以检阅官的身分,与入境处的结业学员见面。
常见热点问答
热点搜索
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200
作文大全
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200