机器学习中什么是成员推理攻击

我想稳定
精选回答

2022年1月4日整理发布:机器学习的奇迹之一是它可以将任何类型的数据转化为数学方程。一旦您根据训练示例(无论是图像、音频、原始文本还是表格数据)训练机器学习模型,您将获得一组数值参数。在大多数情况下,模型不再需要训练数据集,而是使用调整后的参数将新的和未见过的示例映射到类别或值预测。

然后,您可以丢弃训练数据并在 GitHub 上发布模型或在您自己的服务器上运行它,而无需担心存储或分发训练数据集中包含的敏感信息。

但是一种称为“成员推理”的攻击可以检测用于训练机器学习模型的数据。在许多情况下,攻击者无需访问机器学习模型的参数,只需观察其输出即可进行成员推理攻击。在目标模型已针对敏感信息进行训练的情况下,成员资格推断可能会导致安全和隐私问题。

从数据到参数

每个机器学习模型都有一组“学习参数”,其数量和关系因使用的算法和架构类型而异。例如,简单回归算法使用一系列参数将输入特征直接映射到模型的输出。另一方面,神经网络使用复杂的参数层来处理输入并在到达最后一层之前将它们相互传递。

但无论您选择哪种算法,所有机器学习模型在训练过程中都会经历类似的过程。他们从随机参数值开始,并逐渐将它们调整到训练数据。受监督的机器学习算法,例如用于图像分类或检测垃圾邮件的算法,会调整其参数以将输入映射到预期结果。

例如,假设您正在训练一个深度学习模型以将图像分为五个不同的类别。该模型可能由一组提取图像视觉特征的卷积层和一组将每个图像的特征转换为每个类别的置信度分数的密集层组成。

模型的输出将是一组值,表示图像属于每个类的概率。您可以假设图像属于概率最高的类别。例如,输出可能如下所示:

猫:0.90

狗:0.05

鱼:0.01

树:0.01

船:0.01

在训练之前,模型将提供不正确的输出,因为其参数具有随机值。您可以通过为它提供一组图像及其相应的类来训练它。在训练过程中,模型逐渐调整参数,使其输出置信度得分尽可能接近训练图像的标签。

基本上,该模型将每种类型图像的视觉特征编码为其参数。

成员推理攻击

一个好的机器学习模型不仅可以对训练数据进行分类,还可以将其能力推广到以前从未见过的示例中。这个目标可以通过正确的架构和足够的训练数据来实现。

但总的来说,机器学习模型往往在其训练数据上表现更好。例如,回到上面的例子,如果你将你的训练数据与一堆新图像混合并通过你的神经网络运行它们,你会看到它在训练示例上提供的置信度得分将高于它以前从未见过的图像。

成员推理攻击利用此属性来发现或重建用于训练机器学习模型的示例。这可能会对使用其数据记录来训练模型的人产生隐私影响。

在成员推理攻击中,攻击者不一定需要了解目标机器学习模型的内部参数。相反,攻击者只知道模型的算法和架构(例如 SVM、神经网络等)或用于创建模型的服务。

随着谷歌和亚马逊等大型科技公司提供的机器学习即服务 (MaaS) 产品的增长,许多开发人员被迫使用它们,而不是从头开始构建模型。这些服务的优势在于它们抽象了机器学习的许多复杂性和要求,例如选择正确的架构、调整超参数(学习率、批量大小、时期数、正则化、损失函数等)和设置建立优化训练过程所需的计算基础设施。开发者只需要建立一个新模型并为其提供训练数据。剩下的就交给服务了。

权衡是如果攻击者知道受害者使用了哪个服务,他们可以使用相同的服务来创建成员推理攻击模型。

事实上,在 2017 年 IEEE 安全和隐私研讨会上,康奈尔大学的研究人员提出了一种成员推理攻击技术,该技术适用于所有主要的基于云的机器学习服务。

在这种技术中,攻击者为云服务上的目标机器学习模型创建随机记录。攻击者将每条记录输入模型。根据模型返回的置信度分数,攻击者调整记录的特征并由模型重新运行。这个过程一直持续到模型达到非常高的置信度。此时,记录与用于训练模型的示例之一相同或非常相似。

在收集到足够高的置信度记录后,攻击者使用数据集训练一组“影子模型”来预测数据记录是否是目标模型训练数据的一部分。这创建了一个模型集合,可以训练成员推理攻击模型。然后,最终模型可以预测数据记录是否包含在目标机器学习模型的训练数据集中。

研究人员发现,这种攻击在许多不同的机器学习服务和架构上都取得了成功。他们的发现表明,训练有素的攻击模型还可以区分训练数据集成员和从目标机器学习模型获得高置信度分数的非成员之间的差异。

成员推断的限制

成员推理攻击在所有类型的机器学习任务上都不是很成功。为了创建有效的攻击模型,对手必须能够探索特征空间。例如,如果机器学习模型对高分辨率照片执行复杂的图像分类(多类),则为成员推理攻击创建训练示例的成本将高得惊人。

但是对于处理表格数据(例如财务和健康信息)的模型,精心设计的攻击可能能够提取敏感信息,例如患者与疾病之间的关联或目标人群的财务记录。

成员推断也与“过拟合”高度相关,这是机器学习设计和训练不佳的产物。过度拟合的模型在其训练示例上表现良好,但在新数据上表现不佳。过拟合的两个原因是训练样本太少或训练过程运行时间过多。

机器学习模型越过拟合,对手就越容易对其进行成员推理攻击。因此,在未见过的示例上泛化良好的机器模型对于成员推断也更安全。

久违伊人容 2023-08-19 12:27:40

相关推荐

雾莲要不要去皮

莲雾不需要去皮。莲雾是可以连皮一起食用的水果,但前提是要将其洗干净。从市场买回来的莲雾可先用流水冲洗一遍,再将其放入有少量食盐的清水中浸泡15分钟左右,再用清水冲洗1-2遍即可食用。雾莲雾莲一般指洋蒲桃,也叫莲...
展开详情

茂县有多少人口

茂县,在2015年末,户籍人口为11.16万;茂县,隶属于四川省阿坝藏族羌族自治州。位于四川省西北部、阿坝藏族羌族自治州东南部的青藏高原东南边缘,地跨岷江和涪江上游高山河谷地带,属高原性季风气候;全县总面积39...
展开详情

板式家具设计需要学习哪些软件

CAD:主要绘制工具,此软件是家具设计师的重点学习软件。3DMAX:产品建模,场景建模主要展示出产品的特质构造。Vray:配合3DMAX,渲染出产品展示产品三维和各种材质的特点。Coreldraw:产品包装图纸...
展开详情

如何带好一支优秀的幼儿教师团队

实行人为管理,充分尊重和信任教师。实行人性化管理,让每一位教师都参与到管理中去。切实关心教师的生活,解决教师的后顾之忧。尊重和信任教师。善于用人,充分发挥团队的力量。注重教师培训,提高业务水平。按计划定期让老师...
展开详情

XP系统怎么进安全模式

安全模式是Windows系统中的一种特定模式,XP系统进入安全模式的方法:1、如果感觉系统出现问题,或者有一些无法卸载的软件,需要到安全模式中解决,那请先重新启动;2、?在系统未启动之前,一直不停地按F8键,直...
展开详情

精选推荐更多>

救人一命胜造七级浮屠中的浮屠是指

“救人一命,胜造七级浮屠”中的“浮屠”是指佛教建筑形式,即所说的塔,又称浮图。读作jiù rén yī mìng,shèng zào qī jí fú tú。这种建筑最初用以供奉佛骨,后来用以供奉佛像,收藏经书。词语指救人一条性命,犹如建筑一座七级宝塔,功德无量。用以劝人行善,或向人恳求救命。
“救人一命,胜造七级浮屠”是一个汉语成语,意思是为死去的人造塔,毕竟不如“救人一命”的功德更大,更有意义。

己亥岁这首诗深刻地揭示了什么

《己亥岁二首》深刻地揭示了战争对人民造成的深重灾难和浩劫。
原文:
其一:
泽国江山入战图,生民何计乐樵苏。
凭君莫话封侯事,一将功成万骨枯。
其二:
传闻一战百神愁,两岸强兵过未休。
谁道沧江总无事,近来长共血争流。
译文:
其一:
富饶的水域江山都已绘入战图,百姓想要打柴割草度日而不得。
请你别再提什么封侯的事情了,一将功成要牺牲多少士卒生命!
其二:
传说一旦开战连众神灵都发愁,两岸军队连年混战一直不停休。
谁还说沧江总是太平没有祸事,近来江水混着鲜血争先向东流。
《己亥岁二首》是唐代诗人曹松的组诗作品。这组诗以干支为题,以示纪实,明确表明了对现实的批判态度。全诗概况地写出了战争对人民造成的深重灾难和浩劫,以冷峻深邃的目光洞穿千百年来封建战争的实质,写得力透纸背,入木三分。

山居秋暝是什么体裁的诗

《山居秋暝》是一首五言律诗,运用了反衬手法和对典故的艺术手法。《山居秋暝》是唐代诗人王维写的初秋时节所见雨后黄昏的景色,为山水名篇。该诗于诗情画意之中寄托着诗人高洁的情怀和对理想境界的追求。
原文:
空山新雨后,天气晚来秋。
明月松间照,清泉石上流。
竹喧归浣女,莲动下渔舟。
随意春芳歇,王孙自可留。
全诗将空山雨后的秋凉,松间明月的光照,石上清泉的声音以及浣女归来竹林中的喧笑声,渔船穿过荷花的动态,和谐完美地融合在一起,给人一种丰富新鲜的感受。它像一幅清新秀丽的山水画,又像一支恬静优美的抒情乐曲,体现了王维诗中有画的创作特点。

个个和各个的区别

个个与各个的区别:指代不同、出处不同、侧重点不同。
一、指代不同:
1、个个:一个一个,每一个。
2、各个:每个;所有的那些个;逐个。
二、出处不同:
1、个个:出自毛泽东《对晋绥日报编辑人员的谈话》:“陕北的部队经过整训诉苦以后,战士们的觉悟提高了……个个磨拳擦掌,士气很高,一出马就打了胜仗。”
2、各个:出自《儿女英雄传》第一回:“家人们听见老爷得了外任,各个喜出望外。”
三、侧重点不同:
1、个个:指团体或整体。
2、各个:指具体的每一个。
“个个”造句:
1、登上山顶时,我们个个累得气喘吁吁的。
2、孩子们个个天真活泼,多么可爱!
“各个”造句:
1、围棋比赛时,小华利用诱敌深入,各个击破的战法,瓦解了对方的攻势。
2、校长负责学校各个方面的工作。
常见热点问答
热点搜索
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200
作文大全
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200