如果没有大量数据怎么办

老巷旧人
精选回答

2022年1月28日整理发布:对深度学习的主要批评之一是它需要大量的训练数据。在许多科学领域,没有足够的标记数据可用。在医学等其他领域,数据收集成本高得令人望而却步,并受处理敏感个人信息的法律的约束。

深度神经网络在训练过程中也会消耗大量的计算资源和电力,这是许多人和组织无法满足的要求。

但并非每个深度学习模型都需要大量训练数据。在过去的几年中,迁移学习的进步使许多开发人员能够在不需要大量数据和计算资源的情况下创建深度学习模型。迁移学习涉及为新任务微调预训练的 AI 模型。迁移学习在计算机视觉方面取得了显著成功,并且有许多免费可用的 AI 模型已经在数百万个示例上进行了训练。

只要新问题与基础模型的领域足够接近,并且您有一组不错的示例,您就有合理的机会为新任务微调 AI 模型。

“通常,执行迁移学习是开始研究感兴趣的新问题的绝佳方式。除了预训练权重提供的知识重用、稳定性和收敛性提升之外,使用经过充分测试的标准神经网络架构还有很多好处,”作者写道。

同时,他们还警告说:“但请注意,迁移学习的确切效果尚未完全了解,并且是一个活跃的研究领域。”

未来几个月值得关注的另一个领域是自我监督学习,这是人工智能的一个分支,可以从原始数据中学习,而无需人工标记的示例。然而,自我监督学习仍处于非常初级的阶段,也是一个活跃的研究领域。

但是已经取得成果的领域是生成模型,例如生成对抗网络(GAN)。GAN 可以生成与真实数据相似的虚假数据。也许他们最出名的是他们可以创造出自然但不存在的人脸。艺术家们现在正在使用 GAN 来生成能够以高价出售的艺术品。

但 GAN 在科学研究中也有实际应用,包括医学成像和蛋白质生成中的数据增强。在最近的一个项目中,人工智能研究人员训练了一个 GAN 来生成功能性蛋白质序列。研究人员写道,该模型展示了“人工智能在序列空间允许的生物学限制内快速生成高度多样化的新型功能蛋白质的潜力”。

强化学习是另一个显示出数据稀缺且数据收集困难且成本高昂的科学研究前景的领域。在强化学习中,人工智能代理自行探索他们的问题空间,并通过优化他们的行为以获得奖励功能来发展他们的行为。

然而,生成式 AI 和强化学习有一些警告。“我们将这些方法称为高级方法,因为它们通常实施起来更加复杂,并且可能需要问题的特定属性才能发挥作用,例如用于强化学习的优秀环境模型/模拟器,”Schmidt 和 Raghu 指出。

科学研究和深度学习的可解释性问题

深度学习经常提出的另一个挑战是可解释性。深度神经网络是复杂的函数,其参数可以跨越数百万甚至数十亿,理解它们如何解决问题和做出预测往往令人困惑。

这可能对科学研究的许多领域构成挑战,这些领域的重点是理解而不是预测,研究人员试图确定数据中观察到的模式背后的潜在机制。“在科学环境中应用深度学习时,我们可以使用这些观察到的现象作为预测目标,但最终目标仍然是了解哪些属性会导致这些观察结果,”施密特和拉古写道。

幸运的是,可解释人工智能的进步在某种程度上帮助克服了这些障碍。虽然完全理解和控制神经网络的逐步决策机制仍然是一个挑战,但过去几年开发的技术帮助我们解释了这个过程。

Schmidt 和 Raghu 将 AI 可解释性技术分为两大类:特征归因和模型检查。

特征归因有助于我们更好地了解特定样本中的哪些特征对神经网络的输出做出了贡献。这些技术产生突出这些特征的显着性图。例如,如果您正在检查图像分类器,则显着性图将突出显示 AI 在确定其类别时所定位的图像部分。

有不同的技术可以生成显着图,包括 GradCAM、LIME 和RISE。它们是检查神经网络输出以了解其决策是基于正确还是错误特征的好方法。

另一方面,模型检查试图探测网络隐藏层中的神经元,并找到激活它们的输入类型。这些技术可以更好地了解 AI 模型的一般工作原理。在该领域完成的一些有趣的工作是GANPaint,它可以让您检查操纵单个神经元的效果,以及Activation Atlassses,一个可视化神经网络中神经元之间相互作用的工具。

将深度学习应用于科学发现的机会很多,Schmidt 和 Raghu 编写的论文为有抱负的科学家提供了一个很好的入门指南。

“随着在许多不同科学领域收集的数据量在数量和复杂性方面不断增加,深度学习方法为基本预测问题以及揭示基础数据生成过程的微妙属性提供了许多令人兴奋的可能性,”作者写。

麦田守望者 2023-08-20 11:27:40

相关推荐

电脑如何添加域

先点击计算机,然后单击右键,选择属性项,更改设置选择更改。计算机名字更改为使用者名字,这样是为了区分域中的计算机,域填写需要加进去的域名,点击确定,弹出对话框,填写域管理员的账号密码。点击计算机,然后单击右键,...
展开详情

表示队伍整齐的四字词语

1、堂堂之阵:形容阵容盛壮整齐,也用来形容光明正大;2、鳞次栉比:形容房屋或船只等排列得很密很整齐;3、正正之旗:排列整齐的军旗。借喻强盛整肃的军队;4、匪匪翼翼:形容车马行走时阵容整齐、威武;5、井然有序:整...
展开详情

儿子欠债父母有义务还吗

成年子女自己欠下的钱,债权人只能让这个成年子女还,法律上成年子女和父母的财产分的很清楚,不存在连带责任。父母对于成年子女的债务不负偿还义务,除非父母作为继承人,在成年子女死亡后继承死者遗产,就需要承担遗产价值以...
展开详情

形容高考的成语有哪些

形容高考的成语有:寒窗苦读:在寒冷的窗下苦读:形容读书的艰辛。倒背如流:背:背诵。把书或文章倒过来背,背得像流水一样流畅。形容背得非常熟练,记得非常牢。成语出处:郭沫若《苏联纪行日记六月廿七日》。她把说明小册子...
展开详情

显卡的6P供电怎么接

1、首先需要准备显卡电源线,保证质量完好无损,方可进行接下来的操作;2、接着观察电脑的插口有哪些具体样式,是否与自身的电源线接口相匹配;3、接着准备连接,首先找到电源插口上六加二中的六插口,随后插在显卡上,此时...
展开详情

精选推荐更多>

森是木字旁还是木字头

“森”是木字旁,森(读音sēn)是汉字通用规范一级字(常用字)。此字始见于商代甲骨文。《说文》中说“森,木多貌。”可见,“森”的本义是树木茂密的样子。后引申为众多。又由本义引申为阴森,幽暗的样子。
“森”是始见于商代甲骨文。“森”字由三个“木”字按照品字结构组成。但商代甲骨文刚开始时并不是按照这种结构组成的,而是在一条直线上。经过一段时间后,“森”的结构才开始变化,且延续到后世。
“森”字是会意字。由三“木”构成,意思是由特别多的树连在一起,由此也产生了森林的含义。“森”的本义是指树木茂密的样子。杜甫《蜀相》中说“丞相祠堂何处寻,锦官城外柏森森。”这里引申为众多之义。张九龄《奉和圣制早发三乡山行》中说“羽卫森森西向秦,山川历历在清晨。”森林里光线幽暗,故引申为阴沉、幽暗的样子。

后是半包围结构吗

“后”是半包围结构。
后,读音hòu,是合并字,合并“后”与“後”。“后”,从人从口,司的镜像,君后也,继体君也,象人之形。施令以告四方,故之从一,口。发号者,君后也。本义是发号施令者,即君主。上古称君主:商之先后(先王)。帝王的妻子:皇后、太后。指空间在背面,反面的,与“前”相对。
出处:
1、东汉·许慎《说文》:后,继体君也。
2、《左传·僖公三十二年》:夏后皋之墓也。
组词:青后、后镜、后郑、主后、后叙、后时、望后、后幅、后开。
反义词:先、前。

金瓯是什么意思

金瓯的意思是金的盆盂;比喻疆土之完固,亦用以指国土;酒杯的美称。
金瓯,汉语词语,拼音是jīn ōu。
出处:晋·干宝《搜神记》卷四:“妇以金瓯、麝香囊与婿别,涕泣而分。”
例句:
1、《明史·钱龙锡传》:“帝仿古枚卜典,贮名金瓯,焚香肃拜,以次探之。”
2、清·黄遵宪《感事》诗:“金瓯亲卜比公卿,领取冰衔十日荣。”
3、唐·司空图《南北史感遇》诗之五:“兵围梁殿金瓯破,火发陈宫玉树摧。”
4、明·陈继儒《大司马节寰袁公家庙记》:“翻图史,凿田畴,睢阳世世如金瓯。”

浅尝辄止,逾而不规什么意思

“浅尝辄止,逾而不规”的意思是略微尝试一下就停下来,不越出规矩。
浅尝辄止,汉语成语,拼音是qiǎn cháng zhé zhǐ,意思是略微尝试一下就停下来。指不深入钻研。又指博而不精。
成语出处:清·彭养鸥《黑籍冤魂》第二十四回:“此物非不可尝,苟文人墨客,浅尝辄止,用以悦性陶情,有何不可?”
成语用法:作谓语、定语;指害怕困难。
示例:做事情不能浅尝辄止,要持之以恒,这样才能成功。
近义词:半途而废、浮光掠影。
反义词:持之以恒、坚持不懈。
常见热点问答
热点搜索
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200
作文大全
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200