2月16日什么是卷积神经网络CNN
自 1950 年代人工智能早期以来,计算机科学家一直在尝试构建能够理解视觉数据的计算机。在随后的几十年里,这个被称为计算机视觉的领域取得了进步。2012 年,多伦多大学的一组研究人员开发了一种人工智能模型,大大超过了最好的图像识别算法,计算机视觉实现了飞跃。
这个后来被称为 AlexNet(以其主要创建者 Alex Krizhevsky 命名)的 AI 系统以 85% 的惊人准确率赢得了 2012 年 ImageNet 计算机视觉竞赛。亚军在测试中的得分仅为 74%。
AlexNet 的核心是卷积神经网络 (CNN),这是一种专门模仿人类视觉系统的人工神经网络。近年来,CNN 已成为许多计算机视觉应用的关键。以下是您需要了解的有关 CNN 的历史和工作原理的信息。
卷积神经网络简史
卷积神经网络,也称为 ConvNets,由计算机科学博士后研究员 Yann LeCun 在 1980 年代首次引入。LeCun 以科学家 Kunihiko Fukushima 所做的工作为基础,几年前他发明了 neocognitron,一种非常基本的图像识别神经网络。
CNN 的早期版本,称为 LeNet(以 LeCun 命名),可以识别手写数字。CNN 在银行、邮政服务和银行业务中找到了一个利基市场,他们可以读取信封上的邮政编码和支票上的数字。
但是尽管他们有独创性,ConvNets 仍然在计算机视觉和人工智能的边缘,因为他们面临一个严重的问题:他们无法扩展。CNN 需要大量数据和计算资源才能有效地处理大图像。当时,该技术仅适用于低分辨率的图像。
2012 年,AlexNet 表明,也许是时候重新审视深度学习了,这是使用多层神经网络的 AI 分支。大型数据集的可用性,即具有数百万张标记图片的 ImageNet 数据集,以及庞大的计算资源,使研究人员能够创建复杂的 CNN,这些 CNN 可以执行以前不可能完成的计算机视觉任务。