AI模型的独特特征之一是每个视频需要一个AI模型
每次将视频添加到 Archangel 存档时,都会创建一个新的神经网络。“我们正在使用常规神经网络或 ResNet,它通常用于对象检测以提取一些描述符。但是然后我们使用我们设计的一些神经网络并获取这些描述符并进行篡改检测。它是预训练网络和我们在论文中提出的新神经网络的组合,”Collomosse 说。
AI模型被称为三元网络。人工智能首先在原始视频上进行训练,称为主播。然后它检查正例,它们是相同的视频,但以不同的格式转码。接下来,它分析负面示例、与原始视频不同的视频或原始视频的篡改版本。训练后,神经网络会专门针对原始视频量身定制,并可以检测出其合法和伪造版本。
有趣的是,在机器学习术语中,当 AI 模型过于适应其训练数据时,它被称为“过度拟合”,这种做法被认为是负面的。但在 Archangel 的案例中,创作者有意将他们的模型过度拟合到每个视频中。
“我们想,我们能否训练一个神经网络来保护档案中的所有视频?但这不是一个好主意,因为很难创建一个模型来代表你现在和将来可能遇到的一切,”科洛莫斯说。
Collomosse 说,这样的 AI 模型也容易受到对抗性攻击、精心制作的视频以欺骗神经网络。
“当你谈论机器学习时,过度拟合有时是一个肮脏的词。在这种情况下,我们试图做的正是:我们专门针对该视频过度拟合网络。优点是我们获得了针对该视频的独特保护,”科洛莫斯说。
但他指出,缺点是 Archangel 必须在存档中的每个视频旁边存储一个单独的神经网络。这增加了存储和训练开销。存储不是什么大问题,因为每个 AI 模型大约 100MB,只是实际视频的一小部分。
但是训练人工智能可能会带来问题。为单个视频训练神经网络需要几个小时,这可能会限制其在视频创建和注册非常迅速的环境中的使用。