机器学习和数据的价值
在学术界,大多数 AI 研究都集中在创建可以在已建立的数据集(如 ImageNet、CLEVR 或 SQUAD)上执行任务的算法。但在实际应用中,在获取用于训练和维护机器学习算法的正确数据方面,还有许多其他细微差别。
Prediction Machines的作者在揭开机器学习算法处理数据的经济学神秘面纱方面做得非常出色。“预测机器依赖于数据。更多更好的数据可以带来更好的预测。在经济方面,数据是预测的关键补充。随着预测变得更便宜,它变得更有价值,”他们写道。
但他们也强调,收集高质量数据既昂贵又耗时,运营一家人工智能公司需要在更多数据的好处与获取数据的成本之间进行权衡。
统计学家和机器学习从业者知道数据的规模报酬递减。当您在更多数据上训练机器学习算法时,准确性的提高速度会变慢。第三个数据点提供比第一个数据点更多的有用信息,而第一个数据点比第一个数据点更有用。
但是,当您使用机器学习来经营业务时,情况就不同了,作者提醒我们,因为从经济的角度来看,重要的是您从预测中获得的价值。因此,如果更多数据改进了您的机器学习算法,足以让您比竞争对手更具优势(想想从先购物再发货到先发货再购物的转变),那么投资可能是值得的。
这就是为什么我们看到 Facebook 和谷歌等科技巨头进行军备竞赛,以收集可以增强其人工智能算法的数据。
商业领袖还必须明白,拥有大量数据并不一定能让您处于开发强大机器学习算法的正确位置。数据分为三类:训练、输入和反馈。您需要这三者才能为您的企业开发和维护高效的机器学习模型。
例如,拥有大量历史销售记录可能构成用于预测销售数据的机器学习模型的良好训练数据集。但要不断提高模型的性能,您还需要捕获新数据(输入)并将新预测与实际客户行为(反馈)进行比较的方法。除了技术独创性之外,这还需要业务战略。
“数据和预测机器是互补的。因此,采购或开发人工智能的价值是有限的,除非你有数据来支持它,”作者写道。“如果该数据与他人共享,则您需要一种策略来获取它。如果数据由独家或垄断提供商提供,那么您可能会发现自己面临着让该提供商占用您 AI 的全部价值的风险。如果数据属于竞争对手,则可能没有策略值得从他们那里获取数据。如果数据存在于消费者手中,则可以将其交换以换取更好的产品或更高质量的服务。”
预测与判断的区别
预测机器中讨论的另一个关键主题是预测和判断之间的界限在哪里,以及人工智能和人类之间的分工。
“预测不是决定。做出决定需要对预测进行判断,然后采取行动,”作者写道。
我认为,这是一个关键的要点。对于每个商业领袖来说,了解机器学习算法的潜力很重要,但也要承认它们的缺点以及需要依靠人类智能和决策的地方。
“随着机器预测越来越多地取代人类做出的预测,人类预测的价值将会下降。但关键是,虽然预测是任何决策的关键组成部分,但它不是唯一的组成部分,”预测机器的作者写道。“决策的其他要素——判断、数据和行动——目前仍牢牢掌握在人类领域。它们是预测的补充,这意味着随着预测变得便宜,它们的价值会增加。”
判断是一项复杂的任务,往往需要常识和对世界的理解,这是机器学习算法目前在这两个领域苦苦挣扎的领域。在许多情况下,人类必须对跨越短期和长期的多个目标进行判断和决定。他们必须评估动态情况并评估权衡。但在不太复杂的环境中,判断和决策可以通过奖励函数工程或硬编码规则的实现实现自动化。在这些领域,强化学习等人工智能分支可能能够完全自动化任务。
了解机器学习商业模式
如果说Prediction Machines强调一件事,那就是运营 AI 业务的根本差异和挑战。许多公司和商业领袖都拥有经典软件开发和业务的背景。他们需要适应管理机器学习模型开发和维护的规则,并管理随之而来的独特风险。
那些适应人工智能业务的人必将获得回报。那些不这样做的人会遇到可怕的惊喜。