为什么大多数机器学习策略失败
根据云服务提供商 Rackspace Technology 的一项新调查,大多数公司都在努力制定有效的人工智能战略。该调查包括制造、金融、零售、等各行各业的 1,870 家组织,表明只有 20% 的公司拥有成熟的人工智能/机器学习计划。其余的人仍在试图弄清楚如何让它发挥作用。
毫无疑问,机器学习在几乎每个领域的前景。将机器学习模型应用于实际应用程序的一些好处是降低成本、提高精度、更好的客户体验和新功能。但机器学习不是魔杖。正如许多组织和公司正在学习一样,在您将机器学习的力量应用于您的业务和运营之前,您必须克服几个障碍。
公司在将 AI 技术集成到其运营中时面临的三个关键挑战是技能、数据和战略领域,而Rackspace 的调查清楚地说明了大多数机器学习策略失败的原因。
机器学习是关于数据的
机器学习模型依赖于计算资源和数据。由于各种云计算平台,对训练和运行 AI 模型所需的硬件的访问变得更加容易和负担得起。
但在规划和采用人工智能战略的不同阶段,数据仍然是一个主要障碍。在 Rackspace 的调查中,34% 的受访者表示数据质量差是机器学习研发失败的主要原因,另有 31% 的受访者表示他们缺乏可用于生产的数据。
这突出了将机器学习技术应用于实际问题时的主要障碍之一。虽然 AI 研究社区可以访问许多公共数据集来训练和测试他们最新的机器学习技术,但在将这些技术应用于实际应用程序时,获取高质量数据并不容易。在工业、卫生和部门尤其如此,这些部门的数据通常稀缺或受到严格的监管。
当机器学习计划从研究阶段转移到生产阶段时,数据问题再次出现。在使用机器学习提取有价值的见解时,数据质量仍然是最大的障碍。数据工程问题也带来了一个重大问题,例如数据被孤立、缺乏连接不同数据源的人才以及速度不够快以有意义的方式处理数据。
Rackspace Technology 的 CTO Jeff DeVerter 表示,初创公司和老牌公司都面临数据问题,尽管规模似乎是两者之间的主要区别。DeVerter在书面评论中对TechTalks表示:“初创公司往往没有所有合适的资源来实施高质量的数据管道并随着时间的推移对其进行持续管理。” “企业通常有规模,随之而来的是所需的严?格性。”
公司为 AI 战略的数据挑战做好准备的最佳方式是对其数据基础设施进行全面评估。消除孤岛应该是每个机器学习计划的关键优先事项。公司还应该有正确的程序来清理数据,以提高机器学习模型的准确性和性能。