@sambodhi 2018-10-29T06:26:38.000000Z 字数 3747 阅读 3346

如何检查你的项目是否需要人工智能？

作者 | Cassie Kozyrkov
译者 | Sambodhi
编辑 | Natalie

AI 前线导读： 过去几年，机器学习和人工智能日新月异，在各行业都呈现火爆的态势。你是不是也跃跃欲试，想在自己的项目里也用上人工智能呢？且慢，让我们听听来自 Google 的首席决策情报工程师 Cassie Kozyrkov 的看法，她兴趣爱好广泛，涵盖了统计、机器学习 / 人工智能、数据、决策科学、艺术、戏剧等等，在自己的博客发表了大量的观点。今天 AI 前线翻译了她最新的博文Is your AI project a nonstarter?（《如何检查你的项目是否需要人工智能？》），相信看完她的文章后，你就能够评估自己的项目，到底需不需要加上人工智能。

这是一份现状核实清单，可以帮助你避免学习困难的痛苦。

如果你要深入研究机器学习或人工智能项目，在深入研究算法、数据和工程之前，你需要先参考这份清单。你可以把这份清单想象成盒子里友好的顾问。

AI 前线注：机器学习可参阅作者的另一篇文章：The simplest explanation of machine learning you’ll ever read（《机器学习极简解释》）（http://u6.gg/fpMkp）关于人工智能，可参阅作者的这篇文章：Are you using the term ‘AI’ incorrectly?（《你是否用错了“人工智能”这词？》）（http://u6.gg/fpMnU）

记住，千万不要浪费时间，不要为了 AI 而 AI。促使你想要应用人工智能的原因，应该是它能够为你做什么，而不是为了听上去有多么科幻。

本文是作者的博文 The ultimate guide to starting AI （《启动 AI 项目的终极指南》）（http://u6.gg/fpNnq）的超短版本。如果你准备使用机器学习或人工智能，我们希望，对于本文所列的所有问题，你的回答都是 “Yes”。

AI 前线注：为什么要使用机器学习或人工智能，作者写了一篇文章 Machine learning — Is the emperor wearing clothes? （《机器学习其实只是“皇帝的新衣”》）（https://mp.weixin.qq.com/s?src=11&timestamp=1540792326&ver=1211&signature=e8SZUaDzQr2*07c2nB-kUOBhxpCD1-cVOL903LTt8TsxbO3D4PdgidIJf6OCqrK-Q5OqbqHJECFyJRm7RFxPTw2buFrmhQjHfs8ZDpJKM*kOyywRHnAIHTxSQiI2spJr&new=1）娓娓道来，深入浅出，你可以看看。

如果这份清单里有任何一个问题你的回答是 No，那么你都不适合将 AI 用到你的项目中，否则你的项目就会像这幅图片里的牛一样被卡住。

开始机器学习 / 人工智能的第一步，共 22 部分：输出、目标和可行性。

把做决策的工作交给正确的人： 负责你的项目并完成这份清单的人员是否真正了解你的业务？

将决策权委托⁽¹⁾给精通业务的人员，而不是平庸的算法书呆子。
以输出为中心的构思：你是否能够解释你的系统输出⁽²⁾是什么，以及为什么这些输出是值得去做的？

首先关注你在做什么，而不是怎么做；不要把目标和手段混为一谈。
灵感来源：你是否至少考虑过将数据挖掘⁽³⁾作为从潜在的使用案例中获取灵感的一种方法？

虽然这不是强制性的要求，但是它可以有助于找到一个好的方向。
适合机器学习 / 人工智能的任务：你是否自动化了许多决策 / 标签？是否每次当你无法找到完美的答案时，都要使用机器学习 / 人工智能来帮忙？

如果你的答案是 “No”，那么这就是一个相当清晰的信号，表明机器学习 / 人工智能不适合你。
用户体验视角：你是否能够明确谁是你的目标用户？他们将如何使用你的输出？

如果你没有及早考虑用户，那么你将会受到低劣设计的影响。
伦理发展：你是否考虑过你创造出来的东西可能会影响到哪些人群？

这点对于具备快速扩展潜力的技术尤为重要。
合理预期：你是否理解你的系统可能非常出色，但它不会是完美无瑕的？你是否能够忍受你的系统偶尔会出错？

从伦理学的角度来看，你有没有想过这点意味着什么？
生产中可能的情况：无论这些决策 / 标签来自何处，你是否能够在生产中为其提供服务？你是否能够按照预期的规模来集中工程资源？
需要学习的数据：是否存在潜在有用的数据？你能获得它们的访问权限吗？

如果数据不存在，也没有关系，只要你有尽快获得数据的计划就好。
足够的样本：你是否咨询过统计学家或机器学习工程师⁽⁴⁾，你所拥有的数据量是否足够用来学习？

这里说的足够，不是以字节来衡量的，所以要与那些直觉良好的人多聊聊，由他们来操作。
计算机：你是否有足够的处理能力来处理数据集大小？

对于任何愿意考虑使用云技术的人来说，云技术都是自动的，无需考虑计算机处理能力的问题⁽⁵⁾。
团队：你是否有信心组件一支具备必要技能的团队？⁽⁶⁾
真相：除非你使用无监督学习⁽⁷⁾，否则，你是否能够获得输出？

如果不能，你是否愿意支付薪水，雇佣人员为你一遍又一遍地执行任务？
日志完整性：你是否可以判断哪些输入与哪些输出相匹配？
日志质量：你是否相信数据集实际上就是其提供者所声称的数据集？

要从样本中学习，你需要质量很好的样本来源。
无差异曲线：由于你的系统会出错，你是否考虑过一种错误相对于另一种错误更槽糕⁽⁸⁾？
模拟：你是否考虑过与模拟⁽⁹⁾专家合作，以帮助你将你所要求的的内容进行可视化？

这不是强制性的，但是很有用。
度量标准创建：你是否将单个输出的得分拼接为多个实例中系统业务性能的度量标准？⁽¹º⁾
度量评估：你的业务绩效是否经过评估，以确保不会以某种有悖常理和有害的方式⁽¹¹⁾获得良好的得分？
度量损失比较：（可选）你的业务绩效是否与标准损失函数⁽¹²⁾相关⁽¹³⁾？

如果不相关，你的要求可能会很难达成。
总体：你是否仔细考虑过你的系统正常工作需要包含哪些实例⁽¹⁴⁾？

被测量的总体⁽¹⁵⁾定义了系统性能测试将涵盖的广泛实例集合。
最低性能：你是否为测试定义了严格的最低性能标准⁽¹⁶⁾，如果你的系统没有达到这个标准，你就会摧毁这个系统。