@lsmn 2018-03-10T02:03:30.000000Z 字数 1595 阅读 2215

为孩子和开发团队解密机器学习

AI ML 机器学习 Dev

摘要

Rob Harrop在Qcon伦敦大会上做了“面向软件工程师的AI和ML”的主题演讲，他谈到，ML经常躲在开发团队和数据科学团队之间的高墙背后。ML被神秘的光环环绕，开发人员经常因为无法提升自己的能力而苦恼。来自IBM的Dale Lane在Sponsor Stream里介绍了他如何让ML不再神秘，使孩子也可以使用。

正文

QCon 2018伦敦大会于3月5日举行，Rob Harrop做了“面向软件工程师的AI和ML”的主题演讲。按照Harrop的说法，机器学习知识经常躲在开发团队和数据科学团队之间的高墙背后。这种分割导致开发出的模型脱离了对数据的理解及其底层领域。而且，由于这种分割的存在以及ML被神秘的光环环绕，所以软件团队经常无法提升自己的能力。Dale Lane在Sponsor Stream里介绍了他如何让孩子通过可用的声明式工具使用ML，并针对ML的极端情况进行实践指导。

Harrop是Skipjaq的首席技术官，也是SpringSource的最初创始人。他在QCon 2018伦敦大会上的主题演讲可以通过qcon.ai观看。他着重指出，这再次引入了在各自为政的专家之间交接工作的危险；这次是在数据专家和希望使用ML功能的团队之间。Harrop谈到，由于数据专家不了解开发团队的有界上下文所处的业务环境，所以，在和他们合作时要防止引入偏见。

Lane是IBM的一名开发人员，也是大会的发起人之一。他提供了一个实验性工程ml-for-kids，让孩子们可以使用基于Web的工具学习机器学习。ml-for-kids基于MIT的Scratch构建，这是一个用于编程教学的可视化平台。它提供了实用的界面，让孩子们可以创建可编程的流程，并加入ML功能。有一个简单的界面让用户可以训练用于图像识别、自然语言处理（NLP）、情感分析及检测其他模式的模型。

Lane通过实际的例子介绍自己如何使孩子意识到数据质量问题，如过拟合或引入数据偏见。他举了一个为主题公园或游乐场训练推荐模型的例子，使用了一个有利于游乐场的数据集来授课。由于结果模型对游乐场过度拟合，所以Lane能够建议孩子们思考个人生计与企业成功的道德后果。鼓励孩子们考虑救命药物的建议，他在故事中介绍了孩子在面对此类数据偏见时如何更好地了解其道德意义。

Harrop提到了欧盟的《通用数据保护条例》所带来的问题，很快，组织使用那些区分个人信仰、宗教背景、种族、性取向或政治倾向的数据将不再合法。他特别指出，模型可能仍然会继续学习固有的模式，运用类似的偏见，即使对数据预先过滤，仍会如此，这很危险。为此，Harrop建议，开发人员必须要设计和测试一种没有意外偏见的解决方案。他认为，“有关机器学习的所有社会学问题，偏见是最重要的一个。”

Harrop和Lane都谈到了社会上对机器学习的神秘化。Harrop提醒说，通常，人们关注的是，机器学习需要了解底层理论的数据专家，其实，大多数情况下，使用ML只是另外一种软件工程活动。回答了Lane提出的问题“非技术出身的老师如何通过ml-for-kids框架理解、传授并有效的利用适用的ML”，就进一步降低了进入门槛。

Harrop在演讲总结中指出，机器学习是一个重要的竞争优势，但是，其核心主要是软件工程。他提醒听众要避免再犯老错误：

不要再尝试分别设立数据科学团队和软件团队。把它们放在一起。确保每个人都知道其他人在干什么。

Lane分享了一些可以随时访问的Web ML平台，不管是孩子，还是大人，都可以开始在上面做试验：

查看英文原文：Demystifying ML for Children and Dev Teams

为孩子和开发团队解密机器学习

摘要

正文

内容目录