@sambodhi
2018-03-16T17:37:28.000000Z
字数 1826
阅读 1658
作者|Toni Manzano
译者|Sambodhi
编辑|Natalie
AI前线导读:要问21世纪最性感的职业是什么,数据科学家绝对能够上榜。所谓数据科学,就是从数据中提取知识的研究。它集成了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、机器学习、计算机编程、统计学、数据工程、模式识别和学习、可视化、不确定性建模、数据仓库,以及从数据中析取规律和产品的高性能计算。数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。在工业4.0的浪潮之下,数据科学家又应该是什么样的呢?让我们看看Toni Manzano在Data Science Central发布的文章Data Scientists 4.0,明确新时代的数据科学家需要做什么。
更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)
自从汉诺威工业博览会(Hannover Fair)在2011年提出第四次工业革命以来,从那时起,围绕着所谓的工业4.0出现了许多新事物。例如数字孪生(Digital Twins)、工业物联网或信息物理系统之类作为独立的元素出现,为许多制造领域的范式转换(paradigm shift)提供了必要的要素。其中,最具开拓性的与预测分析和人工智能相关,几年前未能解决的实际问题得以迎刃而解。预见性维护、人工视觉和模式识别机制可以实时识别潜在故障,这都是新行业应用中实际用例中的几例。
因此,为了利用60年代创建的算法将信息转化为知识,数据科学成为业界很有价值的工具。在理解企业活动的新方式中,数据科学家发挥着基础性的作用。当数据工程师必须面对行业中的问题时,新的挑战出现了:他们必须处理未知的过程、程序、操作、科学和特定的决疑(casuistry),这些都是他们正在寻找的答案。因此,数据科学家们就像侦探一样,在每个项目中都在不同的犯罪场景里发展他们的技能。他们必须将一组新的多学科技能添加到自己的专业知识中,以便为每个问题的专业分析提供所需的附加价值。
每个行业都需要不同的机器学习和深度学习系统才能从可用信息中获益。零售行业是完全以顾客为导向的,其背后的机会是买家的偏好和需求、及时交付和库存最小化。自然语言处理和媒体分析作为工具被广泛接受,为最终消费者提供有吸引力的建议。考虑到金融科技的需求,数据科学家必须根据各种医疗和健康风险指标,实时调整商业交易的欺诈检测、汇总和异常检测或保险策略的特定算法。然而,工业4.0定义的制造活动更为复杂。例如,汽车行业与供应商和装配链(人类和机器人)进行交互,降低了仓储成本,而市场需求必须满足自动驾驶支持、智能安全和舒适性要素的最新技术。
生物技术和制药行业是广义制造业中的一个特例。医学和药物制造在现有复杂性的基础上增加了监管要求,这些要求在某种程度上阻碍了技术进步和创新范式转换。原因是,该领域中,人类的安全必须始终放在第一位。当在工厂设计和实现过程中,在许多情况下,它们都要受到严格的质量控制,因此必须尽量减少可变性(variability)。在这个观点下,很难验证基于像随机森林(Random Forest)等算法提供结果的操作。尽管存在这样的现实,但重要的是要注意一些机器学习算法已经被欧洲药典所接受,作为处理分析数据集的有效化学计量技术。
另一方面,管理机构和监管机构正在慎重观察,并立法规定,明确必须管理通过人工智能算法获得的数据、过程和结果。因此,新一代的数据科学家和技术专家得以诞生,为监管咨询或立法顾问指明了方向,为协商一致的数据管理开辟了新的道路。当来自人工智能算法的策略应用于航空、汽车、医学或制药等,并可能会影响人们的健康时,必须对整个过程进行监控,以确保个人数据完整性。
智能产业引发了社会向制造业和商业领域的推动。人类和设备生产的大量数据迫使特定的技术突破出现,以管理和处理网络中可用的异构信息。图像、位置信息、社交媒体数据、交通状况、预测、股票趋势或文件必须实行实时访问,以及正在寻找主题的相关建议。这种持续不断的知识流动随时可消费,已经成为不可或缺的商品。工业4.0所提供的独特特性,要求专家必须向习惯于知识消费的社会提供内容,还要注意一种新产品,它正被数据科学包装为分布式产品的附加价值。数据科学家必须熟悉应用于数据生态系统上的算法,这一点要求同时具备多学科和专业知识。他们肩负着艰巨的使命,就是如何满足日益增长的无处不在的数据科学服务的需求。