云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

云主机_阿里云域名购买_怎么样

小七 141 0

关于智能企业机器学习框架的四个系列中的第一部分。阅读第二部分、第三部分和第四部分。

机器学习(ML)过程必须是可靠的,并且可以被没有ML背景的人(公民数据科学家和商业用户)以及数据科学家重复。

在交付ML项目时使用项目框架是非常重要的。该框架应:

提供记录项目进展过程、挑战和其他经验的基本结构允许复制项目为项目规划和管理提供帮助,使项目取得令人满意的结果成为新用户的"安慰因素"减少对机器学习项目团队中"明星"的依赖,因此项目可以由任何团队成员继续或复制

最常用的框架是跨行业数据挖掘标准流程(CRISP-DM)。这是1996年发起的一项倡议,云服务器吧,由五家公司领导:SPSS、Teradata、Daimler AG、NCR Corporation和OHRA(一家保险公司)。300多个组织参与了该过程模型。

目标是创建一种以数据为中心的项目方法:

非专有应用/行业中立刀具中性专注于业务问题和技术分析

CRISP-DM方法是一个层次化的过程模型:

在顶层,过程分为六个不同的通用阶段,从业务理解到项目结果的部署。下一个层次将详细说明这些阶段中的每一个,移动大数据,包括几个通用任务。在这个层次上,描述足够通用,可以涵盖所有数据科学场景。第三级专门针对特定情况执行这些任务。例如,通用任务可能是清除数据,而专用任务可能是清除数值或分类值。第四个层次是过程,记录DM项目实际执行的行动、决策和结果。

图中表示了6个通用阶段:

1)业务理解

从业务角度确认项目目标和要求。定义将回答特定业务目标的数据科学方法。

2)数据理解

初始数据收集和熟悉识别数据质量问题

3)数据准备

数据表、记录和属性的选择承担

4)建模

建模技术选择所需的任何数据转换和清洗模型参数校准和模型建立

5)评估

确认业务目标已实现

6)部署

部署模型,必要时"生产化"开发和实施一个可重复的过程,使组织能够监控和维护每个模型的性能。

当然,在部署解决方案后,该过程将继续。在这个过程中吸取的经验教训可以引发新的、通常更为集中的业务问题,随后的数据科学过程将受益于以前的经验。这一点用圆形箭头表示。

自从CRISP-DM于1996年首次构思以来,已经发生了许多变化,特别是在大数据、ML使用方面,20年前,大型、快速变化的数据集、流式数据、实时输出和自学习模型还不是数据挖掘领域的一部分。另外,trustdata大数据,CRISP-DM没有足够详细地涵盖模型部署和监控的重要方面,因此,交付许多现代ML项目的需求与这个旧框架不太匹配,我将介绍一个新的框架,大数据的,它能很好地与智能企业中的现代ML项目配合使用。

了解更多信息

要深入了解您的业务的智能可能性,请回顾2018年8月Forrester Consulting的研究,该研究通过AI、机器学习和预测分析为智能企业提供动力,大数据的趋势,由活力。