云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

腾讯云_distinct数据库_促销

小七 141 0

网站空间_长沙企业网站制作_三重好礼

在这段视频中,我将展示使用员工流失培训集在SAP数据智能中用Python开发的logistic回归模型的完整创建过程。然后,该模型将通过使用SAP数据智能的REST-API公开。为了创建这个演示,查淘客,我使用了Andreas Forster的一个很棒的博客,这个博客的很大一部分是在他的许可下直接从他的作品中复制的。如果在任何时候你发现自己迷失在我的演示,请回到安德烈亚斯的博客,并按照他的步骤通过。他更详细地说明了要做什么,云商城,并以更详细的方式解释了每个组件。

请注意,这里使用的数据是假的,不包含真实的信息。

我们的数据集是一个小型CSV文件,其中包含2800个假员工信息,64列各种信息,还有一列指示,职位、多项能力、薪水等……

我们试图回答的业务问题是员工流失的风险。在我们的数据集中,我们有一个列左说,如果员工已经离开了公司没有。我们将使用此列进行培训/测试,然后尝试为现有或新员工运行此列,以确定可能离开我们的员工。

在本演示中,我正在加载此数据集最小io模拟Amazon S3 bucket。我还将此数据集加载到我自己的SAP HANA数据库中,以便在SAP Data Intelligence提供的Jupyter Lab笔记本中开发我的python代码。

首先,我们需要定义将要使用的所有连接:

我们需要配置S3存储桶连接,并使其指向我们的存储桶。您可以通过单击测试连接来验证连接。

在我们加载了文件之后,我们可以开始处理我们任务的实际数据科学部分。返回到SAP Data Intelligence的主页,点击"ML Scenario Manager"。

我不会在这里详细介绍机器学习python脚本,但基本上这是我创建笔记本来执行分析的地方。我们还将在此处创建两个管道,一个用于执行模型的培训,另一个用于使用同一模型部署REST-API。

首先,我们将通过单击笔记本部分中的"+"符号来创建培训管道。

为此,我将使用Python Producer模板

然后我们需要配置管道,让它指向我们之前定义的S3 bucket。

然后我们只需要在bucket中输入csv文件的路径。

然后我们需要在Python3组件中输入python代码。

下面是我的组件中使用的代码:

退出代码,保存管道,现在我们可以训练模型了。返回到ML场景页面,选择新创建的管道。

这里一个非常重要的步骤是为Python3组件定义docker映像。这将允许我们为这个管道使用特定的库,而不会影响其他库。转到SAP Data Intelligence左侧的repository并"创建Docker文件"。

完成后,您可以输入特定的标记以与我们的Python组件一起使用。点击配置面板,输入以下信息

"opensuse"、"python36"和"tornado"。对于"tornado",也输入版本"5.0.2"。我们还需要为此dockerfile输入一个特定的标记。我使用了"pe\u消耗"。

现在保存Docker文件并单击"构建"图标开始构建Docker映像。

等待构建成功。您可以知道如何将此docker文件用于Python组件。

为此,我们返回到图形管道,右键单击Python3组件并选择"组"。

在标记中,我们将添加先前创建的标记"pe\U磨损"。

您现在可以保存图形。

管道现在已完成,我们可以运行它。返回到ML场景,选择管道并执行它。

单击所有步骤并为模型命名。等待模型执行。

您现在可以通过我们在python代码中使用的度量来查看我们模型的结果。

如果度量的结果足够好,我们可以继续将模型部署为REST API。

返回您的ML场景并复制模型技术标识符

让我们创建第二个管道。为此,我们将使用Python消费者模板。

我们只需要更改Submit Artifact Name component"Content"值并将其更改为${modeltechnicalidentier}。正如Andreas的博客中所解释的,这个更改将使我们能够将模型的技术标识符传递给管道。

然后我将Python3组件中的代码修改为:

在我的代码中,我需要以与我的模型中相同的方式准备数据集。这就是为什么我们再次使用标准化和特征选择以及类别标记,以便以相同的方式提取这些特征。实际上,当我写博客的时候,我意识到这部分是不正确的,因为我的标签可能没有相同数量的标签。这将必须被修复…

在这之后,我们将模型应用到我们的数据集使用预测概率,以便为用户提供一个百分比的结果,为这个数据磨损的机会。

我们现在可以关闭编辑器窗口,在第一个管道中,我们需要将Python组件分配给包含所有必需库的DockerFile。右键单击Python组件并选择"Group"。然后添加您用于dockerfile的标记,在我的例子中是"pe\U损耗"。

保存更改并返回到ML场景。

我们现在可以部署此管道,为此,云服务器试用,我们将使用以前培训模型的技术标识符。

选择新创建的管道并单击"部署"图标。

完成所有步骤,当提示输入模型技术标识符时,输入模型的值。单击"保存"。

部署它,您的状态将等待几分钟

一旦它运行,复制我们部署的REST-API的URL,不要按原样尝试,它缺少一些部分。