腾讯云_distinct数据库_促销

小七 2019年10月25日 21:23 141 0

网站空间_长沙企业网站制作_三重好礼

在这段视频中，我将展示使用员工流失培训集在SAP数据智能中用Python开发的logistic回归模型的完整创建过程。然后，该模型将通过使用SAP数据智能的REST-API公开。为了创建这个演示，查淘客，我使用了Andreas Forster的一个很棒的博客，这个博客的很大一部分是在他的许可下直接从他的作品中复制的。如果在任何时候你发现自己迷失在我的演示，请回到安德烈亚斯的博客，并按照他的步骤通过。他更详细地说明了要做什么，云商城，并以更详细的方式解释了每个组件。

请注意，这里使用的数据是假的，不包含真实的信息。

我们的数据集是一个小型CSV文件，其中包含2800个假员工信息，64列各种信息，还有一列指示，职位、多项能力、薪水等……

我们试图回答的业务问题是员工流失的风险。在我们的数据集中，我们有一个列左说，如果员工已经离开了公司没有。我们将使用此列进行培训/测试，然后尝试为现有或新员工运行此列，以确定可能离开我们的员工。

在本演示中，我正在加载此数据集最小io模拟Amazon S3 bucket。我还将此数据集加载到我自己的SAP HANA数据库中，以便在SAP Data Intelligence提供的Jupyter Lab笔记本中开发我的python代码。

首先，我们需要定义将要使用的所有连接：

我们需要配置S3存储桶连接，并使其指向我们的存储桶。您可以通过单击测试连接来验证连接。

在我们加载了文件之后，我们可以开始处理我们任务的实际数据科学部分。返回到SAP Data Intelligence的主页，点击"ML Scenario Manager"。

我不会在这里详细介绍机器学习python脚本，但基本上这是我创建笔记本来执行分析的地方。我们还将在此处创建两个管道，一个用于执行模型的培训，另一个用于使用同一模型部署REST-API。

首先，我们将通过单击笔记本部分中的"+"符号来创建培训管道。

为此，我将使用Python Producer模板

然后我们需要配置管道，让它指向我们之前定义的S3 bucket。

然后我们只需要在bucket中输入csv文件的路径。

然后我们需要在Python3组件中输入python代码。

下面是我的组件中使用的代码：

退出代码，保存管道，现在我们可以训练模型了。返回到ML场景页面，选择新创建的管道。

这里一个非常重要的步骤是为Python3组件定义docker映像。这将允许我们为这个管道使用特定的库，而不会影响其他库。转到SAP Data Intelligence左侧的repository并"创建Docker文件"。

完成后，您可以输入特定的标记以与我们的Python组件一起使用。点击配置面板，输入以下信息

"opensuse"、"python36"和"tornado"。对于"tornado"，也输入版本"5.0.2"。我们还需要为此dockerfile输入一个特定的标记。我使用了"pe\u消耗"。

现在保存Docker文件并单击"构建"图标开始构建Docker映像。

等待构建成功。您可以知道如何将此docker文件用于Python组件。

为此，我们返回到图形管道，右键单击Python3组件并选择"组"。

在标记中，我们将添加先前创建的标记"pe\U磨损"。

您现在可以保存图形。

管道现在已完成，我们可以运行它。返回到ML场景，选择管道并执行它。

单击所有步骤并为模型命名。等待模型执行。

您现在可以通过我们在python代码中使用的度量来查看我们模型的结果。

如果度量的结果足够好，我们可以继续将模型部署为REST API。

返回您的ML场景并复制模型技术标识符

让我们创建第二个管道。为此，我们将使用Python消费者模板。

我们只需要更改Submit Artifact Name component"Content"值并将其更改为${modeltechnicalidentier}。正如Andreas的博客中所解释的，这个更改将使我们能够将模型的技术标识符传递给管道。

然后我将Python3组件中的代码修改为：

在我的代码中，我需要以与我的模型中相同的方式准备数据集。这就是为什么我们再次使用标准化和特征选择以及类别标记，以便以相同的方式提取这些特征。实际上，当我写博客的时候，我意识到这部分是不正确的，因为我的标签可能没有相同数量的标签。这将必须被修复…

在这之后，我们将模型应用到我们的数据集使用预测概率，以便为用户提供一个百分比的结果，为这个数据磨损的机会。

我们现在可以关闭编辑器窗口，在第一个管道中，我们需要将Python组件分配给包含所有必需库的DockerFile。右键单击Python组件并选择"Group"。然后添加您用于dockerfile的标记，在我的例子中是"pe\U损耗"。

保存更改并返回到ML场景。

我们现在可以部署此管道，为此，云服务器试用，我们将使用以前培训模型的技术标识符。

选择新创建的管道并单击"部署"图标。

完成所有步骤，当提示输入模型技术标识符时，输入模型的值。单击"保存"。

部署它，您的状态将等待几分钟

一旦它运行，复制我们部署的REST-API的URL，不要按原样尝试，它缺少一些部分。

本文地址： /shichang/64736.html