云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

虚拟主机_手机qq下载文件存储位置_免费1年

小七 141 0

一个ML经理,一个数据科学家和一个产品工程师接到一个Zoom电话…

在最好的情况下,构建软件或产品功能可能是具有挑战性的,即使是使用包含大量开发人员的已定义工作流。现在,随着流行病迫使公司在软件开发和自动化方面取得快速进展,项目管理似乎令人望而生畏。想象一下,在一个封闭的过程中,必须开发一个机器学习产品或特性。如果分布式团队仍然是一个突出的工作场所特征,并且办公室要被重新想象,那么公司就需要重新调整自己的方向,以适应新现实中的复杂项目。去年,我有机会领导了一个机器学习项目,以构建一个智能的重复数据消除工具,该工具可以删除阻塞数据库的重复和错误数据。这个需要大规模部署的工具是Freshworks团队在印度钦奈办公室外构建的最早的项目之一。我从那次练习中学到了很多。在这个博客中,我特别研究了为一家产品公司开发机器学习功能。例如,电信公司基于呼叫活动的客户流失预测功能,或客户关系管理产品制造商的潜在客户评分。在面向消费者的方面,考虑一个社交媒体平台的新闻提要排名算法,或者一个视频流服务的推荐引擎。(服务和咨询公司的ML项目的工作流程可能会有很大的不同,本博客将不介绍这些工作流程。)机器学习项目需要一种不同于常规软件和产品特性开发的方法。构建ML特性涉及到对数据的实验以及大量工程开发。每一个成功的实验都会使未来的ML特性项目朝着新的方向发展。但正因为如此,我们确实看到了数据科学家和工程师之间的摩擦。工程师不喜欢不得不适应数据科学家不断变化的需求。数据科学家对阻碍他们将改进模型投入生产的任何障碍都感到沮丧。产品团队需要一个对客户有效并能同时扩展的特性。挑战在于如何将这些项目管理得完美,同时保持微妙的平衡。利用摩擦软件开发项目通常涉及产品经理、后端开发人员、前端开发人员和软件负责人,他们的角色定义广泛。大多数组织都有软件来跟踪和管理他们的工作。机器学习项目包括一些额外的专业利益相关者数据科学家和机器学习工程师。在某些组织中,两个角色由同一个人担任。当这么多高度专业化的工程师聚集在一起进行一个项目时,摩擦是不可避免的。渴望,甚至。复杂的交战需要摩擦。挑战在于如何利用这些能量来顺利高效地执行任务。首先,您需要明确定义产品经理、数据科学家、机器学习工程师以及其他相关人员的角色和职责。作为机器学习团队的经理,我的职责主要是为ML工程师和数据科学家创造一个与产品工程师合作的协作环境。这是为了给每个利益相关者提供尽可能多的清晰性和独立性,并使他们能够在游戏中处于领先地位。很多时候,由数据科学家构建的复杂模型无法在时间范围内进行工程设计。在定义角色和职责时,我需要考虑ML项目中经常出现的此类挑战。分层项目工作流将任何软件或特性开发项目分解成更易于管理和跟踪的小任务。这些将构成项目工作流的构建块。根据我在机器学习项目中的经验,我设计了一个工作流程,它也适用于其他类似的项目。在Freshworks,这个框架与ML/AI项目特别相关,比如涉及我们的人工智能平台Freddy的项目。提供预测性见解、自动化重复性任务、发现新机会的项目,以便客户能够利用人工智能的力量。我把工作流程分为五大类。1定义问题对手头任务的明确陈述对于使所有利益相关者与项目任务保持一致至关重要。在机器学习经理的帮助下,项目经理不应该仅仅定义问题和成功指标,还应该翻译并使它们与每个涉众相关。2数据探索与质量这是机器学习团队最重要、也是最被忽视的活动。你越是挖掘你的数据源,你的最终产品就会越容易越好。数据科学家和ML工程师应该在这里扮演标签团队。这一阶段将为项目的其余部分设定节奏。三。建模这个阶段是数据科学的重头戏,包括数据科学家所做的所有实验和建模。从产品开发的角度来看,确定如何以及何时停止试验是至关重要的,这样工程师就可以接管了。数据科学家需要确保模型不会太复杂而无法在项目的时间表内部署。4生产电离这是所有利益相关者再次会面的关键阶段。时间线、模型精度和工程合同现在应该重新审视并最终确定。这里发生的一个关键步骤是从数据科学家到机器学习工程师的代码移交。一旦编写了框架/代码的第一个版本,ML工程师应该向数据科学家解释它。从这里开始,对模型或特征工程的任何增量更改都应该是数据科学家可以实现的。这是这两个利益相关者之间典型的摩擦点。5质量检查一般来说,这一阶段的质量检查有两个方面:1确保生产代码和先前完成的实验之间的模型精度相同;以及2确保面向客户的界面与后端ML工程框架顺利工作。你完了!我希望这个用于建模ML项目工作流的框架对于团队导航新工作区的轮廓非常有用。虽然这个博客关注的是产品或功能开发的一个特定方面,但它提供了一个可以用于其他复杂协作的无障碍模板。尤其是如果与项目中的关键利益相关者联系的唯一方式是虚拟的。 [合著者:费罗兹·贾马尔]相关岗位Ruby中字符串插值的优化传递快乐并以毫秒追踪