云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

腾讯云_ed2k服务器_免费领

小七 141 0

这是日立集团公司Pentaho委托的一个赞助职位。赞助人帖子是指所有页面上都出现的付费帖子SiliconANGLE.com网站,支持编辑工作。有关定价和咨询,请发送电子邮件赞助人@siliconangle.com。在进入四年制大学课程的美国人中,不到三分之二的人在六年内毕业。30%的人甚至第一年都没完成。居高不下的大学辍学率仍然是美国最棘手的教育问题之一。尽管美国是世界上最大、最多样化的大学教育体系之一,但在经济合作与发展组织(oecd)追踪的18个发达经济体中,美国的毕业率排在最后。一个社区学院系统认为,通过预测分析驱动的方法解决问题已经步入正轨。它正在学习发现失败的警告信号,以便早期干预能够让学生回到正轨。从早期的结果来看,它可能只是一些东西。常春藤理工社区学院是一个覆盖印第安纳州的由近120个校区和卫星位置组成的庞大网络。这是美国最大的单独认证的社区学院,每年有近17.5万名学生。一个庞大的系统会产生大量的数据——每天大约有1亿条新记录。常春藤科技公司正在使用自助分析技术来突破瓶颈,将信息送到需要它的人手中。常春藤理工大学无视教育机构是技术落后者的普遍看法。2015年,该校成为全国第九所任命首席数据官的高等教育机构,也是有史以来第一所任命首席数据官的社区学院。这段旅程始于五年前,当时利格·亨斯利(Lige Hensley)签约担任首席技术官,其任务是使信息技术组织更能响应业务需求。在他看来,关键是要打破教育工作者和他们完成工作所需信息之间的障碍。自助服务将是解药。数据民主化他说:"我们相信,我们可以建立一个‘数据民主’,赋予以数据为基础的决策权,加快制度进程,加快创新。"。这意味着要建立一个数据仓库,但常春藤科技改造的一个更重要的因素是改变它处理数据的方式。2010年,该学院只有22名员工担任决策支持或数据研究角色,只有225人被授权撰写报告。因此,这些报告通常需要数小时才能运行,假设甚至可以获得最新的信息,而事实往往并非如此。沮丧的管理者被迫依靠直觉做出太多决定。他说:"在许多大学,你必须登录四到五个系统,然后把报告转储到Excel中,这样才能理解它们。"我们有40到50套这样的系统,如果你想知道约翰尼在学生时代的表现,那就祝你好运吧。"布伦丹·奥尔德里奇(Brendan Aldrich)两年前开始担任首席数据官,他和亨斯利一样热衷于数据民主化。他说,创建一种分析文化,不仅仅是获取信息数据应该是有用的,并且随着时间的推移而不断发展,而不需要人们不断地回到IT或分析团队。"经过详尽的征求建议书过程,学院选择了Pentaho公司的数据集成和业务分析平台作为解决方案。Pentaho将数据集成和分析与自助服务方法结合起来,与机构的需求很好地吻合。作为一个开放源代码平台,Pentaho提供了可嵌入到现有应用程序中的基于web的用户界面,它提供了所需的灵活性和功能性,而无需昂贵的桌面许可证。这一点很重要,因为奥尔德里奇和亨斯利设想他们的用户数量将扩大到数千人。小团队,大创意通过利用这个新的新技术基金会,仅有三名工程师和六名分析师的团队可以提供数据民主,授权更快、更明智的决策。这个系统被称为"New"(代表"New things"),它基于一个概念,即从多个内部和外部系统收集与特定功能相关的数据,如助学金、学生档案和应付帐款。在过去的三年里,常春藤科技公司的数据科学家和公民分析师已经建立了大约40个这样的集合,而且更多的集合一直在线。每天大约有1亿行数据流入仓库,随着更多系统的上线,预计会有更多的数据流。Aldrich和Hensley的愿景是颠覆传统的数据仓库模型。NewT并不是将专业知识孤立在少数技术奇才手中,而是让几乎所有需要分析的员工都能使用。12名员工分析专家在全州范围内分散开来,教员工如何与数据进行交互和可视化分析。去年,他们在短短六个月的时间里培训了3000多人——约占学院总劳动力的三分之一。数据民主化是一种授权,但同时也带来了责任。每个集合的所有者负责确保数据质量和一致性,并应用一组通用的治理原则。授权数据所有权是有意义的。"一个长达40年之久的数据集要想保持一个完整的数据集要比编写一个长达40年的数据集要容易得多。将数据质量控制进一步提升到价值链的上游也是如此。Ivy Tech的另一次突破是将数据准备和清理从仓库转移到生产中。"奥尔德里奇说:"每个人都试图清理仓库中的数据,而不是将数据放在前端系统中。"我们的理念是,如果数据不干净,让我们看看,这样我们都可以修复它。"每个功能区使用基于一组通用定义的一致词汇表,以及如何使用它们的注释。这些注释发布在wiki上,wiki与Pentaho之间有一个桥梁,因此数据定义与数据本身集成在一起。当用户将鼠标移到数据元素上时,wiki中的定义会立即弹出。基本报告很简单。用户可以将数据元素拖放到现有模板、报表、图形和仪表板中,而无需IT部门或特殊分析团队的帮助。每个部门都有一套常用的基本报告和模板,供新员工使用,同时鼓励员工创建新模型,并通过受管理的公共文件夹彼此共享。报告可以在用户、部门甚至整个州立大学系统之间共享。数据民主的回报几乎立竿见影。一份报告发现了2800份学生已经获得但并不知道的证书和学位。因为学院为每一个毕业的学生都会从国家获得资金,这些无人认领的证书加起来就有560万美元的资金,这比整个分析项目的资金还要多。但真正的突破性项目还没有到来。学生失败的原因2014年,Ivy Tech时任总裁托马斯·斯奈德(Thomas Snyder)向分析团队提出挑战,要求他们将预测分析应用于降低故障率的任务中。汉斯莱灵机一动。教育机构通常按人口统计学对学生群体进行分类。如果他们用行为特征来解决问题呢?如果某些行为与失败有关联,那么学生就可以在这个过程的早期被拦截,并帮助他们回到正轨。在接下来的两年里,研究小组对数百种行为因素进行了梳理,以找出那些似乎与不及格成绩最密切相关的因素。由于学生群体和学术课程的特点在各州差异很大,该模式必须足够灵活,以适应不同地区的不同标准。通过不断的迭代和测试,对每个区域的行为模型进行了微调。这些筛选结果显示,在2016年秋季学期的前两周,有超过16000名学生面临着一门或多门课程不及格的高风险。数百名志愿者被招募来给学生打电话和面试,每次谈话的结果都以网络形式记录下来。最终有5000多名学生接受了采访。结果带来了一些意外。研究人员预计他们的推广工作会遇到阻力,但大多数学生听到学校的消息都很高兴。"他们无法相信像我们这样规模的机构对他们个人如此感兴趣,"奥尔德里奇说。他们还惊讶地发现,失败与一系列广泛的因素有关,其中许多因素超出了学院的直接控制范围。其中包括健康问题、交通困难和儿童保育方面的挑战。面试被调整为引导学生寻找有帮助的资源。最终的回报出现在期中考试,成绩为D和F的学生人数比上一个秋季学期下降了3.3%。这是该学院有史以来最大的单年降幅。这一比例听起来可能很小,但它转化为3100多名能够继续学习而不是辍学的学生。更妙的是,报考下一个春季学期的学生人数猛增了5%,这使得他们更有可能完成学业。更高的毕业率不仅意味着增加了对大学的资助,而且对印第安纳州的整体经济也有好处,因为大学毕业生的平均年收入比只有高中文凭的学生高出60%以上。这些只是第一年的结果。随着计划的完善,辍学率应该会继续下降。学院最近在首席数据官办公室增加了一个新的数据战略家职位,致力于分析的积极应用。这些数据专业人士