云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

网站空间_腾讯云短信验证码接口_12月免费

小七 141 0

在apachespark上运行两个大型在线课程

在"大数据"时代,随着数据集规模和复杂性的快速增长以及云计算的普及,数据科学技术正迅速成为大规模数据处理管道的核心组件。apachespark为分析人员和工程师提供了一个强大的工具来构建这些管道,学习构建这样的管道将很快变得容易得多。加州大学伯克利分校的两位教授正在为即将开课的加州大学的新课程而兴奋不已。这两门课程将于2015年春夏在edX MOOC平台上免费提供。edX认证证书也可收费。第一门课程名为ApacheSpark大数据简介,将教学生ApacheSpark和执行数据分析。学生将探索如何使用小数据并行编程技术。本课程将包括实际编程练习,包括日志挖掘、文本实体识别、协作过滤,这些练习将教学生如何使用PySpark(apachespark的一部分)来操作数据集。该课程也旨在帮助学生准备参加Spark认证开发人员考试。本课程由加州大学伯克利分校教授、Databricks技术顾问安东尼·约瑟夫教授授课,课程将于2015年2月23日至6月1日开始。第二门课程叫做可伸缩机器学习,介绍开发可伸缩机器学习管道所需的基本统计和算法原理,并提供使用PySpark的实际经验。它通过强调这些管道的各个组成部分,包括探索性数据分析、特征提取、监督学习和模型评估,提供了一个完整的数据处理视图。学生们将使用Spark实现基本统计模型的可伸缩算法,同时解决来自不同领域的实际问题。本课程由加州大学洛杉矶分校助理教授兼Databricks技术顾问Ameet Talwalkar教授授课,课程将于2015年4月14日至6月29日开始。这两门课程在edX网站上都是免费的。今天就可以报名参加:ApacheSpark大数据简介可伸缩机器学习免费试用Databricks。今天就开始吧