云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

域名注册_虚拟主机到期_多少钱

小七 141 0

发布Apache Spark 1.0

今天,我们非常自豪地宣布ApacheSpark1.0的发布。apachespark1.0是Spark项目的一个重要里程碑,它带来了许多新特性和强大的API兼容性保证。这个版本对于Spark开发者社区来说也是一个巨大的里程碑:在过去的4个月中,Spark有超过110个贡献者,这是Spark迄今为止最大的版本,延续了这一趋势,使Spark迅速成为Hadoop生态系统中最活跃的项目。新功能ApacheSpark1.0最让我们兴奋的特性是什么?虽然发布版中有许多新特性,但我们想重点介绍三个。Spark SQLapachespark1.0最大的一个新增模块是sparksql,这是我们之前在博客中提到的一个新模块。sparksql与现有的Spark代码一起提供了对SQL查询的集成支持,使得编写加载结构化数据(来自Hive和Parquet等源)和运行高级分析或ETL的应用程序变得无缝。sparksql也将成为Shark未来版本的后端,提供一个更简单、更敏捷和优化的执行引擎。管理和部署apachespark1.0还包括对管理和部署的重大改进。它增加了对Hadoop/YARN安全模型的完全支持,在安全的Hadoop集群中无缝运行。它还极大地简化了作业提交,允许用户轻松地将同一个应用程序部署到一台机器、Spark cluster、EC2、Mesos或YARN上。打包和部署Spark应用程序从未如此简单!Java 8 APISpark的javaapi已经扩展到支持java8lambda表达式,允许java8用户进行更简洁的编程。Spark仍然通过旧的API支持Java6和Java7。社区成长我们对Spark社区的持续发展感到特别兴奋。ApacheSpark1.0是过去4个月里超过110个人的工作,是Spark发行版中贡献最多的一个。更令人印象深刻的是,社区的快速发展使得Spark以很大的优势成为Hadoop生态系统中最活跃的项目,也是Apache最活跃的项目之一。这种快速的创新速度允许我们以前所未有的速度添加特性、稳定性改进、优化和修复。在1.0版本发布后,Spark将针对小版本(1.1、1.2、1.3)每季度发布一次,并将根据需要继续发布维护版本,为用户提供稳定的版本。Databricks对开源的承诺在Databricks,我们很自豪能够在开放的环境下开发ApacheSpark——我们对Spark所做的每一个新特性和改进都是开源的。我们的许多发行合作伙伴都在迅速加入1.0—例如,ApacheSpark1.0将在6月份出现在CDH5.1中。更多信息这篇文章只触及了表面:apachespark1.0包含了许多这里没有提到的特性,包括对MLLib、GraphX和Spark流的重大改进。请参阅官方发布说明,以获得更详细的说明。在接下来的几周里,我们还将在这里写更多关于精选新功能的博客文章。如果你想在六月三十日参加我们的星火峰会的话。这次峰会将是迄今为止规模最大的Spark社区活动,届时将有50多个使用Spark的组织进行会谈,并进行一整天的培训。免费试用Databricks。今天就开始吧