云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

虚拟主机_书目数据库_免费6个月

小七 141 0

数据块和数据税

今天,datatax和Databricks宣布合作,apachespark成为datatax产品的一个组成部分,与Cassandra紧密集成。我们非常高兴能够与Datastax一起踏上征程,原因有很多:将操作系统与分析集成Spark用户越来越多地询问我们的用例之一是创建闭环系统的能力:直接对操作数据执行高级分析,然后将这些数据反馈到操作系统中,以驱动必要的调整。Cassandra和Spark的紧密集成将使用户通过利用Cassandra作为支持在线应用程序的高性能事务数据库和Spark作为下一代处理引擎来实现这一目标,它可以提供更深入的见解,更快地在两者之间无缝移动。超越Hadoop的火花到目前为止,Spark最受关注的使用模型是在Hadoop部署中——Spark可以直接在HDFS中的数据上操作(无需先移动数据),并且本机支持Hadoop流行的资源管理器YARN和Mesos。然而,Spark的适用范围要广得多:它被设计成一个通用的大数据处理引擎,Spark/Cassandra集成就是一个典型的例子——无需将数据批量移动到Hadoop(甚至是Hadoop集群)的本地处理。此外,最近发布的SparkSQL将有助于进一步优化这种集成——Spark不仅能够直接访问存储在Cassandra中的数据,而且还能够在Cassandra本身中执行查询的选定部分。然后,它可以将生成的数据集拉入Spark中,以执行机器学习和其他高级分析。开放式创新这一伙伴关系还将两个具有非常强大的开源承诺和传统的团体聚集在一起。Databricks致力于保持Apache Spark 100%的开源,Datastax投入了大量资源来发展Apache Cassandra社区,因此,这一伙伴关系的一个关键原则就是将联合创新带回开源社区,以帮助推动Spark和Cassandra社区之间的更大整合。在我们向前迈进的过程中,寻找重要的贡献。请与我们一起参加即将到来的Spark峰会,在Datastax工程副总裁Martin Van Ryswyk的主题演讲中,进一步了解Spark和Cassandra的价值以及即将到来的其他创新。免费试用Databricks。今天就开始吧