云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

微软云_网站建设找哪家公司好_测评

小七 141 0

通过Delta,Databricks旨在使数据更容易提取和处理

Databricks公司的目标是通过推出一项新的服务,使数据更易于提取和处理,该服务旨在消除处理多个数据湖、仓库和流式接收系统的许多麻烦。联合创始人兼首席执行官阿里·戈德西(Ali Ghodsi)周三在2017年欧洲星火峰会(Spark Summit Europe)的主题演讲中介绍了Databricks Delta。他说,新的统一数据管理系统将成为该公司基于云的统一分析平台的关键组成部分,该平台基于开源的apachespark大数据框架。Ghodsi说,Delta的主要优点是它消除了从这些不同来源准备数据以进行查询和分析所需的复杂提取、事务处理和加载过程。在他的主题演讲中,高德西说,他从客户那里听说,他们正在努力克服数据湖和数据仓库的局限性,特别是在数据湖和数据仓库之间移动数据的复杂过程时。"因为Delta是一个统一的数据管理系统,可以处理低延迟流数据和批处理过程,它使企业能够大大简化其数据架构。"。Databricks Delta通过使数据在不同的体系结构之间移动变得更容易来做到这一点。它的作用之一是通过允许使用称为Delta表的东西作为数据源和接收器来简化数据管道。Delta表用于在一个数据集上运行多个批处理作业和流式作业时提供事务性保证,从而允许数据仓库返回连续更改数据的最新一致视图。Databricks Delta做的第二件事是自动化数据的存储方式,这样客户就不需要在查询不同的数据集之前浪费时间手动调整他们的系统。Delta优化了数据的存储方式,将通常查询的数据集集中在同一个位置,以加快访问速度。该公司说,它还压缩了这些文件,这样可以更有效地读取它们。这种智能的数据跳过和索引过程意味着,在第一次访问数据之后,后续访问速度将提高一个数量级。Ghodsi解释说,实际上,Databricks Delta是Spark环境的一个新的数据管理层,它将数据湖的规模和成本效率、数据仓库的查询性能以及流式接收系统的低延迟合并到一个系统中。Delta现在可以通过标准的apachespark应用程序编程接口与Databricks统一分析平台集成。图片:Kamiphoc/Flickr既然你来了…点击订阅我们的YouTube频道(见下文),显示您对我们使命的支持。我们的订户越多,YouTube就越会向你推荐相关的企业和新兴技术内容。谢谢!支持我们的使命:>>>>>立即订阅我们的YouTube频道。……我们还想告诉你我们的使命,以及你如何帮助我们完成它。SiliconANGLE Media Inc.的商业模式是基于内容的内在价值,而不是广告。与许多在线出版物不同的是,我们没有付费墙或横幅广告,因为我们想让我们的新闻保持开放,不受影响,也不需要追逐交通。那个新闻、报道和评论SiliconANGLE——以及现场报道,我们的硅谷工作室和cube环球巡演的视频团队提供的未经剪辑的视频需要大量的辛勤工作、时间和金钱。保持高质量需要赞助商的支持,他们与我们的无广告新闻内容的愿景一致。如果你喜欢这里的报道,视频采访和其他无广告内容,请花点时间看看我们的赞助商支持的视频内容样本,在推特上表达你的支持,然后继续回到SiliconANGLE。