云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

微软云_企业邮箱多少钱_新注册优惠

小七 141 0

大数据公司Databricks Inc.希望帮助企业更快地挖掘其海量数据,因此今天它为基于云的数据湖推出了一个新的、高性能的查询引擎。该公司还宣布收购一家名为Redash Ltd.的以色列初创公司,该公司已经建立了一个开源仪表盘和可视化工具,以帮助数据科学家更容易地探索他们的数据。新的Delta引擎工具旨在与Databricks的Delta Lake配合使用,Delta Lake是去年推出的开源结构化事务层,旨在提高企业数据湖的效率。数据湖是以自然格式存储的数据的系统或存储库,通常是对象"blob"或文件。它们通常充当所有企业数据的单一存储,包括源系统数据的原始副本和用于报告、可视化、分析和机器学习等任务的转换数据。尽管数据湖是有用的,但它们也可能不可靠或不准确,原因如下。其中包括写入失败、模式不匹配和数据不一致,这些都是批处理和流数据混合在一起时产生的。在去年启动三角洲湖项目时,Databricks表示,这样做是为了确保数据能够保持更准确和可靠。Delta Lake通过跨批处理和流式数据管理事务以及多个同时写入来帮助实现这一点。从本质上讲,它所做的是为数据湖带来"质量和可靠性",使公司能够构建由结构化和半结构化数据组成的精心策划的数据湖,以便它们能够对这些数据执行更快的分析。在接受siliconagle的采访时,Databricks市场营销副总裁Joel Minnick解释说,很难对传统的数据湖进行分析,因为其中的信息来自多个来源。通常,大多数组织所做的是跨各种数据仓库和操作系统复制这些数据,因为它们用来查询和分析数据的工具不适合跨多个数据类型快速执行查询。Minnick说:"公司最终会得到相同数据的多个副本、多个体系结构和更高的成本。"。对于三角洲湖,他补充道,"我们的想法是把这些整合到一个建筑中。它增加了data lakes所需的性能、可靠性和治理能力,使其更加有用。"Minnick说,Databricks的新Delta引擎旨在帮助公司对存储在三角洲湖中的数据进行更快的分析。它使他们能够分析他们的数据,而不必将其移出三角洲湖,同时由于"矢量化"查询引擎,查询速度提高了8倍。当然,查询数据是一回事,但公司还需要了解这些查询告诉他们的是什么,这就是收购Redash的原因所在。Minnick说,Redash是一个开源项目,帮助数据科学家更好地理解他们的数据,帮助他们将查询结果可视化到各种图表、队列和漏斗中。结果可以很容易地与其他用户共享。"Redash让组织其他成员都能使用他们的数据,"Minnick说公司非常需要通过仪表板轻松消费的商业智能。Redash为技能较低的人提供自助服务。"星座研究公司(Constellation Research Inc.)分析师霍尔格·穆勒(Holger Mueller)告诉SiliconANGLE,企业越来越重要的是以更简单、更快的方式理解数据。穆勒说:"公司非常需要为他们的下一代应用程序增强洞察力。"Delta Engine的推出和对Redash的收购有助于支持这一点。"Databricks说,客户可以利用Redash,使用一个免费的连接器来分析使用Delta引擎进行的查询。该公司还致力于将Redash与Delta Engine及其主要的统一数据分析平台完全集成,并预计在今年晚些时候推出该功能的公开预览。来自罗伯特·霍夫的报道图片:杰拉特/皮克斯贝既然你来了…点击订阅我们的YouTube频道(见下文),显示您对我们使命的支持。我们的订户越多,YouTube就越会向你推荐相关的企业和新兴技术内容。谢谢!支持我们的使命:>>>>>立即订阅我们的YouTube频道。……我们还想告诉你我们的使命,以及你如何帮助我们完成它。SiliconANGLE Media Inc.的商业模式是基于内容的内在价值,而不是广告。与许多在线出版物不同的是,我们没有付费墙或横幅广告,因为我们想让我们的新闻保持开放,不受影响,也不需要追逐交通。那个新闻、报道和评论SiliconANGLE——以及现场报道,我们的硅谷工作室和cube环球巡演的视频团队提供的未经剪辑的视频需要大量的辛勤工作、时间和金钱。保持高质量需要赞助商的支持,他们与我们的无广告新闻内容的愿景一致。如果你喜欢这里的报道,视频采访和其他无广告内容,请花点时间看看我们的赞助商支持的视频内容样本,在推特上表达你的支持,然后继续回到SiliconANGLE。