您的位置: 首页 >互联网 >

Snowflake如何挑战云原生数据库巨头

2020-06-08 15:02:26 编辑: 来源:
导读 云计算中出现了一种新的工作负载。早期的云都是关于基础设施即服务的——旋转存储、计算和网络资源以支持初创企业、应用程序开发和测试、软件即服务,并最终将更多的业务工作负载转移到云上。 今天的云工作负载已经超越了基础设施服务,而且越来越多样化。我们看到的最值得注意的创新之一是通过将人工智能注入到应用程序中来利用数据,简化分析并借助云计算来提供近乎实时的商业洞察。在这一大趋势的中心是一类新的数据存储和

云计算中出现了一种新的工作负载。早期的云都是关于基础设施即服务的——旋转存储、计算和网络资源以支持初创企业、应用程序开发和测试、软件即服务,并最终将更多的业务工作负载转移到云上。

今天的云工作负载已经超越了基础设施服务,而且越来越多样化。我们看到的最值得注意的创新之一是通过将人工智能注入到应用程序中来利用数据,简化分析并借助云计算来提供近乎实时的商业洞察。在这一大趋势的中心是一类新的数据存储和分析数据库,有些人称之为企业数据仓库或EDW——这个术语对于今天的商业运行速度来说可能已经过时了。

在这一突破性的分析中,我们深入研究了云数据库市场,并仔细观察了雪花公司(Snowflake Inc.)是如何与亚马逊网络服务公司(Amazon Web Services Inc.)的Redshift、谷歌LLC的BigQuery和微软(Microsoft Corp.)的Azure Synapse等竞争的。我们想要完成三件事:

云计算、数据科学工具和现代数据库技术带来了一场EDW市场的革命。EDW在支持公司的报告和治理要求,特别是支持萨班斯-奥克斯利法案的会计要求方面起到了关键作用。然而,从历史上看,EDW未能实现其360度客户视角和实时洞察的承诺。传统的企业数据仓库过于笨重、复杂、缓慢,跟不上业务的速度。

EDW是一个200亿美元的市场,但我们认为分析数据库的机会更大。为什么?因为云计算开启了快速组合多个数据源的能力,将数据科学工具引入其中,快速分析数据并向业务提供接近实时的洞察力——或者,重要的是,允许业务线专业人员以自助服务模式访问数据。这是一种新的范式,将DevOps的概念应用到数据管道中——想想敏捷数据或“DataOps”。

本地云分析数据库的市场竞争非常激烈。在上个十年的早期,我们看到谷歌将BigQuery带入市场。但谷歌主要专注于自己的广告业务,并花了数年时间将企业云作为优先事项。

雪花公司成立于2012年,是市场的颠覆者。就在这个时候,AWS达成了一项协议,获得了ParAccel MPP数据库的知识产权,亚马逊红移就是在这个数据库上建立起来的。在这十年的后期,微软推出了SQL DW,并在几周前的Build会议上发展成为Azure Synapse。还有其他公司,如IBM公司。

这里有很多利害关系。云提供商想要你的数据,因为他们明白这是未来十年创新的关键要素之一。摩尔定律不再是经济增长的主要动力。相反,今天是数据和人工智能推动了云计算的洞察力。

市场上出现了一个有趣的动态:雪花公司是这个领域的云专家,已经获得了超过10亿美元的风险投资。它还面临着大型云计算公司的挑战,这些公司行动迅速,经常从雪花公司采取行动,把客户带到他们各自的平台上。但雪花也是云供应商的主要合作伙伴,因为它帮助销售基础设施服务。

例如,雪花最大的云合作伙伴是AWS。雪花推动了亚马逊EC2的大量销售。但AWS有红移,它直接与雪花竞争。红移经常宣布雪花已经普及的功能。

这里有一个例子,我们在去年的AWS re:发明会议上报道过。来自ZDNet的Tony Baer在下面的文章中讨论了AWS RA3是如何将计算与存储分离的。当然,这是雪花的创始建筑原则。

这是另一个来自信息报道的例子,微软,雪花云的另一个合作伙伴,正在对雪花公司施加压力。你可以看到下面高亮显示的文本,作者谈到了微软试图将客户转移到它的数据库。

所以就有了这个奇怪的动态。雪花不在本地数据中心运行。它只在云中运行。它运行在AWS、Azure和GCP上。云计算的玩家都想要你的数据进入他们的数据库,他们极力要求客户使用专属服务。与此同时,他们需要像Snowflake这样的独立软件供应商在他们的云中运行,因为它销售基础设施服务,扩展客户选择,发展生态系统。

雪花公司是否应该转向本地运营,以区别于云计算巨头?今年早些时候,我们询问了雪花公

这是Slootman明确的声明。我们接下来要提出的问题是:考虑到我们在媒体文章中看到的传统观点,云计算玩家将会在这个市场上伤害雪花公司,雪花公司能否竞争?如果是这样,雪花将如何竞争?

下面的图表显示了我们从ETR数据集中最喜欢的两个指标。净得分,在y轴上——这是支出势头的衡量——和市场份额,在x轴上。市场份额是衡量数据集中的普遍性的指标,而不是传统的份额。它是一个公司被提及次数除以该行业被提及次数总数的计算。下面我们将展示EDW和云本地分析数据库市场的一些主要参与者。

以下几点值得注意:

底线是双重的:1)云本地分析数据库市场正在夺取钱包的份额;2)像过去几次调查一样,雪花牌继续以最高的消费速度在所有玩家中领先。

让我们来看看雪花在“Big 3”云中的表现吧。我们从AWS开始。

下面的图表显示了客户在AWS账户中的消费势头。我们削减了总样本,只隔离了运行AWS的ETR调查应答者——N为672。条形图显示了Snowflake和Amazon红移的净分数粒度。

我们发现,在672个AWS账户的N中,有96个共享N响应雪花,213个共享N响应红移。颜色显示的是相对于2019年的2020年消费意向。从左到右阅读:替换(明亮的红色),支出减少或增加6%(粉红色),持平支出(灰色),支出增加超过6%(福雷斯特·格林),平台增加新内容(石灰绿)。

净得分是用绿色减去红色。你可以看到,雪花在AWS云上的消费势头比亚马逊的红移要大一些。

添加绿色条显示,与2019年相比,2020年80%的AWS账户计划在雪花上花费更多。

其中约35%的消费者将雪花作为新产品添加进来。相比2019年,76%的AWS客户计划在2020年增加支出,12%的客户计划增加新支出。所以这两家公司都显示出非常强劲的支出速度,只有最小的红色。

至关重要的是,要在6月份的ETR调查中看到雪花公司能否保住这些新账户。

让我们看看ETR调查的数据来回答这个问题。

所以我们在上面显示的是相同的数据视图,除了我们在调查中隔离了677个Azure帐户。我们展示了Snowflake和Microsoft对分析数据库分别具有83和393个共享N响应的cut -足以得出一些结论。

注意净比分。雪花再次以78%对51%的价格胜出。再一次,你可以看到雪花公司有41%的新增业务,而微软的净得分是由现有客户的增长推动的。两家公司都很少出现红色。

让我们深入研究ETR调查的数据。

下面是上图中数据的相同视图。不同之处在于,现在我们隔离了298个运行雪花和谷歌分析数据库的GCP帐户。49的雪花共享的N比其他云要小,因为该公司一年前刚刚宣布支持GCP。但它仍然足够大,可以从数据中得出结论。你可以看到谷歌共享N在147。

以净得分或支出势头衡量,雪花再次以77.6%的显著优势胜出,谷歌的得票率为54%。加上这两条绿色的条,我们再次看到,运营GCP的80%的雪花客户希望在2020年增加对雪花的消费。谷歌和雪花显示很少的红色-一个积极的迹象。

最重要的是,我们的数据显示,在美国三大云服务提供商中,雪花公司的消费势头要比独占云服务提供商更强劲的云。

我们已经报道了Snowflake是如何从一些传统的数据仓库厂商,如Teradata和IBM,以及,从我们的数据来看,Oracle。我们已经报道了IBM的研发预算是如何捉襟见肘的。Oracle比IBM更专注于数据库,可以将更多的自由现金用于数据库,但亚马逊、微软和谷歌没有自由现金流问题。

这对雪花来说是一个挑战。大型云计算公司将继续投资并努力跟上雪花的步伐。下面是一个例子。以下是雪花和AWS在这一领域最近的部分创新。这里我们展示了雪花公司在2020年推出的一组功能,AWS在去年推出的一组功能。

其中许多特性将会引起数据库专家的共鸣,比如物化视图,并且已经存在很长时间了。云本地数据存储必须继续添加成熟的on-prem栈多年来拥有的关键特性——尤其是治理和安全特性。但关键是,新的领导者正在以云本地的形式添加这些功能。

我们知道AWS在添加特性方面毫不懈怠。亚马逊在研发上的投入是雪花公司的两倍。那么,我们为什么喜欢雪花的机会呢?

有几个原因我们认为雪花可以继续领先。首先,雪花花在工程、上市和生态系统上的每一分钱都用于为客户打造更好的数据库。

在封锁期间,我们询问了Frank Slootman在大流行期间如何分配宝贵的资金。他的答复强调了这一点:

Slootman在工程领域毫无保留地雇佣员工,因为这是未来的发展方向数据库分析研究开发

——Dave Vellante (@dvellante) 2020年6月6日

但这只是故事的一部分。

你们很多人都知道,直到最近我们都对多云持怀疑态度。我们说过,到目前为止,多云是多厂商和主要厂商营销的一个症状。

这种情况正在开始改变。我们认为,对于组织来说,多云是越来越可行和重要的,特别是当它涉及到数据、数据位置和全球规模时。

首先,我们要重申,新的工作负载正在云计算中出现。实时人工智能、洞察提取和人工智能推断将成为一种具有竞争力的差异化工具。这种新的创新组合源于通过数据科学工具应用于数据的机器智能,简化的界面使其能够与云进行伸缩。

因此,我们认为跨云开发是Snowflake和其他为多云构建高质量云本地能力的公司的一个区别。这对雪花来说意味着什么?为云本地构建功能——与将堆栈包装起来在云中运行相比——是一个关键的区别。

本地云意味着利用各自云中的原始功能、特性和api来创建尽可能高的性能、最低的延迟和最高效的服务。它为客户提供了最安全的体验。最好的体验将通过在云中原生构建来实现,这也是为什么Slootman在这个问题上如此教条。

Multicloud是雪花的一个区分器。数据无处不在,你想把数据放在它所处的位置,在AWS, Azure或任何存储数据的云上。如果您的查询的答案需要通过数据网络访问驻留在多个云中的数据,并且应用程序需要快速的答案,那么您必须具有低延迟访问该数据的能力。

雪花的游戏,在我们看来,是自动化数据流的一部分通过抽象复杂位置和延迟相关数据,元数据,带宽问题,时间查询,时间回答等,以及优化部分的堆栈信息无关的数据的位置。

区分公式不仅是最好的分析数据库,而且是不可知的。例如,AWS就有一个云议程。Azure和GCP也是如此。他们对多云的最佳回答是把一切都放在他们的云上。

当然,他们会提供跨云服务,但雪花将把它作为首要任务,而且一定是最好的。云提供商只有在探索了“俘虏”选项之后,才会追求多云。这是一种微妙的动态变化,但我们已经在市场上看到了几十年。

没有云平台议程的公司将会有一个强有力的论据,目前我们认为在这个市场上,雪花公司在市场上的地位是最引人注目的。


免责声明:本文由用户上传,如有侵权请联系删除!

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。