ad

导航公共云可用性区域以取得最好性能

匿名投稿 208 2024-02-04

谷歌公司最近的宕机事件表示,可用性区域其实不是取得高可用性的灵丹妙药。人们需要了解云计算供应商区域隔离方法的差异将如何作用工作负载性能。

  对大范围运营的云计算提供商而言,云平台产生故障和中断是可以理解的(也多是难以避免的)。AWS、Google、Microsoft这3个主要的云计算供应商必须在运营效力和高可用性之间获得平衡,运营效力经过自动化得到改良,而高可用性则经过物理上不同的区域得到改良。

  可用性区域旨在提供冗余性,但仍可能在其中产生广泛的系统故障。云计算区域提供了更大程度的逻辑分离,但它们为跨区域复制工作负载的组织带来了一些问题。

  虽然存在复杂性和权衡,企业需要了解与区域隔离相干的变量,以便他们可以设计高可用性和对系统性故障更具弹性的利用程序。

  可用性区域和云区域如何协同工作

导航公共云可用性区域以取得最好性能

  AWS、Microsoft Azure和谷歌云都依赖于相互连接的云计算设施的3个层次结构:数据中心、疏松耦合的可用性区域,和地理分隔的云区域。

  可用性区域是两个或多个地理位置相近的数据中心的汇聚,通常位于同一个都市区,并经过冗余、超高速、低延迟的网络电路连接。而多个可用性区域可以组成一个云区域。

  云区域经过专用的高性能线路连接,微软公司称之为“延迟定义内涵的周边”。云计算提供商通常在一个国家具有多个云区域。举例来看,AWS公司在美利坚合众国有4个商业性云区域,另外两个云区域专门用于公共部门。

  许多云计算服务(包括一些数据库、存储层和负载平衡器)旨在跨可用性区域自动配置资源。其他服务(如AWS身份和访问管理或Azure CDN)可在所有云区域自动使用。正如谷歌中断事件所示,数据中心的耦合可能致使全部可用性区域在适当的条件下产生故障。

  云计算提供商方法中的变量

  谷歌公司的中断事件还突出了云计算供应商管理可用性区域的不同的地方。举例来看,AWS公司宣称具有最大程度的设施独立性。亚马逊公司首席技术官Werner Vogels 2018年在博客中表示,如果一个可用性区域电力中断,不会作用另外一个可用性区域运营,而一个可用性区域中的软件毛病不太可能蔓延到另外一个可用性区域。他补充说,AWS公司为此还专门构造了工具和程序,因此它们不会作用多个云区域。

  与此同时,微软公司在推出可用性区域方面进展缓慢,截至至今为止,其54个全世界云区域中只有10个云区域有这些可用性区域。去年9月,缺少广泛的可用性区域致使微软Azure在美利坚合众国中南部的云区域产生大范围的中断。

  Azure Post Mortem突出了可用性区域内低延迟连接的价值,指出跨区域复制为许多服务增加了太多的延迟。就这些数据中心之间的连接而言,云计算运营商对其内部设施、系统和网络的设计细节是尽人皆知的隐私。但是,一些公然的细节也暴露了它们的范围和复杂性。

  AWS公司表示,连接其各种数据中心和云区域的专用网络建立在经过跨洋电缆连接的全世界冗余并行100 GbE城域光纤网络上。

  谷歌公司运营着一个全世界私有网络,预估占全世界所有互联网流量的25%左右。谷歌公司在2018年表示,在过去3年中花费了300亿美元来建设其云计算基础设施,包括增加新的区域和几条海底光缆。

  谷歌公司使用自行开发的软件定义内涵网络和散布式控制平台和网络结构管理器,经过跨多个数据中心复制和同享配置数据来提供高可用性(HA)。它还使用容器集群来支持实时工作负载迁移和“无中断”数据平台升级。

  微软Azure表示其云区域旨在将故障隔离到一个云区域中,并且一个云区域中的故障不应作用其他区域。

  使用云内和云平台之间的区域

  跨多个云区域分发利用程序工作负载和数据库是经过云计算基础设施实现高可用性的最好方式。但是,组织必须在这样做时必须理解和设计网络性能的可变性。

  云计算提供商在路由流量方面存在差异,这会明显作用网络延迟。没有一个云计算提供商可以保证乃至公布其区域间性能的数据。

  但是,网络监控供应商ThousandEyes公司于2018年11月进行的详细研究提供了大量有用的见解。虽然其演示文稿的观点仍需要一些探讨和研究,但以下是云计算广域网性能的一些关键点。

  1 可用性区域内的性能优良,一致性满足低于2ms网络延迟的目标。

  2 云区域之间表现在美利坚合众国和欧洲最好,在亚洲和大洋洲表现最差。美利坚合众国和欧洲地区之间的表现也相当不错。

  3 亚洲的各供应商的绩效差异很大,其中AWS公司具有最高的网络可变性。

  4 AWS、Azure、谷歌云将网络彼此对等,这意味着它们之间的流量不会流经主干,并遍历公共互联网。因此,这种情况下,在云平台之间移动数据时存在忽视的数据包丢失和抖动,虽然在单个云场景中区域间延迟会有相同的差异。

  在使用多个云区域来提高利用程序可用性时,需要斟酌利用程序流量的来源(大多数终究用户所在的位置)和区域间网络延迟的可变性,和3大云计算提供商在路由全世界流量的差异。


免责声明:
本网址(www.yingxiongyun.com)发布的材料主要源于独立创作和网友匿名投稿。此处提供的所有信息仅供参考之用。我们致力于提供准确且可信的信息,但不对材料的完整性或真实性作出任何保证。用户应自行验证相关信息的正确性,并对其决策承担全部责任。对于由于信息的错误、不准确或遗漏所造成的任何损失,本网址不承担任何法律责任。

本网站所展示的所有内容,如文字、图像、标志、音频、视频、软件和程序等的版权均属于原创作者

如果任何组织或个人认为网站内容可能侵犯其知识产权,或包含不准确之处,请即刻联系我们进行相应处理。

上一篇:浅谈云计算在企业IT架构的利用
下一篇:从中央走向边沿:云计算分散化是难以避免的吗?
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×