ad

如何确保利用程序在公共云中的可用性

匿名投稿 216 2024-02-04

采取云计算的注意事项是一种很好的建议。云计算服务提供商(CSP)都会许诺在其基础设施中提供“高可用性”,其服务水平协议(SLA)通常提供95%至99.99%的正常运行时间,而每个月服务费退款率将到达10%到50%不等。但通常没有到达这样的门坎,正如IT的许多方面一样,重要的在于细节。

  而采取正确的方法,在Amazon Web Services、谷歌云平台和微软Azure公共云和混合云环境中可以实现5个9的高可用性(HA)。这需要了解服务等级协议(SLA)中的限制,和创建高可用配置的选项

  高可用性限制

  大多数云计算服务提供商都提供具有99.99%正常运行时间保证的服务等级协议(SLA),而逾越云计算服务提供商(CSP)区域和/或区域的冗余配置增加了企业取得满意可用性的信心。但是这类安排存在一些严重问题,由于服务等级协议(SLA)中“停机时间”和“不可用”是致使利用程序失败的缘由。

  不计入停机的潜伏缘由包括客户的软件,任何第3方软件或技术,计划的硬件和软件保护,和个别实例或卷的某些问题,这些问题不能归因于某些不可用的情况。还排除毛病的输入或指令,或在需要时缺少行动,这仿佛涵盖了“人为毛病”可能的缘由。

如何确保利用程序在公共云中的可用性

  云计算服务提供商(CSP)排除某些失败缘由是公道的,但系统管理员将这些作为借口是不负责任的。这使得有必要经过其他方式确保利用程序的更高可用性。

  实现更高可靠性的选项

  通常,有3种基本选项可用于提高云计算的可用性:利用程序软件中的规定,操作系统中内置的功能,和专用的故障转移集群。

  许多利用程序提供自己的高可用性(HA)规定。一个很好的例子是Microsoft SQL Server企业版中的运营商级在可用性组上始终使用的功能。这类方法的问题在于需要针对不同的利用程序提供不同的高可用性(HA)规定,这使得延续管理成为一项延续且本钱高昂的工作。

  第2个选项触及使用集成到操作系统中的高可用性(HA)功能。 Windows Server具有故障转移集群的本机功能,但其缺少数据复制功能。私有云中的复制通常经过某种情势的同享存储提供,例如存储区域网络(SAN)。但是,在公共云中,同享存储不可用,因此需要单独的数据复制解决方案。

  在Linux操作系统上,由于缺少像故障转移集群这样的本机功能,因此需要单独的高可用性(HA)规定。因此,这种情况下,实行高可用性(HA)需要使用像Pacemaker和Corosync这样的开源软件为每一个利用程序创建(然后保护)自定义内涵脚本,并且只有范围非常大的组织才有能力承当所触及的巨大而延续努力。

  第3种选择是采取第3方故障转移集群软件,这是专门用于为公共云、私有云和混合云上的Windows操作系统或Linux操作系统上运行的利用程序提供完全的高可用性和灾害恢复解决方案。

  这些解决方案最少结合了数据复制、连续利用程序级监控、可配置的故障转移/故障恢复恢复策略。这类集成使软件能够检测利用程序级别的任何和所有停机时间,不管其缘由如何,其中包括各种云计算服务等级协议(SLA)未涵盖的缘由。许多解决方案还提供高级功能,例如支持WAN优化以提高性能,和人工切换主服务器和辅助服务器分配以增进计划保护。

  虽然这些解决方案可以在私有云中与SAN配合使用,但大多数管理员更喜欢部署无同享SANless故障转移群集。其缘由包括:消除潜伏的单点故障、取得在公共云中工作的能力、并最小化恢复点对象(RPO)、恢复时间对象(RTO)和最短恢复时间(MTTR)。

  5个9的故障转移集群配置

  上图显示了一个3节点SANless故障转移集群,可在混合云中提供5个9的高可用性和强盛的灾害恢复保护。该利用程序是一个使用SQL Server标准版中的故障转移集群实例(FCI)的数据库。SQL1和SQL2位于公共云中具有SQL3的企业数据中心。在数据中心内,跨LAN的数据复制是同步的,以最大限度地缩短完成故障转移所需的时间,从而最大限度地提高可用性。

  这个3节点SANless故障转移集群能够以最小的停机时间和无数据丢失处理两个并发故障。

  在这个示例中,SQL1最初是主要活动实例,它将数据连续复制到SQL2和SQL3。如果SQL1失败,利用程序将自动将故障转移到SQL2,然后SQL2将成为SQL3的主要复制数据。

  一旦问题得到解决,SQL1可以恢复成主要节点,或SQL2可以继续在该容量中将数据复制到SQL1和SQL3。如果SQL2在SQL1返回操作之前失败, SQL3将成为主要的节点。另外建议使用人工故障转移,以避免由于到公共云的WAN链路中固有的较高延迟而致使数据丢失。

  像这样的3节点集群还有助于为所有3台服务器进行计划的硬件和软件保护,同时为利用程序及其数据提供延续的灾害恢复保护。经过易于实行和操作的方式行之有效的和高效率地使用所有资源,故障转移集群软件使得5个9的高可用性更加经济实惠,其中包括混合云。


免责声明:
本网址(www.yingxiongyun.com)发布的材料主要源于独立创作和网友匿名投稿。此处提供的所有信息仅供参考之用。我们致力于提供准确且可信的信息,但不对材料的完整性或真实性作出任何保证。用户应自行验证相关信息的正确性,并对其决策承担全部责任。对于由于信息的错误、不准确或遗漏所造成的任何损失,本网址不承担任何法律责任。

本网站所展示的所有内容,如文字、图像、标志、音频、视频、软件和程序等的版权均属于原创作者。

如果任何组织或个人认为网站内容可能侵犯其知识产权,或包含不准确之处,请即刻联系我们进行相应处理。

上一篇:企业上云不能不说的几个理由
下一篇:为何要切换到云计算?
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×