ad

严防云中断数据中心冗余如何设计?

匿名投稿 287 2024-01-02

很多公共云提供商在平常运营中通常难以避免地遭受灾害性中断,而IT管理人员需要从云平台的故障和教训中学习,并将其利用到内部基础设施当中。

  云平台(特别是大型公共云平台)具有多种冗余级别,但没有一个平台能够抵抗出现的意外停机。云计算平台和数据中心一样,都会遇到致使停机的问题。

  组织内部部署的硬件故障和软件毛病是难以避免的,但公共云为IT管理人员提供了应对这些问题的方法。公共云具有可用性汇聚、冗余数据中心、可用性区域和云区域,使管理人员能够在遭受中断时更好地计划业务运营。这些策略很重要,但管理员必须设计可靠的利用程序,以利用公共云冗余功能。

  组织IT资产的弹性更多地取决于利用程序而不是基础设施,这类想法与传统的思惟方式不同。在过去的210年中,管理员经过备份、复制和其他以基础设施为中心的技术保持弹性。但是对绝大多数公共云平台来讲,此策略不再行之有效的。

  最近几年来,云计算提供商遭受的损耗已超过其承受能力。云计算提供商提供的云服务在出现中断时,行业厂商和用户仿佛都在学习如何设计本地云冗余,管理人员希望将这些教训利用于传统的虚拟化数据中心冗余。

  重新思考数据中心的冗余

严防云中断数据中心冗余如何设计?

  对大多数传统组织来讲,一些基本的服务都是为避免停机而设计的。网络时间协议和网络路由等服务设计通常是高度冗余。但是,仅仅由于系统应当是冗余的,其实不意味着其配置已为利用自然冗余做好了充分准备。

  一些关键服务并没有高度可用的选项。IT部门几近总是面对必须处理的技术债务,这就要求对行动其实不理想的遗留系统提供支持。举例来看,一些遗留的利用程序身份验证系统只能存在于服务器上,这限制了数据中心的冗余功能。

  管理人员不应将所有鸡蛋放在一个篮子里。对大多数的传统部署,最好在数据中心内部使用冗余硬件。管理人员可以经过使用不同享系统的冗余虚拟化群集来进一步采取这类策略,这类似于可以提供多个可用性区域的云计算提供商。这可使利用程序依赖数据中心更高级别的冗余,但只有当业务需求保证该级别的冗余保护时才有价值。

  经过在云平台和数据中心之间并行实行这些策略,在采取类似的传统基础设施时,使用公共云提供商的概念(如可用性区域)可能会有所帮助。这类术语使开发人员能够更轻松地理解基础设施概念,由于他们可能熟习类似的云概念。

  云计算冗余其实不完善,停机中断提供了经验教训

  高度冗余的系统不会免受性能降落的作用。在最近的公共云中断事件中,其目录服务没法使服务从一个区域保持运行到另外一个区域。重新调剂的流量超过其他区域的能力,使服务没法满足需求。

  当管理人员设计数据中心冗余时,他们必须在产生中断时对负载进行计划。管理人员可能有两台服务器来支持数据中心冗余,但是其中一台服务器可能没法处理全部负载。关键是需要设计满足正常和异常状态下业务需求的系统。

  许多组织都认为如果配置正确,在中断期间会发现其他情况。Netflix公司推出的Chaos Monkey系统就是人们所熟知的摹拟中断事件,而其提供的经验教训是,如果管理人员没有练习处理实际的中断,他们永久不会知道IT系统将如何反应。而没有一个系统是孤岛,每一个利用程序和服务都具有进一步使测试复杂化的依赖性。

  停机中断在私有数据中心和公共云中其实不罕见,但在数据中心内部,管理人员通常需要了解并理解系统的内部工作方式。当云计算提供商的服务出现中断时,可能会感到并没有从停机中学到甚么教训,但这不是事实。虽然公共云提供商使用与传统数据中心不同的工具和方法,但有关构造和调剂冗余的经验教训是通用的。


免责声明:
本网址(www.yingxiongyun.com)发布的材料主要源于独立创作和网友匿名投稿。此处提供的所有信息仅供参考之用。我们致力于提供准确且可信的信息,但不对材料的完整性或真实性作出任何保证。用户应自行验证相关信息的正确性,并对其决策承担全部责任。对于由于信息的错误、不准确或遗漏所造成的任何损失,本网址不承担任何法律责任。

本网站所展示的所有内容,如文字、图像、标志、音频、视频、软件和程序等的版权均属于原创作者。

如果任何组织或个人认为网站内容可能侵犯其知识产权,或包含不准确之处,请即刻联系我们进行相应处理。

上一篇:关于边沿计算的4个预估(边沿计算技术)
下一篇:我们常听到的云计算或云服务究竟是甚么意思(我们常听到的云计算或云服务究竟是甚么意思)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×