ad

为何说云计算拼的是运维(为何说云计算拼的是运维呢)

匿名投稿 126 2024-01-10

到今天,云计算的工业实现已不太难了。现在有开源软件KVM和Xen,这两个东西基本把虚拟化弄定;而OpenStack则把管理、控制系统弄定,也很成熟。PaaS也有相应的开源,比如OpenShift,而Java里也有N多的中间件框架和技术。另外散布式文件系统GFS/TFS,散布式计算系统Hadoop/Hbase等等,散布式的东西都不神秘了。技术的实现在之前多是问题,现在不是了。

  对云计算工程方面,现在最难的是运维。管100台、1万台还是100万台机器,那是完全不同的。机器少你可以用人管理,机器多是不可能靠人的。运维系统不属于功能性的东西,用户看不见,所以这是被大家严重低估的东西。只要你做大了,就必定要在运维系统上做文章。数据中心/云计算拼的就是运维能力。

  为何说运维比较复杂,缘由有这么几个。

  一方面,云计算要用便宜装备取代那些高价的的解决方案。互联网就是要用便宜的东西搭建出高质量的东西,硬件和资源一定不会走高端线路——比如EMC、IBM小型机、SGI超级计算机等等,你如果用它去搭建云计算,本钱太贵。用便宜的解决方案代替高价的的解决方案是全部计算机发展史中到今天唯一不变的事情。所以如果你要让夏利车跑出奔驰车的感觉,你需要自己动手做很多事,搭建一个智能的系统。用便宜的东西做出高质量的东西,运维好便宜的装备实际上是云计算工程里最大的挑战。

  另外一方面,由于机器多了,加上用的又不是高价的的硬件,所以故障就变成了常态,硬盘、主板、网络每天坏。所以,没甚么好想的,运维就必须要跟上。云计算的目标是在故障成为常态的情形下保证高可用——也就是我们所说服务的可用性,是3个9、4个9还是5个9。

为何说云计算拼的是运维(为何说云计算拼的是运维呢)

  最后,这一大堆机器和装备都放在一起,安全问题就是一个挑战,一方面是Security,另外一方面是Safety,保证数10台数百台的装备的安全还好说,但是对数万数10万台的设计,就没有那末简单了。

  面对这样的困难,人是没法弄得定的,只能依托技术来管理和运维全部平台。比如必须有监控系统。这跟操作系一致样,对资源的管理,对网络流量、CPU利用率、进程、内存等等的状态肯定要全部搜集的。搜集全部集群各种节点的状态,是必定每一个云计算都有的,都是大同小异的。

  然后,还要找到可用性更好的节点,这需要有一些故障自检的功能。比如阿里云就遇到过磁盘用到一定时候就会稀里糊涂的不稳定,有些磁盘的I/O会变慢。变慢的缘由有可是硬盘不行了,因而硬盘控制器可能由于CRC校验出错需要要多读几次,这就好比TCP的包传过来,数据出错了,需要重新传。在这类硬盘处理半死不活的状态时,你肯定是需要一个自动检测或自动发现的程序去监控这类事情,当这个磁盘可能不行了,标记成坏磁盘,别用它,到别的磁盘上读复本去。我们要有故障自动检测、预估的措施,才能驱动故障,而不是被动响应故障,用户体验才会好。换句话说,我们需要自动化的、主动的运维。

  为了数据的高可用性,你只能使用数据冗余,写多份到不同的节点——工业界标准写3份是安全。但是,你做了冗余,又有数据一致性问题。为了解决冗余带来的一致性问题,才有了paxos的投票玩法,大家投票这个能不能改,因而你就需要一个强盛的控制系统来控制这些东西。

  另外,公有云人来人往,里面的资源和服务今天用明天不用,有分配有释放,有冻结,你还要弄一个资源管理系统来管理这些资源的生命状态。还有权限管理,就像AWS的IAM一样,如果没有像AWS的IAM权限管理系统,AWS可能会不会像今天这样有很多大的公司来用。企业级的云平台,你需要有企业级的运维和管理能力。

  为啥云计算有这么多开源的东西,却不是人人都能做?

  一方面,这就跟盖楼一样。盖楼的技术没甚么难的(固然,盖高楼是很难的),但是你没地你怎样盖?云计算也一样,带宽的价格贵得就像土地的价格。其实云计算跟房地产一样,要占地、占机房、占带宽。如果能把中国所有的机房、机柜、带宽资源都买了,你就不用做云计算了,卖土地就够了——由于这些是有限的。最简单的例子,IP地址是有限的。你有带宽、有机房,但是如果你没有IP,这就不好玩了。特别是你要提供CDN服务,这个就更明显,由于有多少物理节点直接决定你的CDN服务质量。

  另外一方面,正如前面所说的,运维是件很难的事,运维这个事其实不是常人能弄的事。没有足够的场景、经验和时间,这类能力很难出现。从用户的角度来讲呢,云计算是一种服务,你需要对用户企业内的解决方案要有很好的了解,这样才能提高很好的服务。能提供“好服务”的通常都是把自己真正当做用户公司。

  卖汽车也是卖服务。造出汽车来,其实不代表你弄定这个事了。如果没有公路、没有加油站、没有4s店、没有交通管理、规则等等,你要末用不了,要末就是乱78糟。不能只让用户在那看着你的汽车好牛啊,但是使用者不知道怎样用。所以说,云计算终究旁边必须要有一套服务设施,而这套服务设施也是今天被人低估的。

  云计算有两个东西个人觉得是被人低估的,一个是运维,一个是服务。做服务的需要有生态环境,有人帮你做。所以做云计算要落地其实不简单。还是那句话,云就是服务,只要提供了好的服务,不管公有还是私有都是会有价值的。


免责声明:
本网址(www.yingxiongyun.com)发布的材料主要源于独立创作和网友匿名投稿。此处提供的所有信息仅供参考之用。我们致力于提供准确且可信的信息,但不对材料的完整性或真实性作出任何保证。用户应自行验证相关信息的正确性,并对其决策承担全部责任。对于由于信息的错误、不准确或遗漏所造成的任何损失,本网址不承担任何法律责任。

本网站所展示的所有内容,如文字、图像、标志、音频、视频、软件和程序等的版权均属于原创作者。

如果任何组织或个人认为网站内容可能侵犯其知识产权,或包含不准确之处,请即刻联系我们进行相应处理。

上一篇:也许你很懂云计算 但接下来这些“计算”你还了解吗
下一篇:使用混合云文件系统来满足组织的存储需求(混合云一般由一个组织来使用)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×