
跟着云推断的兴起,一些IT传奇念者、首席信息官和大型时间磋议公司在5年前预言数据中心行将沦一火。行业各人Mark Settle其时提议建议,企业关闭里面部署数据中心需要三念念尔后行,并预计数据中心的业务将跟着数据量的增长而赓续增长。
[[440601]]
如今,数据中心不仅赓续存在,并且在与搀和云和多云的市集竞争中郁勃发展。不仅如斯,数据中心还不错知足与边际推断、物联网和5G等新兴时间联系的办事需求。
由于这些新的应用行径以及末端用户推断(EUC)和移动措置决议中的新兴需求,数据中心的运营变得越来越复杂,导致出现更多的里面和外部风险。停机是一种不绝性风险,每次停机事件的平均耗费高达每分钟11000好意思元。
以下是企业识别和镌汰数据中心运营风险的三个要领。
1.领受空洞方法进行风险管制2021年2月,德克萨斯州遭受的冬季风暴以及随后导致的大面积停电,对该州的数据中心来说是一次严峻的磨砺。固然莫得发生大边界故障,但电气故障切换系统存在要紧问题。
从功能的角度来看,数据中心是运行业务重要型应用行径的物理设施;而从业务的角度来看,它们是需要进行预算和管制的不动产或成本钞票。
重要是,单点故障可能(并且时时会)导致数据中心的运营中断,从而导致收入耗费。这即是需要一个适用于统统这个词企业的广阔风险管制筹画和政策的原因。
这亦然空洞风险管制(IRM)进展伏击作用的处所。调研机构Gartner公司将空洞风险管制(IRM)界说为“由风险理解文化和相沿时间相沿的一组执行和过程,通过对企业若何管制其独到风险的空洞视图来立异决策制定和性能。”
在后疫情期间,执行汉典使命、BYOD、CYOD和其他使命局势执行变革的企业正在将其数字化转型战术与IT基础设施升级相齐集,以识别虚心解天然灾害、供应链、数据处理以及贸易样式所固有的风险。
如果企业正在执行数字化转型,则需要监控可能影响数据中心的每个过程和成分(外部或里面),并准备好应答由一个或多个事件同期发生的多重风险。
数字化转型不仅适用于严重依赖数据或时间的企业——它不异适用于疫情之后开展汉典使命的中小企业,包括那些运运用用公有云替代数据中心的企业。
以至政府部门也在安妥对待数字化转型——利用云推断时间革新数据中心基础设施是他们的两个中心标的之一(改善在线用户体验是另一个标的)。
Jeff Shupack说:“数据中心优化是《好意思国联邦信息时间收购革新法案》中记分卡的一个重要权衡目标。该权衡目标部分反应了政府机构基础设施利用云推断的进度。” Jeff Shupack是别称数字化转型各人,在通过精益敏捷执行镌汰全球成本筹画风险方面具有15年的执行训戒。
许多企业正在理解到,敏捷方法、大数据分析、移动措置决议和DevOps与可靠的、升级的数据中心协同使命,不错灵验地驻扎风险、充分地应答风险和快速地归附横祸。因此,他们正在转向概况在搀和IT基础设施中执行这些最好执行的框架,以确保业务连气儿性、减少运营成本,并改善数字客户体验。
2.了解风险不论企业的风险管制筹画何等全面,其发展速率遥远不会稀奇时间跳动。新时间和新的使命样貌正在创造前所未有的复杂性。以下是数据中心面对的不同类型的风险。
(1)IT安全性不及
不错说,如今数据中心面对的最大风险是蚁集安全罅隙,从DoS膺惩、应酬工程到数据盗窃,皆有可能发生。2021年,每个数据清楚事件酿成的平均耗费为424万好意思元,这是17年来最高的记载。
应用行径和系统故障也会对物理安全方面产生影响,导致身份无法考证、蚁集流畅中断、授权东说念主员无法干与特定区域等情况。
(2)系统故障
莫得弹性架构以及莫得连气儿的、冗余的、高带宽的蚁集流畅,数据中心的运营注定要失败。办事器、蚁集开采和联系开采皆需要集群、镜像和复制等功能,以减少停机的契机。
应用行径或软件(如管制行径) 无意会发生故障,导致办事器或蚁集瘫痪。因此需要确保统统应用行径在搀和基础设施上无缝使命,并与云原生应用行径进行对话。
(3)电源故障
尽管这种情况极其淡薄,但电力故障如实会发生——主淌若天然灾害带来的后果。需要为数据中心的统统机架和冷却系统配备UPS电源或备用发电机路。数据中心与多个变电站的胜仗流畅有助于防御受到腹地变电站停电的影响。
(4)漏水
激流或渗水可能会给数据中心带来横祸。关联词,调整雅致的管路和排水系统抵消防戒指和冷却系统至关伏击。
(5)杂音
数据中心面对的一个鲜为东说念主知但却十分严重的风险是经久清爽在高频杂音中,这会镌汰存储系统的扫尾,镌汰读/写性能,并最终影响数据完好性。数据中心应该建在远隔体育场、消防站、机场等处所,并部署在使用声学扼制时间的建筑物内。
(6)失火
电源尖峰和电气短路是数据中心失火的常见谅因。如果不飞速戒指,失火不错在几分钟内摧折数据中心IT硬件。具有讪笑意味的是,空长入冷却系统将会消消失火产生的烟雾,使失火早期探伤变得愈加艰难。因此需要使用带有光电传感器的烟雾探伤系统,以不绝监测数据中心的空气中是否有烟雾。
(7)倒霉的横祸归附缱绻
固然数据备份现在是一个稀奇浅易的过程,但出于安全性和性能的综觉得划,数据中心比公有云更受迎接——但愿在系统故障时概况立即归附事务性数据。
天然,这取决于业务的性质和监管框架等成分。是以更有事理为每个不同的故障事件制定明确的归附筹画;推断、存储或蚁集资源亦然如斯。
大多数先进的横祸归附筹画皆有监控系统,不错追足迹响数据中心的风险成分,并在稀奇重要阈值时发出警报。
3.在管制风险之前评估风险统统的风险并不皆是交流的。固然数据中心面对着各式风险,荒谬是不同的垂直边界,但最终使用的风险缓解时间不一定需要针对数据中心环境进行定制。
因此,数据中心运营商需要制定风险管制筹画,列出数据中心可能面对的统统风险,并指定对每种风险事件的响应。
领先进行风险审计——对统统领有和运营的数据中心设施进行全面评估。评估影响设施联想、IT基础设施和运营过程的成分。
如果昔日发生过要紧事故或中断,那么不错进行根底原因分析来措置莫得措置的问题。不错作念些什么来确保在访佛的情况下不会再次出现停机。
此外,如果使器用有多个数据中心和云推断系统的搀和架构,需要单独审核每个数据中心以及它们之间的数据旅途和流畅。
如果在金融和医疗保健等监管严格的行业中运营,则需要将依期数据中心风险评估和横祸测试行为平常运营的一部分。
与其他事项一样,需要创建框架、政策或备忘单提供适用于数据中心运营商的风险类别、每个类别影响的系统、估算损坏和归附成本,以及发惹事故或横祸时应治服条约的现成参考。
举例,IT揣度机构凯捷公司领受了一种束缚发展的风险管制方法,该方法识别并量化风险过头缓解成本。凯捷公司高等委派中心司理Kevin Read默示:“咱们照旧缔造了一个月度风险管制系统,记载统统风险和问题,并制定行径筹画。如果需要转换,将提供投资预算。”
若何遗弃停机期间数据中心(以至是企业的统统这个词IT基础设施)遥远不会孤速即运行,数据中心大批组件正在全天候运转。
IT基础设施的风险缓解是一个共同的牵扯,而不单是是首席信息官或首席时间官的牵扯。企业需要有富够数目的受过培训的IT东说念主员,他们闲散尽一切可能掌抓数据中心的运营。
Tenable公司居品营销副总裁Gavin Millard给民众的建议是:“突破的标的可能很难措置,最灵验的方法之一是缔造一个高效的过程,不绝识别风险所在。还需要一个可预计、可靠的方法来更新系统,而不会影响企业的总体业务标的。”