数据中心停机的原因是什么,人们通常是在机房而非放置支持设备的建筑物里出现

一方面是因为支持机房的多个系统的运营需要各种各样的技能,大多数企业低估了维护数据中心安全运行的重要性

亚洲城手机游戏 1

IT和设施人员越来越依赖彼此来为数据中心客户提供高可用性的服务。你的公司是否有效地处理了这个关键关系中最重要的部分?要自信地回答这个问题,了解一下这两类人员共同承当的哪些责任导致了最常见的可用性故障是有帮助的。

随着大量数据应用和业务量的激增,对大多数企业来说数据中心安全运行至关重要。然而,大多数企业低估了维护数据中心安全运行的重要性。据统计,数据中心的停机一分钟平均损失将超过8800美元。

亚洲城手机游戏,之后,我们就可以采用这些通过验证的方法来将可用性风险减少至最小。行业数据显示,在由设备导致的计算机运营故障当中,大多数是发生在机房而非基础设施建筑中。

那么,数据中心停机的原因是什么?又该如何避免这么此类事件发生呢?

背后的原因很简单:人们通常是在机房而非放置支持设备的建筑物里出现。风险通常是复杂的,一方面是因为机房由多个部门管理,一方面是因为支持机房的多个系统的运营需要各种各样的技能。

以下是数据中心停机的一些最主要的原因:

鉴于这些因素,发生混乱及失误的机率非常高。要避免这种情况,就需要各个部门通力合作,清晰定义关键任务的具体流程及责任人。

亚洲城手机游戏 1

布线和连接流程

  • UPS系统故障。如果企业投资建设数据中心,就必然要构建可靠的UPS供电系统,虽然其名为“不间断”,但并不能保证百分之百的可靠性,无论采用什么类型的UPS,仍然有可能发生短时间(10秒以内)或长时间(超过10秒)故障。这些故障可能是由一些潜在的问题引起的,例如UPS本身具有固有的缺陷,其质量或可靠性会随着时间的推移逐渐下降,另外蓄电池组失效,以及使用和维护不当也是引起UPS系统故障的原因,当然,雷电等自然灾害也是引起其故障的一个原因。
  • 网络犯罪。根据波洛蒙研究所的一项研究,网络犯罪是导致数据中心停机或业务中断的一个日益增长的原因,2010年网络犯罪引起数据中心停机只占所有事件的2%,如今已上升至22%。如果一个网络犯罪分子找到一种远程访问企业数据中心的方式,那么他就可能很容易挟持数据中心的数据和操作,或者完全拒绝数据中心的正常访问和操作。
  • IT设备自身故障。企业的服务器本身故障也是停机时间的主要原因。如果维护不当,或者电源连接不可靠,那么数据中心就有可能因此发生故障。

这是一个最需要优先考虑的事项。一个成功的IT/设施团队需要清晰地界定哪些部门及个人可安装及移除机房中的电源、网络电缆及连接。各个部门需要就各自负责的工作划分清晰的界线,并达成一致性意见。他们需要定义设施部门应将电源线连在服务器机柜的哪一边;

显然,这些停机原因并不是不受企业的控制。正如业界专家所说,预防性维护和主动维护可以避免大部分的停机。主动维护应注重以下三个方面:

哪个部门将负责将配电单元(PDU)whip连接到一个独立的计算机设备上;

(1)减少人为错误。首先,企业需要减少因人为错误引起的设备风险。如果企业的IT人员没有对如何维护设备进行适当的培训,或者不知道如何识别潜在问题或对其及时的做出反应,那么当他们面对故障时将无法采取必要措施。此外,大多数网络犯罪或因没有采用强大的密码,或是因为钓鱼网络而被侵入,最终都归因于某种人为错误。如果企业希望尽可能长时间地保持数据中心的全面运行,对其员工进行更好的培训是必要的措施。

哪个部门有权移除网络连接器等。图表或相片需要配上职责界限的书面说明,以进一步明晰各自的职责。每个部门只能允许2~3个人来负责这些关键布线任务:其中一个人负主要责任,而其他人则负责支持工作。这些角色的连续性是非常重要的,因为连续性可以保证一致性,并将发生误差的可能性最小化。

(2)定期检查维护。服务器是复杂的机器,需要得到良好维护,如果企业希望最大限度地延长其生命周期,则需要定期监控其性能,检查内部风扇和电源连接等,并定期更换零件。持续的维护虽然会产生额外的费用,但是与因停机造成的损失相比要低得多。

硬件总体规划

(3)制定预防策略。最后,企业可以通过制定不同的风险预防策略来降低风险。例如,通过更好地保护物理服务器,并在不同的位置进行镜像备份来减轻自然灾害的风险;通过进行主动的安全防护,可以减少网络犯罪的风险;还可以通过使用优质的电源设备,降低遭受停电的风险。