首先,数据中心面临的一个常见问题是谐波干扰。在网络运行高峰期,服务器与终端之间的数据传输可能会出现错误,数据更新速度变慢,甚至出现断续现象。这种情况的根源通常是机房供电系统布局不合理。为解决这一问题,应定期测试电源谐波功率含量和网络错误率,并在发现错误帧时及时处理。此外,应控制一路电源所带动的设备数量,避免谐波功率累积过大。对于关键网络,建议使用单独的UPS供电,以消除谐波干扰。
其次,空气对链路的浸蚀也是数据中心运维中的一大挑战。机房的温度、湿度、风速等环境因素都可能对链路造成损害。例如,光纤链路长期暴露在空气中,容易受到水蒸气、灰尘等污染。为预防此类故障,应改善机房布线,做好链路与空气的隔绝,并在链路接头处特别注意。同时,改善机房环境,对温度、湿度、风速等参数进行监控和调节,并定期检修链路。
第三,记录对于机房运维至关重要。一些管理人员技术不错,但缺乏良好的记录习惯,这在网络故障排查过程中会带来很大困扰。建议机房管理者对设备进行分类记录,包括安装时间、维修记录、运行状态、保质期等,并记录设备的配置信息。此外,绘制机房网络拓扑图,并记录网络故障的维修记录,以便日后排查故障。
第四,照明系统在机房运维中也不可忽视。机房照明应满足一般照明要求,同时具备适应机房特殊环境的功能。建议配备两套照明系统:一般照明和事故照明,以确保在正常照明故障时,工作人员仍能及时处理故障和设备转移。
最后,布线也是机房运维中的一个重要环节。机房布线应合理规划,避免线缆杂乱无章,造成网络设备性能下降和安全隐患。在布线前,应进行充分的调查和规划,并使用合适的布线设备和工具。对于布线不合理的机房,应进行重新规划和实施。
总之,数据中心运维是一个复杂而辛苦的工作。从细节出发,做好各项维护工作,才能确保数据中心稳定运行。希望以上分享对大家有所帮助。
1、警惕谐波
有时候数据中心机房在网络运行高峰期会出现网络运行不稳定的现象,表现为服务器与终端之间的数据传输频频错误,数据更新速度偶尔变慢,有时出现断续。于此类似,路由交换设备有时也会突发性地“震荡”,数据传输暂时的空白,似乎网络已经中断。经过排查,幕后的真凶就是谐波,就其根源是该企业机房的供电系统布局不够合理所致。
首先要对电源谐波功率含量和网络错误率要定期测试,当发现错误帧时一定不要掉以轻心。另外,一路电源能带动的工作站建议不要超过30台,否则应象划分网段那样重新划定供电区域。以免内谐波功率累积过大,超过设备的容许范围。如果网络可靠性要求很高,或者对某些非常关键的网络,那么建议你将主要的网络设备如服务器、路由器等,在网络规划设计时就选择由单独的UPS供电,以消除其它电源的谐波对其带来的影响。
2、空气对链路的浸蚀
网络链路暴漏在空气中,如果机房的温度、湿度、风速等不符合要求会对链路造成浸蚀。比如光纤链路就经常被大家所忽视,由于长时间暴漏在空气中,非常受到空气中的水蒸气、灰尘等浸蚀和污染。通常情况下,这类网络故障比较难以判断和定位,并且受环境因素的影响比较大。
要预防此类故障的发生,首先要改善机房的布线,做好链路与空气的隔绝,特别要注意链路的接头处,这是最容易造成浸蚀的地方。其次要改善机房环境,其实网络设备对环境的要求是比较苛刻的。条件允许的话,对机房的温度、湿度、风速等参数进行监控,然后根据情况进行调节。最后定期的检修也必不可少,至少一年要进行两次这样的检测,更换被浸蚀损坏的链路。
3、记录不可少
某些机房管理人员技术非常不错但缺乏良好的习惯,在机房管理、维护过程中随意性太大。不仅对于机房中设备的数量、运行情况、网络布局等不够了解,而且在进行网络配置后没有做记录的习惯。这些管理过程中的空白,在一旦发生网络故障进行排错过程中其弊端暴露无遗。通常的情况是,管理员心急火燎但就是不能定位故障,工作效率非常低下。
笔者认为机房的管理者,首先是设备记录,对机房中的设备进行分类记录,这些记录应该力求详尽。最好以表格的形式进行分类归档记录,可以包括如下内容:安装时间、维修记录、运行状态、保质期等。其次是配置记录,将设备的相应配置信息记录在案。比如连接端口、帐户、密码等。最好将整个机房的网络拓扑图画出来,然后根据布局的调整进行变动。还有一些记录也很必要,就是机房网络故障的维修记录。这些记录应该做到详尽,包括故障时间、症状、排除方法和错误原因等。在实际工作中,这些记录往往被某些管理人员所忽略,其实这些记录在案的非常有助于此后的网络排错。
4、照明系统不可忽视
照明系统是计算机机房建设中不可缺少的部分。计算机机房的照明系统既不同于一般工厂的照明,也不同于一般办公室、会议室和家庭的照明。计算机机房的照明,除一般照明应具有的性能外,还有自己特殊的要求。特别是有些计算机机房采用全封闭式结构,机房内只能采用人工光源而无自然光源。在这种情况下,机房照明系统的好环,就显得格外重要了。机房照明质量好环,不仅影响计算机操作人员和维修人员的工作效率和身心健康,而且还会影响计算机的可靠运转。
笔者认为,一个标准的机房至少应该配备两套照明系统。首先是一般照明,来源于外界天体的自然光源和一种是人工照明即各种照明设备。对于一般照明应该达到的要求是:光线柔和,适合人体的生理需要,不能因光源产生干扰而影响计算机的干扰。另外,一定要预备事故照明。在某些特殊情况下当正常照明因故障熄灭后,事故照明能够为工作人员及时处理故障、设备转移提供了便利。
5、布线有序美观
笔者到过很多机房,其中不少机房的布线杂乱无章。通常情况下,机房的管理者图方便或者没有认识到布线的重要性,因此大多数不会花很多的精力在这上面。通常的状况是,几十根线纠缠在一起似一团乱麻,这样的布线,不仅不美观而且其弊端显而易见。网络维护不变工作效率低下,而且线之间的电磁干扰造成网络设备性能的下降和稳定性的降低,特别会带来巨大的安全隐患。
如何做好机房的网络布线呢?首先,在布线前要做好合理的规划和设计,做充分地调查研究,参观机房收集相关的布线资料,最好画出图纸然后进行布线。其次,购置合适的综合布线设备、相应的布线工具和辅助工具。条件允许的话,购置理线槽、镀锌管等以规整网线。另外,强烈建议布线不合理的机房一定要进行重新的规划与实施。还有这样的情况,机房在组建完成时布线是非常整齐与合理的,由于管理、维护不善使得其凌乱不堪,所有平时的好习惯是非常重要的。
总结:机房的管理与维护是非常复杂与辛苦的,当然也是非常重要的工作。从细节出发,不留死角、空白,其实也可以做到某种程度的一劳永逸。希望笔者的经验对大家有所帮助。
