搜索
您的当前位置:首页正文

论机房服务器运维管理

来源:好走旅游网
电脑编程技巧与维护 论机房服务器运维管理 张金磊。赵坤 (北京市垃圾渣土管理处,北京l00O00) 摘要:近年来,北京市垃圾渣土管理处逐步建设和运行了垃圾处理设施、在线监测计量、市容环境监督检查、建 筑垃圾管理、环卫信息和其他业务信息化等应用系统,这些业务系统部署在42台服务器等硬件设备上。服务器作 为承载信息系统的基础。保证服务器的良好运行,从而提高信息系统的稳定性,是机房运维管理人员需要研究的课 题。结合工作实际,讲解本单位服务器的运维管理。 关键词:信息系统;服务器;硬件检测 Discussion on Management of Room Servers Operation and Maintenance ZHANG Jin-lei。ZHAO Kun (Beijing Solid and Waste Administration Department,Beijing 100000,China) Abstract:In recent years,the Beijing Solid and Waste Administration Department have gradually constructed and operated a application system of waste disposal facility,realizing on—line monitoring,city environment supervision and inspection, constuctrion waste management,sanitation and other business information statistical,etc.This system deployed on 42 servers and other hardware devices.Servers iS the basis for he itnformation system nomalr operation.It iS an important subject orf a operators to study on how to ensure the normal running of servers and improve the system's stability.rI’his paper introduce the servers operation and maintenance of our department under the study of partieal work. Key words:information systems;server;hardware detection 1背景介绍 随着本单位机房承载的硬件设备逐渐增多,机房空间趋 于饱和,机房于2012年11月至2013年3月进行改扩建工 进行分析。 2服务器硬件检测及运维制度 2.1机房环境管理 良好的机房环境包括稳定的温湿度、稳定的不间断电源、 程,增加为54平方米。信息化业务系统部署在14个机柜的 42台服务器等硬件设备上,由UPS稳压电源供电。 2013年6月中旬至l0月期间机房内服务器及磁盘阵列柜 清洁的环境等方面。 2.1|1机房清洁度 出现多块硬盘故障,硬盘使用期限均在2年半至3年半之间, 多块磁盘出现介质损坏报错。硬盘型号如表I所示。 表1硬盘故障表 服务器名称 硬盘型号 数量 服务器电子元器件之间排列紧密,元器件之间绝缘要求、 抗干扰要求越来越高。如果机房的洁净度得不到改善,空气 中的尘埃粒子附着在电路板上。将会导致设备寿命的降低, 甚至烧毁。 2.1.2温湿度影响 环卫磁盘阵列柜 环卫信息服务器 邮件服务器 新文件服务器 垃圾分类服务器 5O0G SATA 146G SAS 3O0G SAS 30oG SAS 3O0G SAS 1 1 4 2 2 温度过高,电子元器件可靠性会下降,服务器硬件处于 自我保护时,会自动关机。 当室内的相对湿度超高,水蒸气在电子元器件或电介质 材料表面形成水膜,容易引起电子元器件之间形成通路。 而相对湿度过低,容易产生较高的静电。计算机线路中 本单位服务器安装操作系统的两块硬盘做RAID1,其他 硬盘作的RAID5。磁盘阵列设备会在硬盘做RAID5的基础上 设置2块以上的热备盘。2013年6月.新文件服务器在2O天 内坏了两块硬盘,其中一块硬盘亮正常状态的绿灯。但是服 所通过的电流本身就很小。静电放电电流瞬时流过机壳,对 电源线、信号线产生的感应噪声所致:通过静电产生的电压, 务器死机后重启时。发现命令行提示“Slor 0 HP Smart Array P410i Controller 1 Logical Drive 1779-Slot 0 Drive Array-Re— 引起机壳接入的安全保护地电位变动。以上各种因素,都相 当于将给计算机的逻辑运算电路输入一个错误信号,从而导 致计算机秩序的紊乱,还会造成系统停机。使系统瘫痪。 作者简介:张金磊(1981一),男,硕士,研究方向:计算机 控制及其自动化;赵坤,高级工程师。 收稿日期:2014—06—25 placement drive(S)detected OR previously failed.”,据此判断 发生故障的驱动器超过容错级别允许的数量,无法重建阵列。 信息化系统安全稳定运行的基础就是服务器硬件.如何降低 服务器硬件的故障率,将就此问题就机房服务器运维管理的 溢 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top