浅谈数据处理中心建设思路
摘要:近年来,国内各行业、各级别的数据处理中心新建案例如发展迅猛,但受限于数据处理中心概念提出时间尚短,数据处理中心建设标准的滞后,往往在实际项目中各设计单位均按照自己的理解或行业的惯例进行策划。本文着重从数据处理中心定义、发展过程、数据处理中心架构模型、难点及保障措施等方面对该类项目的建设思路做出论述。
关键词:数据处理中心,IDC,机房工程 ,数据处理中心架构模型
1、数据处理中心的概念
目前数据处理中心业界还没有一个权威的定义。数据处理中心的建设目标也随着上层应用及服务方式变化而在不同时期呈现出不同的内容。
数据处理中心是伴随着互联网发展的需求而发展起来的,为企业、应用服务提供商、内容服务提供商、系统集成商、ISP等提供大规模、高质量、安全可靠的业务处理、服务器托管、租用以及增值服务的互联网新型业务。数据处理中心不仅是一个服务概念,还是一个网络概念,它构成了网络基础资源的一部分,提供了一种高端的数据传输服务和高速接入服务。它改变了以往互联网的运作和经营模式,使得参加互联网的每一方都能专注其特长。
因此,数据处理中心不仅要提供服务器硬件、快速安全的网络,还要提供对服务器的监管服务、有关网络的管理及服务品质保证,而且要有高度可靠的安全的机房网络环境。
2、 数据处理中心建设的误区
在技术应用方面,数据处理中心的建设涉及了建筑、装饰、强电、弱电、网络、主机、软件等多个IT领域及非IT领域的关键性技术;在功能应用方面,数据处理中心则涵盖了业务保障、主机托管、数据存储、能源支撑、安全保障、运维管理等多种功能。因此,数据处理中心的建设是一个涉及面广、技术难度高、集成性强的综合性一体化系统工程。
业内的从业企业主要由过去从事传统IT行业、机房工程专业、甚至是强电、装修等单一专业的公司组成。谈到数据处理中心的建设时,往往会造成以下误区:
误区一:数据处理中心建设=机房工程。这种误区主要是由于对数据处理中心的片面性理解造成的,将数据处理中心与普通IT机房等同起来。
误区二:关键投资的偏移。建设一个服务面广、功能完整、数据关键性高的数据处理中心,从需求调研、功能定位到方案规划、详细设计再到工程实施、调试开通将是一笔巨大的投资。从机房平台一体化建设在整个数据处理中心构架的
位置及与其他支撑系统的关系来看,其主要作用是为上层的平台与应用提供可靠、纯净的能源支撑和安全、丰富、方便的操作、管理环境。然而,往往有一种建设误区将装修工程等华而不实的系统做为建设与投资重点,而轻视了为上层平台及应用提供关键性支撑的系统建设。
误区三:短视和缺乏系统的需求分析。在数据处理中心的建设中往往存在“只看局部、不看整体”、“只看显性、不看隐性”、“只看目前、不看未来”的建设误区,造成了数据处理中心的扩展性不强,下层支撑系统无法跟上上层业务系统的发展节奏的问题。
3、 数据处理中心整体构架
数据处理中心构架模型(Data Center Structure Model)是对数据处理中心的建设内容进行层次化抽象与归纳,以便于更系统、全面的对各功能模块进行规划与设计。具体见下图:
3.1建筑结构层
建筑结构层位于数据处理中心构架模型的最底层,主要是通过对建筑结构的合理性规划及装修工程来保证数据处理中心科学、合理的物理环境,建设内容主要包括:
a) 建筑结构及平面分割子系统
建筑结构包括建筑外立面、建筑屋面防水、建筑承重、电梯尺寸和承重、抗震和抗裂的等级、房间功能设置等要求。
平面分割子系统包括机房区域划分和机房通道设计。其中机房区域划分主要包括主机房区域、网络机房区域、运维监控区域、操作中心区域、辅助设施区域、通讯机房区域、开发中心区域、数据存储区域、设备仓库区域、培训中心区域;机房通道设计主要包括设备通道、参观通道、人员通道、消防通道等。
b) 装饰工程子系统
通常包括:装饰选材、机房标高、机房承重、天花吊顶工程、隔断及墙面工程、地面工程等。
3.2 机房平台层
机房平台层位于建筑结构层与业务支撑平台层之间,主要作用是为上层的支撑平台设备提供可靠、纯净的能源支撑,为管理人员提供安全、丰富、方便的操作、管理环境。
从功能上划分,主要分为四个模块,分别为能源支撑模块、安全保障模块、运维管理模块、配套服务模块。其中能源支撑模块包括:低压自动切换系统(ATS)、低压配电系统、不间断电源系统(UPS)、空调系统、后备发电系统(油机);安全保障模块包括:安全防范系统(SA)、消防报警系统(FA)、消防灭火系统、门禁管理系统、电气保护系统;运维管理模块包括:环境监控系统(PSMS)、网络监测管理系统、平台监测管理系统、生产监控系统、集中切换系统(KVM)、指挥调度系统;配套服务模块包括:结构化综合布线系统(PDS)、有线电视分配网系统(CATV)、紧急广播系统(PA)、语音通讯系统(PBX)、专用卫星通讯系统(VSAT)、培训中心系统。
3.3 业务支撑平台
业务支撑平台是为上层应用系统高效、稳定的运行提供支撑平台,主要由网络、主机、存储、备份等软硬件组成。
从主流行业的数据处理中心建设来看,主要应由以下功能区域组成:广域接入区、核心生产区、测试区、开发区、互联网服务托管区、办公OA区、MIS区、数据存储区、集中管理区、呼叫中心(Call Center)。
3.4 生产业务层
生产业务层主要由各类专业业务应用系统组成,用于完成交易,以及交易数据的统计与管理。
4、数据处理中心的建设重点和目标
由于IT业务快速发展的模式特点,如何针对行业数据处理中心设计出安全、可靠、稳定运行、可持续增长的机房环境将是数据处理中心建设中的重中之重建设重点和目标包括:
4.1高增长性
在规划设计中,应着重考虑以下几点以适应数据处理中心高增长性的特点:
采用标准化、模块化的设计。 随着数据处理中心环境的变化,电力基础设施和物理基础设施都必需适应并满足这些要求。
将数据处理中心总进线开关和进线电缆容量适当留有冗余,未来扩展时成本很低即可实现线路扩容,扩容仅需要加内部相应设备即可,不再需要整改机房内电气线路及桥架等;
在对行业业务充分了解的前提下,运用科学的分析方法,预测今后5到10年内的容量密度。系统设计中须结合用户实际情况提出合理的功率估算方法以及
供配电扩容方法。
4.2高可用性
高可用性已成为了数据处理中心稳定运行的核心因素,作为支撑关键业务的数据处理中心,需要满足24×7×365的运行要求,达到99.99999%的运行效率。在设计时,应主要考虑以下几点:
增加平均无故障时间(MTBF)――平均无故障时间,是指电源保护系统经过多少时间出现故障的平均小时数。可以通过增加系统中每个部件的可靠性和增加系统的冗余性两种途径来实现。
减少平均修复时间(MTTR)――其主旨是为了降低电源保护系统和市电电源同时现出故障的风险。
系统的冗余设计――系统的冗余设计应该从多方面考虑,将系统的单点故障降到最低,主要包括:能源的冗余、设备的冗余、网络接入的冗余。
减少人为故障――据统计,系统54%的宕机是人为故障造成的。在系统设计中,应尽量考虑到减小系统复杂性;在项目实施中需做好竣工资料及技术培训工作。
减小UPS和关键负载之间的故障点――大多数导致关键负载宕机的故障一般发生在UPS和关键负载之间。在 UPS 和关键负载之间存在多个断路器(单路径故障点)。
4.3高整合性
建筑结构的整合――随着数据处理中心负载的增加,基础空间可能会被机械和电力基础设施占用(包括发电机组、UPS系统、电池系统、静态开关等),因此系统设计中须提出优化的机房空间分割方法。主机房、各类业务机房、各类辅助用房的设计时应考虑装饰风格、操作台设计、设备布局的统一与协调。
管道桥架的整合――数据处理中心内涉及到管道桥架的系统较多,线路较复杂。因此,在严格遵守强、弱电线路管道桥架分开的前提下,应尽量考虑管道桥架的统一规划,方便施工与排障。
能源系统的整合――在低压配电子系统、UPS子系统、空调子系统等能源系统的设计时,应尽量考虑各子系统及设备之间的兼容性和整合性,建议采用一体化解决方案,提高系统的整体运行效率。
业务支撑平台的整合――建设一套高可靠、高可用性的支撑平台系统,采用逻辑隔离将各种应用区分开来。以生产业务系统应用为核心,同时满足安全保障、运维管理、配套服务相关系统对网络的应用。
4.4高安全性
建筑结构的安全保障――在建筑结构设计前,应对数据处理中心的外立面、承重、屋面防水、抗震/抗裂等级提出要求。同时,对易发生危险的系统(如UPS系统)应进行特殊考虑,如将UPS主机室与电池室进行分隔,并对UPS电池室采用实墙隔断,从建筑结构层面保证数据处理中心的运行安全;
能源系统的安全保障――数据处理中心内所有的能源支撑设备均需严格考虑接地与防雷系统,并在低压配电双输出系统中考虑采用负载同步控制器(LBS)防止关键负载设备的损坏;
技术上的安全保障――建设安防(闭路电视监控、防盗报警、电子巡更)、门禁(3层门禁管理体系)、消防(消防报警、消防灭火)、电气保护等子系统从多方面综合保证数据处理中心的安全;
运维管理的安全保障――利用数据处理中心的环境监控系统(PSMS)对机房内的温湿度、漏水、配电、UPS、空调、消防、安防等设备及子系统进行综合监控,实现实时的对机房环境运行参数进行监控。当环境运行参数发生重大异常时,通过指挥调度中心进行快速排障与维修。
4.5可迁移性
随着业务的不断拓展,可能需要对旧数据处理中心进行扩容,并进行新中心的建设。这时,就需要进行数据处理中心的搬迁工作。数据处理中心的共有特点是:业务集中、数据集中、海量数据容量(至少TB量级)、大业务量、业务连续性要求极高、关键业务数据可用性高。由于业务24×7的连续性需求和客户数据的重要性,保证业务连续性是数据处理中心迁移的核心要求。
因此在设计规划时,应尽量考虑到搬迁时最小的风险、最短的停机时间。主要从以下方面考虑:模块化设计――方便搬迁时设备的拆卸和搬迁统筹规划;设计的灵活性――灵活的设计使搬迁变得更加可行,也方便在新中心的灵活部署;提供宽大通畅的设备运输通道――保证搬迁时的物理条件,提高搬迁方案的可实施性。
4.6可管理性
ECC总控中心实现物理层、网络层、平台层、应用层所有关键设备及应用系统的实时监控。管理者可以将不同平台的系统放在总控中心,进行统一管理,时时地监控生产业务系统的交易情况、网络及服务器运行的状况、设备的利用率、机房内能源设备的运行状况等。同时,当系统发生故障或者系统变更时,可以通过指挥调度系统的大屏显示系统实时的检测现场状况及数据;通过无线对讲系统进行指挥调度动作;甚至可以通过远程视频会议系统对问题进行远程诊断。集中操作管理――集中切换系统(KVM)提供了一个统一的管理平台,实现基于
TCP/IP的管理用户对服务器及网络设备进行远程全域管理;并且整个集中管理KVM系统的建设可以满足机房不断发展及无限扩容需要。
因篇幅问题不能全部显示,请点此查看更多更全内容