咨询QQ:
      培训班咨询

      编辑

      编辑

      网管

      市场部

      发行部

电话服务:
 010-82024984
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
数据中心“N+1”冷却冗余不能纸上谈兵
  • “N+1”冗余是数据中心系统设计的最佳实践,因为设备故障偶有发生,数据中心维护人员期望采用设备冗余提高可靠性。

    “N+1”冗余是数据中心系统设计的最佳实践,因为设备故障偶有发生,数据中心维护人员期望采用设备冗余提高可靠性。在数据中心冷却的情况下,人们预计精密空调(CRAC)在某个时候会宕机,而使用“N+1”冗余系统设计,可以有一个备用的精密空调(CRAC)可以使用。但在冷却过程中的一个主要问题是,在更换精密空调(CRAC)时或由于精密空调(CRAC)故障导致冷通道过热的风险,而且这种风险也随着冷通道的遏制而扩大。幸运的是,工作人员可以经济高效地管理这种风险,在冷通道中使用“空气动力”风扇。
      
      人们一再听到数据中心运营商谈论如何改变精密空调(CRAC)阵容会导致冷却气流问题。大多数意见来自传统的数据中心,尽管也有新的数据中心听到了类似意见。有趣的是,许多工作人员无法连接这个气流问题和“N+1”冗余之间的点。许多运营商都部署一个特殊的精密空调(CRAC)单元,他们不敢关闭,而他们认为可以用这个备用的CRAC单元提供“N+1”冗余。根据人们的经验,约四分之一的中小型数据中心这样做,那么他们所谓的“N+1”冗余只是纸上谈兵。
      
      平衡法
      
      人们经常听到这样的评论:“在所有的时间或房间过热时,我们需要保持CRACUnit#3持续运行”,或“当我们将CRAC#6停机进行维护时,北侧却有了热点”。而这些问题表明了高架地板环境中典型的气流行为:
      
      •进入通道的CFM(每分钟立方英尺)高度取决于地板下的压力和障碍物。
      
      •进入通道的CFM主要由最接近的精密空调(CRAC)驱动。
      
      •更改CRAC阵容会在传递给通道的CFM中产生较大的波动。
      
      •总的空气供应量可能是足够的,但本地供应可能不是(“分配问题”)。
      
      有了这些理解,人们可以很容易地看到精密空调(CRAC)阵容的变化如何使地板下的压力变化足以引起不利散热事件的重大风险。
      
      当人们考虑冷却效率,热安全性和预防问题时,就它是在正常操作条件和故障条件下进行的,而这两种情况都是高度动态的。在正常运行条件下,工作人员处理整个房间的冷却需求和供应的日常变化,而精密空调(CRAC)阵容保持不变。在故障条件下,当一个精密空调(CRAC)离线,并且备用精密空调(CRAC)接管时,数据中心的地板下压力就会有大幅变化。
      
      在正常运行条件下,气流供应和需求的日常变化会导致失去平衡的风险,并使冷通道受到影响。冷却需求在机架级别,通道级别和房间级别不同,并且可能会快速或缓慢地波动。例如,开展大型计算任务的研究人员可以快速加热一个或多个数字服务器机架。或者一个IT人员可能会在一个2kW机架的地方部署一个10kW的机架,但是忘记向设施人员提及。冷却需求的这些变化在冷却供应方面产生了不太明显的变化。当一个通道的冷却需求增加时,空气消耗的变化将影响相邻通道的气流供应。正常运行期间的这种需求和供应变化会影响地板下的压力,并可能导致通道局部低压。
      
      在故障条件下,精密空调(CRAC)单元的宕机和“N+1”冗余单元的替换将导致地板内压力的变化。因为通过道的冷却供应主要受精密空调(CRAC)的影响,根据地板下部的情况,精密空调(CRAC)的变化可能导致低压区和通道拥堵。虽然可能有足够的冷却供应,但由于分配问题,存在局部低压甚至通道过低。在这种情况下,即使“N+1”冗余精密空调(CRAC)单元按计划上线运营,但这种情况还只是具有部分冗余。
      
      用风扇固定
      
      幸运的是,实现真正的“N+1”冗余减轻了人们描述的冷却故障风险,可以通过局部调节气流的主动风扇轻松实现。基于感测到的温度或压差相对于目标设定值,可以调整风扇的转数,例如Frost-Byte升高的地板风扇,可以根据感测到的温度或压差来改变速度,以将冷空气输送到通道。在这些“冷气通道”中有几个风扇供应适量的冷空气,以减轻在正常运行和故障条件下不可避免的冷却需求和供应变化的热风险。
      
      这些主动式风扇采用铝合金外壳,由高性能的可变速直流风扇的矩阵构成,连接到标准的60%升高的地板上。通常通过安装在服务器机架表面上的温度传感器控制风扇。或者,测量所容纳的冷通道内部和外部之间的压力差的传感器控制风扇。这种风扇砖结构自动平衡冷通道,消除宕机风险,并改善热安全性。
      
      采用其他风扇的优点
      
      平衡冷却需求和供应的另一个解决办法就是过度供应通道,但由于当今强调能源效率,供过于求并不现实。事实上,能源效率是推动采用通道遏制的主要因素,即使是采用遏制,但由于平衡挑战,人们有时仍然看到供过于求。使用主动的风扇,可以减少或消除这些剩余的供应过剩的情景,从而实现冷通道遏制的全面效率。
      
      此外,通过自动平衡主动风扇,工作人员可以节省人力,从而消除常规手动平衡。在各房间巡查和地板穿孔的日子已经过云了。主动风扇消除了使用平衡罩(也称为流量计)分析通道的需要,以确保冷通道中的CFM与通道中的IT负载匹配。同样,由于房间和通道中的条件如此动态,用于平衡目的的计算流体动力学(CFD)分析已经过时,因为计算流体动力学(CFD)只是提供可能不再相关的气流的历史“快照”。
      
      最后,如果有源风扇通过UPS供电,则可以确保在完全中断冷却时持续更长的正常运行时间。在灾难性的冷却设备故障条件下,地板下的气室保持冷凉爽的空气层,尽管没有空气压力或气流。采用UPS备用电源运行的风扇可以继续输送并在该冷藏通风室内循环冷空气。测试表明,即使所有精密空调(CRAC)都关闭,通过风扇瓦片的供气温度保持稳定超过10分钟。
      
      自动平衡和解决风扇分配问题的好处可使运营商享受真正的“N+1”冗余。风扇在具有冷通道密封的数据中心中提供了显著的额外优点:节省更多的电能,达到局部平衡,提高热安全性。
      
      编译:Harris
      
      

     

  •