数字化让千行百业都发生着变革,即便是提供数字化能力的数据中心,也在这场变革当中。
当然数据中心面临的并不仅仅是数字化的问题,更多的还是传统基建平台与数字化应用平台的变革压力。尤其是随着AIGC的火爆,算力成为了数字化时代最宝贵的资源,而如何发挥算力价值、让应用最大化,就需要数据中心有充足的供电与散热能力。尤其是随着AIGC等生成式AI应用的爆发,对于后端算力与存力都产生了爆炸性的需求,从而也让传统数据中心走到了改革的十字路口。
于是,业内不少专家也提出了应对之策。比如,超级大模型引发的算力需求需要一类新型的基础设施,以应对各方面挑战,包括模式和耦合度等等。而在与各行业专家以及上下游企业的交流中,我们也意识到,随着一年来GPT应用从3.5到5.0的快速迭代,对于数据中心基础设施也提出了新的要求——以前数据中心习惯按机架、面积来计算规模,现在就是按电力来算。同一幢楼供电量增加了,机架密度也就上去了。所以未来电力的消耗才是核心,变化也来得非常迅猛。
为此,朝亚也有了自己的应对之道。朝亚的目标就是在中国建立起高标准的超大规模数据中心园区。针对不同客户的差异化需求,朝亚也推出了全新一代Ingenuity高密度数据中心解决方案,旨在积极推动全行业共同探索与解决数据中心所遇到的相关挑战,为未来的AIGC乃至智能化应用提供坚实的数字底座。
AIGC应用快速发展,对数据中心供电与散热提出双重考验
据国家能源局数据统计,2022年全国数据中心耗电量约2700亿千瓦时,超过2座三峡电站年发电量。与此同时,AIGC等应用也要求数据中心提供高密度的算力服务,采用更契合当今时代需求的冷却技术和能源管理系统来降低能耗。在多种需求下,数据中心领域的转变也是刻不容缓。据了解,传统的2.5KW-4KW的单柜已不能满足AIGC市场的需求,20KW-40KW单柜逐渐成为主流。
以前,我们更多谈到的还是数据中心的占地面积、机柜数量等问题,但在大模型算力需求爆发的今天,市场更看重一个数据中心园区能够提供多少兆瓦。这种行业思路的转变也造成了应用上的改变。从应用侧来说,目前国内更多还处于应用的转型期,而AIGC的大规模应用也对数据中心发展带来了新的要求。未来主流机柜密度标准会迎来非常显著的增长,要实现这一点还需要解决许多现实问题,包括供电与散热。
首先就是电力供给。曾几何时,传统数据中心机柜的标准供电是3KW,这是与当时算力发展水平相匹配的。但是现在,一款CPU处理器的功耗动辄就达到300W甚至更高,而一款GPU加速器的功耗甚至接近1000W,这显然已经远远超越了3KW的机柜供电限制。因此,面向AIGC时代,面向未来多元化、异构算力需求,机柜供电效率必须进行大幅提升。
散热也是如此。如何为300W的CPU和1000W的GPU进行散热?这显然是传统风冷散热技术难以实现的,因此业界很早就开始探索液冷技术,而如今无论是冷板式液冷还是浸没式液冷都已经有了商业化的应用。考虑到更好的成本控制及更灵活的布置,目前有数据中心采用风液混布技术,为数据中心提供更好的散热效果的同时达到更出色的PUE值。目前看来,风液混布对数据中心的建设规划来说也是不小的挑战,仍有诸多可以完善的空间。
那么问题来了,在未来生成式AI发展的算力需求下,如何实现高效供电和更良好散热效果,推动智能化、数字化迈上新的台阶呢?对于这些问题,以朝亚为例的大型数据中心提供商也给出了自己的答案。
针对供电和散热的需求飙升,朝亚推出了Ingenuity高密度数据中心解决方案,能够为每个机架提供高达40KW的功率,以支持诸如AIGC的人工智能应用和高性能计算负载。为使得这些高密度的机柜获得更佳的冷却效果,朝亚的Ingenuity解决方案支持风液混布的应用方案,其风冷和液冷的比例可根据不同客户的业务需求灵活定制,并且具备前期设计论证的方案,以确保部署过程中,如客户需求发生变化也可通过调整风液比来满足变化需求。与此同时,Ingenuity解决方案还可以根据客户需求,适当调整供电的配置,以此来提供更为高效的供电模式。举例来说,由于断点续训技术提升了模型的保存与恢复能力,在部分客户模型训练阶段,可以优选更为高效的N+1架构以满足训练阶段的供电可靠性要求。
其实一直以来,朝亚都致力于建设能够满足客户高密部署需求的数据中心,其在天津的数据中心园区已获得Uptime Institute T3设计、建设和运维三阶段认证,充分具备了高密机柜部署的能力,可以提供客户全定制化服务。值得一提的是,朝亚提供的这种定制化是多维度的。现有的传统数据中心如需进行较大规模的高密度化改造,无论是供电提升还是液冷改造都很可能需花费较高成本。但朝亚早在设计之初就有所规划,因此也能针对不同客户的业务特性提供模块、专属楼层和整个数据中心等三种不同规模和维度的定制化,解决困扰客户的空间、制冷和能源等问题,让客户专注于业务本身。
除了基建层面的定制化之外,在软件管理与智能运维层面,朝亚也有自己的“独门绝技”。在安全层面,朝亚倡导对客户完全公开透明,并提供从访问到性能全套运营数据,其打造的360度集中管理系统,有助于在问题发生前发现并解决,防患于未然。而通过战略伙伴EdgeConneX的全球化平台,朝亚可以帮助中国客户出海,其范围覆盖了包含印度、马来西亚等亚太及全球其他50+热门市场。
我们也观察到,目前数据中心特别是与AIGC应用相关的液冷、供电、网络等方面的规范还处于探索期,因此对于基础设施提供商来说,在一个数据中心的规划设计过程当中需要更加的谨慎和务实,即需要围绕客户的需求开展工作。至此,从数据中心的设计开始,朝亚就与客户保持紧密沟通,以满足客户对规模、周期和系统的不同需求,通过数据中心的空间设计、电力配置、网络带宽、风液混布等实现灵活的定制化。
面向未来,AIGC必然成为改变许多行业发展的核心技术,而对于AIGC的支持也关系到数据中心智能化的未来。朝亚以提供优质“定制化”超大规模数据中心园区为核心竞争力,不但瞄准了行业痛点,也符合国家政策要求与行业发展趋势,不仅能够满足大型互联网企业的高密需求,还可在未来更多地为自动驾驶、科学与医学、制造业及智慧城市等多个行业与应用场景提供服务,推动数字中国快速发展。
转载自“IT大嘴巴”,点击阅读原文。