引言:
数据中心是数字经济发展和数智化发展的数字底座,良好规划的数据中心将能够为企业提供高效、安全、可靠的数据存储和处理服务。在本文中,我们将从数据中心设计到建造再到运营的全流程切入,关注端到端数据中心的底层设计逻辑。
数智化发展的数字底座
数据中心作为数字经济的重要基础设施之一,能够为各类数字业务提供稳定的运行环境和强大的计算能力。同时,数据中心的发展也推动了云计算的普及和应用,使得企业和组织能够更加便捷地获取和使用计算资源,为大数据分析和人工智能应用提供了强大的数据处理和计算支持,推动业务创新和智能化决策。
2021年,在国家发展改革委、中央网信办等部门联合发布的《关于加快构建全国一体化大数据中心协同创新体系的指导意见》中提出,随着各行业数字化转型升级进度加快,全社会数据总量爆发式增长,数据资源存储、计算和应用需求大幅提升,迫切需要推动数据中心合理布局、供需平衡、绿色集约和互联互通,构建数据中心、云计算、大数据一体化的新型算力网络体系,促进数据要素流通应用,实现数据中心绿色高质量发展。
最近几年,人工智能的蓬勃发展带来算力需求的快速增长,特别是生成式AI的爆发所需要的强大数据处理能力和存储容量,给数据中心带来了可观的发展前景,也提出新的挑战。Grand View Research数据称,2022年全球数据中心建设市场的价值约为2135亿美元;预计到2030年,全球数据中心建设市场规模将扩张至3719亿美元,以每年7.4%的复合年增长率快速增长。
大型数据中心建设的关键要素
数据中心建设是一个需要全面规划和综合考虑各方面要求的关键过程,因为数据中心承载着大量的硬件设备、网络设施和软件系统,涉及的技术复杂,它们都须经过正确的设计、安装和测试,还要确保设备的相互兼容性、高效运行和安全性。
随着可用性、安全性、服务能力、算力算效、绿色低碳正在成为当前全球数据中心的共同追求,在数据中心建设过程中,需要考虑以下五个方面的因素:
一是规模和容量。数据中心通常需要处理大规模的信息流量,要求大规模的硬件基础设施作为支撑,因此需要对建筑、设备、供电、制冷、网络等方面进行综合规划,以满足高密度、高可用性的要求。
二是安全性和稳定性。数据中心存储的数据往往是机密、重要的,因此对安全性和稳定性的要求很高,要采取措施确保数据的安全存储和传输,并且防范物理和网络安全威胁。此外,对于一些特定业务,还要根据需要通过定制来采用更加精细化的安全措施。
三是能效和环保要求。随着能源成本和环保意识的提高,数据中心建设需要考虑节能、绿色、环保等要求,确保能源的高效利用,并最小化对环境的影响。特别是随着超大规模数据中心需求的增加,减少能源消耗、用水和碳排放的需求比以往任何时候都更加迫切。
四是灾备和容灾规划。完善的灾备规划和技术部署是应对自然灾害、硬件故障或人为错误带来的风险的必然选择,有时还要考虑进行定制化的规划和技术部署来满足特定业务的特特殊需求。
五是监控和管理系统。缜密完备的系统可以确保设备的稳定运行、故障的及时解决和性能的持续优化。
中共中央、国务院于2023年2月印发的《数字中国建设整体布局规划》指出,要系统优化算力基础设施布局,促进东西部算力高效互补和协同联动,引导通用数据中心、超算中心、智能计算中心、边缘数据中心等合理梯次布局。这从某种角度说明,构建不同类型的数据中心正在成为不可逆转的趋势。因为不同行业和应用场景对数据中心的需求各不相同。例如,金融、电信等行业对数据中心的安全性和稳定性要求较高,而互联网、人工智能等领域对计算能力和灵活性有更高的需求。
建设定制化数据中心,合理梯次布局,提供多样化的服务,可以更好地满足各种不同的需求。因此可以说,合理规划、适当定制是当前数据中心建设的两大要素,两者相辅相成:合理规划为适当定制提供了基础和框架,而适当定制则是在合理规划的基础上,根据具体业务需求进行个性化的设计和配置。
重重挑战下,大型数据中心建设何去何从
一个良好规划的数据中心将能够为企业提供高效、安全、可靠的数据存储和处理能力,对数智化发展至关重要。然而,由于数据中心由包括冷却器、配电设备、环境监测系统等大量硬件系统组成,让其做到在各方面硬件达标的情况下,在服务器及网络设备搬入前顺利竣工并不简单。
据调研机构Uptime Institute 于2023年7月发布的《2023年全球数据中心调查》结果显示,超过一半的运营商在过去三年中经历过站点中断,尽管这已是迄今为止的最低数字记录,延续了稳步改善的趋势。此外,数据中心运营商面临着更严格的法规、更大的节能压力,同时还存在持续的员工配置和供应链问题。纵观这种现象的原因,是因为在数据中心建设中,经常会出现一些误区:如缺乏规划、忽视弹性或可扩展性、忽略安全性、缺乏专业知识等。
为了防范和纠正以上误区,从设计到建设到运行的端到端数据中心建设思路就显得非常重要,尤其是对超大规模数据中心而言,它能够确保数据中心在各个阶段的一致性、性能和安全,以满足业务需求并应对未来的挑战。
首先,从设计到建设到运维端到端的数据中心建设思路可以确保整个建设过程中的一致性和协调性。设计、建设和运维是数据中心生命周期的不同阶段,它们之间存在着紧密的联系和相互影响。超大规模数据中心涉及处理庞大的数据量,通常跨越多个物理位置。端对端解决方案通过确保数据从源头到目的地的一致性和完整性,帮助超大规模数据中心管理复杂的数据流。通过端到端的思路,可以在每个阶段都考虑到其他阶段的需求和要求,确保超大规模数据中心的各个方面都能相互协调和支持。
其次,端到端的思路可以确保数据中心的设计、建设和运维都能够充分匹配业务需求和资源的优化。通过整合各个环节,可以在设计阶段就考虑到后续运维的要求,使得数据中心的建设更加符合实际需求,避免浪费和不必要的投资。此外,通过端对端的设计,可以优化超大规模数据中心的性能,从而减少由庞大数据流带来的延迟、提高数据吞吐量以及更有效地利用网络和存储资源。
除此之外,端到端的思路使得风险管理和灾备计划能够贯穿整个数据中心的生命周期。从设计开始就考虑到各种潜在的风险隐患,强化了超大规模数据中心的容错能力和灾难恢复策略,在建设阶段采取相应的安全措施和灾备规划。超大规模数据中心的管理和监控需要具备较高的灵活性。端对端解决方案通过简化数据流和降低系统复杂性,使得超大规模数据中心在运维阶段持续监控和优化系统的安全性和稳定性。
最后,端到端的思路鼓励数据中心建设者在全生命周期中进行持续优化和创新。由于超大规模数据中心的建设是一个长期的过程,每个阶段都有机会来评估和改进现有的设计和运维策略。通过端到端的思路,建设者可以不断寻求更好的解决方案和技术创新,以适应快速变化的业务环境和技术趋势。
单一组织落地端到端建设思路
即便端到端数据中心建设方案可以更从容地应对未来的挑战,但是在项目实际落地的时候,有些用户出于各种因素的考虑,可能会选择多个供应商共同来落地建设思路。这可能引发一系列的问题,最终导致方案无法有效落实,不能真正达到最初采用端到端解决方案的初衷。
首先,多个组织共同完成数据中心建设首先会存在沟通和协调问题,出现理解的误差,容易导致项目进展缓慢或出错;其次,多个组织不容易明确责任,问题出现时难以界定责任方,问题处理效率低,甚至为了推卸责任隐瞒错误;第三,不同组织采用的技术标准规范不一致,可能会引发系统之间的兼容性问题;最后,多个组织之间的数据共享和交换可能会涉及安全和隐私问题。
而由同一组织负责数据中心的设计、建设和运营,沟通更加顺畅,所有团队都在共同的标准和规范下朝着同一个目标努力,大幅提高建设、运营效率,减少错误的发生,更好地控制数据中心的质量。此外,同一组织意味着数据中心建设和运营中出现任何问题都有唯一责任人,在整个端到端链条中不可能隐藏任何问题,出现任何问题或者需求都能得到快速响应,从而减少故障的持续时间,最大程度地保障数据中心的可靠性。
当然,同一组织负责数据中心的设计、建设和运营也不是万无一失的,其中可能会暴露出例如缺乏创新、缺乏竞争等问题。这就要求对合作伙伴的经验和专业知识、技术能力、项目管理能力、服务质量、成本效益、信誉口碑、安全隐私等进行充分的调查和评估。
朝亚致力于提供卓越的客户服务,具备丰富的定制化数据中心知识和经验,以及从设计到建造到运营的端到端全方位能力。通过合作伙伴EdgeconneX的全球化平台,朝亚能够帮助客户迅速进入到亚洲及全球50+热门市场,确保客户在数据中心建设和运营过程中获得多元化国际资源的支持和保障。凭借卓越的设计、规划和建设能力,朝亚快速、经济、有效地向客户提供最贴合客户业务需求的数据中心定制化解决方案,并提供优质的运营服务,充分满足客户的业务需求,助力企业实现数字化转型。
大语言模型、人工智能的热度还将持续,然而,无论模型训练算力的提供,还是模型能力的输出,都依赖背后强大的数据中心作为支撑。而端到端的数据中心建设模式,通过统一组织负责设计、建设和运营,更高效率地建设更安全、更高效、更大弹性的数据中心,为企业的数智化转型打下坚实的基础,从而在以生成式AI为代表的人工智能时代游刃有余。
中国香港上环干诺道中90号大新行SPACES13楼1302室
+852 3653 5268