

德铁不仅利用平台、数据和开发者赋能来发展绿色IT,还导入云原生永续监控工具搜集IT能耗和碳排数据进行资源调度,实现绿色数位转型
德铁IT团队创建了绿色IT仪表板,将使用Kepler搜集到的K8s集群的功耗信息,通过Grafana仪表板进行呈现,可提供每支容器化应用程序即时的能耗数据,并用于碳排计算。德铁还通过数据湖打造了一个中间层,用来存储整个云端碳足迹数据,也方便进行数据治理和数据集集成。/德国铁路
随着越来越多部门的参与,德铁IT部门通过数据湖打造了一个中间层,用来存储整个云端碳足迹数据,也方便进行数据治理和数据集集成,他表示,通过这个中间层,也可以提供其他系统使用,进而集成更多的信息,例如,企业架构管理系统上加入绿色IT的仪表板,就能提供给架构管理人员参考。
在绿色IT的实践上,德铁开始思考哪些工具和方法能够赋能开发者,尤其,开发者是每天决定软件功能的人,Gualter Barbas Baptista认为,不应仅仅依赖管理文档来告诉开发者该如何操作以及达成哪些目标。如果没有让开发者真正参与其中,并且提供合适的工具和资源,无论是在代码的撰写方式或是基础设施管理方面,都无法真正实现改变,达到更绿色IT的目标。
导入Kepler工具并非易事。他提到,尽管Kepler是开源且非常好用,但企业使用时仍需特别留意。首先在安全方面,为了应对资安挑战,德铁移除了177个非必要的相依性组件,并将这些问题回馈至Kepler项目。其次,监控系统搜集的指针太多,可能产生过于频繁的通知和告警,反而造成干扰。所以,他们将默认3秒的数据搜集间隔延长至10秒,甚至是20秒一次,以减少不必要的干扰,也大幅减少了需要搜集的数据量。
德铁绿色IT发展有三大策略考量
德铁在绿色IT发展上采用不同策略,来满足够用、效率和一致性的需求。 Gualter Barbas Baptista解释,所谓的「够用」指的是必须考虑到真正的需要及背后的原因;而「效率」则是指生产和利用过程中,尽可能减少资源的消耗,最后,「一致性」则是设计一个符合自身需求的持久性方案。
过去,德铁集团有一套平台化的战略,去年集成所有子公司全面运行同一套标准化的技术平台。他指出,平台化的重要性,在于可以利用平台,来创建高水准的标准化,通过持续改进,提供安全设计,让每一个人不用想,也能实现默认IT绿化(Green by default)。
德铁采用K8s建构云原生技术平台架构,涵盖企业集成平台、AI平台、数据管理平台、物联网平台、开发者体验平台以及No-Code和Low-Code平台等。他认为,K8s不只是一个高效的云端维运工具,也是一个减少碳足迹的工具,甚至不仅仅是一个容器调度工具,更是一个平台构建工具,也是绿色IT工具。
举例来说,德铁IT团队有一套共享K8s集群,容器密度非常高,也设置了节点自动扩充,实现了平均约70%的CPU利用率。这是相当高的CPU利用率,可是,后来发现,实际上只有15%的CPU利用率被应用程序真正使用。
进一步分析后发现,这些应用程序一旦开始运行,通常就不再关注其资源使用情况,这是因为开发者为了应对可能出现的高流量,往往会在API请求配置上额外设置高一点,避免塞爆,例如API请求限制设置在512 MB,但这会让应用程序长时间占用了CPU和节点资源,造成资源浪费。
K8s项目不只提供了垂直Pod自动扩充机制,也有水平自动调整器,这让开发人员不再需要思考要用多少资源,甚至可以根据建议自动调整容器工作负载来优化,以满足其需求。因此,德铁后来改用垂直Pod自动扩充机制,确保应用程序资源最佳配置,来摆脱昂贵的猜猜看的做法。
相关报导 