Mellanox卡缺乏ASPM支持

由 Sebastian Barrenechea 在 2023年1月2日
通过Midjourney生成的文本:Green Nvidia datacenter inside a glass biosphere emitting gray gas, impactful, colorful, reallistic, canon lens, high detail --v 4 --ar 3:2

Nvidia的Mellanox卡不支持ASPM(活动状态功率管理),这是一种帮助降低PCI Express(PCIe)卡消耗的电源管理功能。这一点很有问题,因为Mellanox卡在许多高性能计算(HPC)系统中被使用,这些系统通常有大量的PCIe设备,它们可以显著地增加系统的能源消耗。

但这为什么重要呢?主要原因之一是能源消耗的环境影响。HPC系统可能会消耗大量电力,这会产生温室气体并促进气候变化。通过提高这些系统的能效,我们可以帮助减少它们的碳足迹,并为保护环境尽一份力。

ASPM是一项宝贵的能源管理功能,它可以通过允许设备在不使用时进入低功耗状态,显著降低系统的能源消耗。如果Mellanox卡支持ASPM,它可以提高HPC系统的能效并减少它们的碳排放。这将是一个双赢的局面:它不仅有助于减少我们对环境的影响,还可以节省电费,并通过减少与能源相关的瓶颈来提高HPC系统的性能。

遗憾的是,尽管用户提出了请求,Nvidia并未提供固件更新以启用Mellanox卡上的ASPM支持。这令人失望,因为这将是提高HPC系统能效的一种简单有效的方法。目前尚不清楚Nvidia为何未提供这些更新,但制造商需要考虑这一问题,并考虑提供必要的固件更新。

与此同时,我们需要继续探索提高HPC系统能效和减少其环境影响的方法。这可能包括使用更高效的硬件,优化软件和算法,以及实施其他能源管理技术。例如,一些HPC系统使用功率限制或动态电压和频率调整(DVFS)来限制单个组件的能源消耗。

通过专注于能效技术和实践,我们可以帮助减少HPC系统的碳足迹,并对世界产生积极影响。

内容翻译者 gpt-4-1106-preview

©2022-2024 Sebastian Barrenechea. 保留所有权利.

构建于 Astro v4.15.9.