Manque de support de l'ASPM dans les cartes Mellanox

Par Sebastián Barrenechea le 2 janv. 2023
Généré via Midjourney avec le texte : Green Nvidia datacenter inside a glass biosphere emitting gray gas, impactful, colorful, reallistic, canon lens, high detail --v 4 --ar 3:2

Les cartes Mellanox de Nvidia ne prennent pas en charge l’ASPM (Active State Power Management), une fonctionnalité de gestion de l’énergie qui aide à réduire la consommation des cartes PCI Express (PCIe). Cela pose problème car les cartes Mellanox sont utilisées dans de nombreux systèmes informatiques de haute performance (HPC pour High-Performance Computing), qui ont souvent un grand nombre de dispositifs PCIe pouvant contribuer de manière significative à la consommation énergétique du système.

Mais pourquoi est-ce important ? L’une des principales raisons est l’impact environnemental de la consommation d’énergie. Les systèmes HPC peuvent consommer une grande quantité d’électricité, ce qui génère des gaz à effet de serre et contribue au changement climatique. En améliorant l’efficacité énergétique de ces systèmes, nous pouvons aider à réduire leur empreinte carbone et faire notre part pour protéger l’environnement.

L’ASPM est une fonctionnalité de gestion de l’énergie précieuse qui peut réduire de manière significative la consommation d’énergie d’un système en permettant aux dispositifs d’entrer dans un état de faible puissance lorsqu’ils ne sont pas utilisés. Si les cartes Mellanox prenaient en charge l’ASPM, cela pourrait améliorer l’efficacité énergétique des systèmes HPC et réduire leurs émissions de carbone. Ce serait une situation avantageuse pour tous : cela aiderait non seulement à réduire notre impact sur l’environnement, mais aussi à économiser de l’argent sur les factures d’électricité et à améliorer la performance des systèmes HPC en réduisant les goulots d’étranglement liés à l’énergie.

Malheureusement, malgré les demandes des utilisateurs, Nvidia n’a pas fourni de mises à jour du firmware pour activer le support de l’ASPM sur les cartes Mellanox. C’est une déception, car ce serait un moyen simple et efficace d’améliorer l’efficacité énergétique des systèmes HPC. Il n’est pas clair pourquoi Nvidia n’a pas fourni ces mises à jour, mais le fabricant doit considérer cette question et envisager de fournir les mises à jour du firmware nécessaires.

En attendant, nous devons continuer à explorer des moyens d’améliorer l’efficacité énergétique des systèmes HPC et de réduire leur impact environnemental. Cela peut inclure l’utilisation de matériel plus efficace, l’optimisation de logiciels et d’algorithmes, et la mise en œuvre d’autres techniques de gestion de l’énergie. Par exemple, certains systèmes HPC utilisent la limitation de puissance ou le scaling dynamique de tension et de fréquence (DVFS) pour limiter la consommation d’énergie des composants individuels.

En nous concentrant sur les technologies et les pratiques économes en énergie, nous pouvons aider à réduire l’empreinte carbone des systèmes HPC et avoir un impact positif sur le monde.

Contenu traduit par gpt-4-1106-preview

©2022-2024 Sebastián Barrenechea. Tous droits réservés.

Construit avec Astro v4.15.9.