Início Mundo Exacluster com 144 NVIDIA H200 AI GPUS detalhado por seu designer: host...

Exacluster com 144 NVIDIA H200 AI GPUS detalhado por seu designer: host host entra em cena

9
0

No início deste mês, relatamos o Exacluster da ExaAilabs, um cluster de 18 máquinas que executam 144 GPUs NVIDIA H200, que por acaso é um dos primeiros clusters baseados nesses processadores. Desde então, o Hydra Host, a empresa que facilitou a construção do cluster, nos deu detalhes adicionais sobre o sistema. O cluster usa sistemas Lenovo com múltiplas personalizações do host Hydra, que desempenharam um papel significativo. A máquina também pode ser alugada – quando não estiver em uso pelo proprietário – através da plataforma Brokkr da Hydra.

Muito poder de computação

A espinha dorsal do cluster consiste em 18 nós Lenovo equipados com 144 GPUs NVIDIA H200 e 20TB de memória HBM3E – ou oito por sistema – permitindo o desempenho da computação de 570 petatops FP8 para IA. 16 Os nós são configurados e ajustados por HydraHost para treinamento, o que requer computação maciça e desempenho da memória, enquanto os dois restantes servem como nós de inferência. Além disso, a Hydra Host instalou sua plataforma Brokkr para provisionamento, gerenciamento e aluguel remoto (mais sobre isso mais tarde).

Fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui