Quando a AMD lançou seus aceleradores Instinct MI300X para IA e HPC há cerca de um ano, a Amazon Web Services (AWS) manifestou interesse em implantá-los na nuvem. Porém, segundo a Amazon, conforme noticiado pelo Business Insider, por falta de forte demanda, a empresa ainda não o fez.
“Seguimos a demanda dos clientes”, disse Gadi Hutt, Diretor de Produto e Engenharia de Clientes do Annapurna Labs, uma empresa da Amazon, ao Business Insider. “Se os clientes tiverem fortes indicações de que isso é necessário, não há razão para não implantar”.
Pelo menos, segundo Hutt, não houve interesse suficiente para justificar a implantação dos aceleradores Instinct MI300X da AMD na AWS. Embora o Instinct MI300X da AMD seja mais barato que o H100 da Nvidia, seu software não é tão robusto quanto o CUDA da Nvidia, o que assusta muitos desenvolvedores. À medida que as ofertas de hardware da AMD melhoram (por exemplo, Instinct MI325X), o mesmo deve acontecer com o seu software.
Até certo ponto, Hutt pode ser considerado uma parte interessada, já que o Trainium desenvolvido em Annapurna rivaliza com os da AMD e da Nvidia nos data centers da AWS. Ainda assim, supondo que ele tenha falado oficialmente, esta é a posição da AWS.
Falando em Trainium, com seu Trainium e Trainium2 projetados internamente, a AWS não precisa pagar um prêmio à AMD ou Nvidia, e é por isso que pode oferecer instâncias Trn1 e Trn2 a preços muito competitivos em comparação com aquelas alimentadas pelas GPUs H100 da Nvidia . Esta pode ser outra razão para o baixo interesse em soluções de terceiros que não sejam da Nvidia.
Falando em Nvidia, a AWS anunciou em sua conferência re:Invent que estava preparada para fortalecer suas ofertas de IA com as próximas GPUs Blackwell da Nvidia para IA e HPC. Durante a conferência re:Invent, a AWS apresentou seus servidores P6 equipados com GPUs Blackwell, refletindo a expectativa de que essas máquinas terão alta demanda.
Apesar de não oferecer o Instinct MI300X da AMD na nuvem, a AWS continua a colaborar estreitamente com a empresa e oferece muitas instâncias baseadas nos processadores EPYC da AMD. Dada a sua contagem de núcleos e subsistema de memória, esses processadores oferecem enormes vantagens sobre os rivais Intel Xeon para instâncias com uso intensivo de memória e computação.