Em 27 de janeiro, no mesmo dia em que o preço das ações da Nvidia despencou depois que o mercado apreciou totalmente o que o LLM chinês significava para a indústria, a Huawei, com sede na China, postou um artigo anunciando que o modelo destilado R1 AI estava disponível gratuitamente por meio de sua plataforma ModelArts Studio. A empresa de tecnologia disse explicitamente que esta versão é “adaptada a Ascend”, como nas GPUs de data center de ascend da Huawei.
A Huawei não detalha exatamente que tipos de GPUs Ascend usa para o ModelArts Studio, particularmente em relação ao R1, mas figuras da indústria de IA como Yuchen Jin acreditam que pode ser o mais recente ascend 910c. Diz -se que esta nova GPU foi amostrada aos clientes em setembro, por isso é possível que o 910C já tenha sido adicionado aos servidores em nuvem da Huawei.
Embora o R1 tenha sido treinado em mais de dois mil GPUs de H800 da NVIDIA, é significativo para a Huawei que as GPUs da empresa tenham apoio explícito para realmente executar o LLM. Isso poderia cortar mais uma parte do processo em que as empresas de IA na China tiveram que confiar nas empresas ocidentais, neste caso, a NVIDIA e a AMD, cujas GPUs são procuradas para treinamento e inferência graças ao seu alto desempenho. No entanto, a Huawei pode estar alcançando.
“O desempenho da inferência no Huawei 910c alcança 60% do desempenho do H100 dos desenvolvedores [sic] Experiência ”, disse Jin em X.” Com kernels e otimizações escritos à mão, o desempenho é maior “. Jin também observou que o 910C também poderia ser usado para treinamento, mas o R1 foi oficialmente treinado usando chips H800, embora isso não signifique que o Deepseek continuará a usar esses H800s para sempre.
O desempenho é um problema significativo para a NVIDIA na China, pois as sanções da era Biden emitidas pelo governo dos EUA impedem que as empresas vendam processadores que são considerados muito rápidos. Muitas das melhores GPUs de data center da Nvidia, como o H200 e o B200, não podem ser exportadas legalmente para a China, forçando a NVIDIA a desenvolver novos modelos especificamente para a China que mal atendem ao limite de desempenho.
De fato, o H800, que Deepseek alegou usar para treinar o R1 LLM, foi lançado após a rodada inicial de restrições de exportação de GPU do governo Biden na China, a fim de oferecer uma alternativa ao H100 proibido. No entanto, o H800 e outras GPUs da NVIDIA para o mercado chinês foram banidas após a próxima rodada de sanções, que reduziu o limite de desempenho de chips que poderiam ser vendidos legalmente na China.
Devido às restrições de exportação do governo dos EUA, a NVIDIA é forçada a competir na China com hardware mais fraco; O carro-chefe da empresa de chips para a China, o H20, tem muito menos memória, largura de banda de memória e TFLOPS do que o H200, o cartão baseado em tremonha.
Aparentemente, isso teve um impacto muito real nas fortunas da NVIDIA na China e, em maio de 2024, estava vendendo o H20 por menos do que ascend 910b da Huawei. No entanto, as vendas do H20 foram aparentemente muito melhores no segundo semestre do ano passado, com sua receita crescendo 50% no quarto trimestre em comparação ao terceiro trimestre, após trimestres consecutivos de crescimento saudável. De qualquer maneira, a Nvidia certamente estaria em uma posição melhor contra seus concorrentes chineses se pudesse vender suas GPUs mais poderosas para a China.
Não se trata apenas de Nvidia ser capaz de competir na China. Ser capaz de executar um LLM chinês com desempenho de ponta nos processadores chineses pode ser um marco importante para o caminho do país para a Autarky Tecnológica. Se o Ascend 910C ou outra GPU chinês for suficiente para treinamento e inferência, provavelmente haverá ainda menos necessidade de processadores como o H20. Obviamente, a China não está pronta para abandonar completamente as fichas ocidentais até que progride na fabricação de chips, mas empresas como a Huawei estão trabalhando nisso.