Início Mundo A pesquisa Deepseek sugere

A pesquisa Deepseek sugere

9
0

O Hisilicon Ascend 910C da Huawei é uma versão do processador ASCEND 910 da empresa para treinamento de IA introduzido em 2019. Até agora, o desempenho do Ascend 910 é quase suficiente para o treinamento econômico de grandes modelos de IA. Ainda assim, quando se trata de inferência, oferece 60% do desempenho da NVIDIA H100, de acordo com pesquisadores da Deepseek. Embora o Ascend 910C não seja um campeão de performance, ele pode reduzir a confiança da China nas GPUs da NVIDIA.

Os testes da Deepseek revelaram que o processador 910C excedeu as expectativas no desempenho da inferência. Além disso, com otimizações manuais dos núcleos CUNN, sua eficiência pode ser melhorada. O suporte nativo da Deepseek para processadores Ascend e seu repositório Pytorch permite a conversão contínua do CUDA-para-CUNN com um esforço mínimo, facilitando a integração do hardware da Huawei nos fluxos de trabalho da IA.

Isso sugere que as capacidades do processador de IA da Huawei estão avançando rapidamente, apesar das sanções do governo dos EUA e da falta de acesso às tecnologias de processo de ponta do TSMC.

Embora a Huawei e a SMIC tenham conseguido acompanhar as capacidades da TSMC na era 2019-2020 e produzir um chip que pode ser considerado competitivo com os processadores A100 e H100 da NVIDIA, o Ascend 910C não é a melhor opção para treinamento de IA. O treinamento de IA continua sendo um domínio em que a Nvidia mantém seu lead indiscutível.

Yuchen Jin, de Deepseek, disse que a confiabilidade do treinamento de longo prazo é uma fraqueza crítica dos processadores chineses. Esse desafio decorre da profunda integração do ecossistema de hardware e software da NVIDIA, que foi desenvolvido ao longo de duas décadas. Embora o desempenho da inferência possa ser otimizado, as cargas de trabalho de treinamento sustentadas exigem melhorias adicionais na pilha de hardware e software da Huawei.

Assim como o Ascend 910 original, o novo Ascend 910C usa a embalagem do chiplet, e seu SoC de computação principal tem cerca de 53 bilhões de transistores. Enquanto o chiplet de computação original do ascend 910 foi feito pelo TSMC usando sua tecnologia de fabricação N7+ (classe 7nm com EUV), o chiplelet de computação do ascendente 910C é feito pela SMIC em sua 2ª geração de tecnologia de processo de classe 7nm conhecida como n+ 2.

Olhando para o futuro, alguns especialistas prevêem que, à medida que os modelos de IA convergem para arquiteturas de transformadores, a importância do ecossistema de software da NVIDIA pode diminuir. A experiência da Deepseek na otimização de hardware e software também pode reduzir significativamente a dependência da NVIDIA, oferecendo às empresas de IA uma alternativa mais econômica, principalmente para inferência. No entanto, para competir em escala global, a China deve superar o desafio de treinar a estabilidade e refinar ainda mais sua infraestrutura de computação de IA.

Fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui