Como outras entidades chinesas, a ByteDance, proprietária do TikTok, não pode comprar as GPUs Nvidia de mais alto desempenho e instalá-las em seus data centers na China. No entanto, a empresa descobriu que ainda pode usar GPUs Nvidia localizadas fisicamente em data centers em nuvem em outros países. No próximo ano, a empresa pretende expandir o uso dessas GPUs e gastar até US$ 7 bilhões no acesso às GPUs Nvidia, relata The Information, citando suas próprias fontes. ByteDance negou o relatório.
O relatório diz que a ByteDance planeja investir mais de US$ 20 bilhões em infraestrutura de IA, incluindo US$ 7 bilhões no acesso a GPUs Nvidia avançadas na nuvem, data centers e até cabos submarinos. Os EUA proíbem a ByteDance de comprar GPUs Nvidia e de usar serviços de nuvem americanos. No entanto, não pode bloquear o acesso da ByteDance a serviços em nuvem em outros lugares, por exemplo, no Oriente Médio ou em países asiáticos. Como resultado, a ByteDance pode acessar os processadores americanos enquanto adere tecnicamente às sanções dos EUA contra os setores de IA e HPC da China.
ByteDance negou o relatório. No entanto, se o relatório estiver correto e a ByteDance investir US$ 7 bilhões em acesso à nuvem para GPUs Nvidia, ela será um dos maiores consumidores mundiais de hardware de IA.
O acesso sob demanda às GPUs H100 da Nvidia está prontamente disponível. Nos EUA, o preço de acesso às GPUs H100 começa em US$ 1,33 por hora para compromissos de longo prazo. Os preços em outros países devem ser mais ou menos comparáveis, e por cerca de US$ 1,3 por hora, a ByteDance poderá alugar um cluster de 614.682 GPUs H100 funcionando 24/7/365 em 2025 por US$ 7 bilhões.
Não temos certeza de que existam cerca de 615.000 GPUs H100 disponíveis para aluguel no Oriente Médio e na Ásia, e também não temos certeza de que a ByteDance precise de tantos processadores para suas cargas de trabalho de treinamento e inferência, já que seus projetos de IA são bastante limitados. Por exemplo, possui o chatbot Doubao AI com 51 milhões de usuários ativos, que se acredita ser seu maior projeto. Portanto, ou a empresa gastará menos no aluguel de sua infraestrutura de IA, ou planeja expandir significativamente seus projetos de IA e, portanto, precisa de mais recursos de IA, ou pretende continuar adquirindo as GPUs H20 HGX e B20 reduzidas da Nvidia para rodar em sua própria datacenters na China, além de alugar processadores de provedores de nuvem. Por exemplo, a ByteDance supostamente gastou mais de US$ 2 bilhões em mais de 200.000 GPUs Nvidia H20 em 2024, e é improvável que a empresa pare de comprar seu próprio hardware e se concentre inteiramente em confiar em provedores de nuvem de outros países.
Notavelmente, a ByteDance também está trabalhando com a Broadcom para desenvolver seus próprios processadores de IA para reduzir sua dependência da Nvidia. Há rumores de que a empresa trabalhará em dois processadores: um para treinamento e outro para inferência. Os chips são projetados para serem fabricados pela TSMC em suas tecnologias de processo N4/N5 e entrarão em produção em massa em 2026. Embora a ByteDance provavelmente não consiga tornar suas GPUs significativamente mais rápidas do que o HGX H20 da Nvidia devido às restrições de controle de exportação dos EUA (o que impediria TSMC de enviar GPUs de alto desempenho para entidades chinesas), os processadores internos serão consideravelmente mais econômicos para a empresa.