- Nvidia integra Deepseek-R1 como um microsserviço NIM
- A AWS suporta Deepseek-R1 com foco em implantação de IA escalável e econômica
- A Microsoft também tem futuros planos de implantação local para Deepseek
Tendo tomado o mundo da IA por tempestade nas últimas semanas, a Deepseek agora fez progressos significativos na expansão da acessibilidade de seus modelos avançados de raciocínio.
A empresa anunciou seu principal modelo de Deepseek R1 agora está disponível em várias plataformas, incluindo NVIDIA, AWS e Github.
A natureza de código aberto da DeepSeek permite que os desenvolvedores construam modelos com base em sua arquitetura e, no momento da imprensa, existem 3.374 modelos baseados em Deepseek disponíveis disponíveis para o Modelos de Desenvolvimento Colaborativo.
Nvidia, AWS, Github & Azure agora oferecem Deepseek
Na AWS, os modelos Deepseek-R1 agora estão acessíveis através da Amazon Bedrock, que simplifica a integração da API e o Amazon Sagemaker, que permite personalização e treinamento avançados, apoiados pela AWS Trainium e Inferentia para eficiência de custos otimizados.
A AWS também oferece Deepseek-R1-Distill, uma versão mais clara, através da importação de modelos personalizada da Amazon Bedrock. Essa implantação sem servidor simplifica o gerenciamento de infraestrutura, mantendo a escalabilidade.
A Nvidia também integrou o Deepseek-R1 como um microsserviço NIM, alavancando sua arquitetura de tremonha e aceleração do motor do transformador FP8 para fornecer respostas em tempo real e de alta qualidade.
O modelo, que possui 671 bilhões de parâmetros e um comprimento de contexto de 128.000 toques, utiliza a escala no tempo de teste para maior precisão.
Também se beneficia da arquitetura Hopper da NVIDIA, usando a aceleração do motor do transformador FP8 e a conectividade NVLink. Em execução em um sistema HGX H200, o Deepseek-R1 pode gerar até 3.872 tokens por segundo.
O Azure AI Foundry e o Github da Microsoft expandiram ainda mais o Reach da Deepseek, oferecendo aos desenvolvedores uma plataforma segura e escalável para integrar a IA em seus fluxos de trabalho.
A Microsoft também implementou medidas de segurança extensas, incluindo filtragem de conteúdo e avaliações automatizadas. A empresa afirma que planeja oferecer versões destiladas da DeepSeek-R1 para implantação local em copilot+ PCs no futuro.
Deepseek-R1 conquistou o mundo, oferecendo um modelo de IA poderoso e econômico com recursos avançados de raciocínio e destronou modelos populares de IA como o ChatGPT.
O R1 foi treinado por apenas US $ 6 milhões, com suas versões mais avançadas sendo cerca de 95% mais baratas para treinar do que os modelos comparáveis da NVIDIA e da Microsoft.