Início Mundo A equipe de pesquisa da IA ​​afirma reproduzir as principais tecnologias do...

A equipe de pesquisa da IA ​​afirma reproduzir as principais tecnologias do DeepSeek por US $ 30-o modelo R1-zero relativamente pequeno tem habilidades notáveis ​​de solução de problemas

11
0

Uma equipe de pesquisa de IA da Universidade da Califórnia, Berkeley, liderada por Ph.D. O candidato Jiayi Pan, afirma ter reproduzido as principais tecnologias da DeepSeek R1-Zero por apenas US $ 30, mostrando como os modelos avançados podem ser implementados de maneira acessível. De acordo com Jiayi Pan on Fritter, sua equipe reproduziu o DeepSeek R1-Zero no jogo de contagem regressiva, e o pequeno modelo de idioma, com seus 3 bilhões de parâmetros, desenvolveu auto-verificação e habilidades de pesquisa por meio de aprendizado de reforço.

Pan diz que eles começaram com um modelo de linguagem base, rápido e uma recompensa de verdadeira-verdade. A partir daí, a equipe realizou aprendizado de reforço com base no jogo de contagem regressiva. Este jogo é baseado em um programa de jogo britânico com o mesmo nome, onde, em um segmento, os jogadores têm a tarefa de encontrar um número de destino aleatório de um grupo de outros números atribuídos a eles usando aritmética básica.

Fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui