Início Mundo O novo ajuste fino de reforço de IA da OpenAI pode transformar...

O novo ajuste fino de reforço de IA da OpenAI pode transformar a forma como os cientistas usam seus modelos

17
0

O segundo dia dos 12 dias de OpenAI da OpenAI mudou para interesses menos espetaculares e mais empresariais em comparação com a implementação geral do modelo OpenAI o1 para ChatGPT no primeiro dia.

Em vez disso, a OpenAI anunciou planos para lançar o Reinforcement Fine-Tuning (RFT), uma forma de personalizar seus modelos de IA para desenvolvedores que desejam adaptar os algoritmos da OpenAI para tipos específicos de tarefas, especialmente as mais complexas. Este lançamento marca uma mudança clara em direção aos aplicativos corporativos em comparação com as atualizações voltadas para o consumidor. Você pode pensar no RFT como um método para melhorar o funcionamento dos modelos de IA por meio do raciocínio para respostas. Usar um conjunto de dados e uma rubrica de avaliação de um desenvolvedor permite que a plataforma da OpenAI treine sua IA especializada sem muito reforço caro de experiências posteriores.



Fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui