No filme de ficção científica Chegada, de 2016, um linguista se depara com a difícil tarefa de decifrar uma língua alienígena que consiste em frases palindrômicas, que são lidas da mesma forma de trás para frente e de trás para frente, escritas com símbolos circulares. À medida que ela descobre várias pistas, diferentes nações ao redor do mundo interpretam as mensagens de maneira diferente – algumas assumindo que elas transmitem uma ameaça.
Se a humanidade acabou hoje numa situação assim, a nossa melhor aposta poderá ser recorrer à investigação que descubra como inteligência artificial (IA) desenvolve linguagens.
Mas o que exatamente define uma linguagem? A maioria de nós usa pelo menos um para se comunicar com as pessoas ao nosso redor, mas como isso aconteceu? Os linguistas têm pensado esta mesma questão há décadasmas não há maneira fácil para descobrir como a linguagem evoluiu.
A linguagem é efêmera, não deixa vestígios examinados nos registros fósseis. Ao contrário dos ossos, não podemos desenterrar línguas antigas para estudar como se desenvolveram ao longo do tempo.
Embora não possamos estudar a verdadeira evolução da linguagem humana, talvez uma simulação possa fornecer alguns insights. É aí que entra a IA – um fascinante campo de pesquisa chamado comunicação emergenteque passei os últimos três anos estudando.
Para simular como a linguagem pode evoluir, atribuímos aos agentes (IAs) tarefas simples que requerem comunicação, como um jogo em que um robô deve guiar outro para um local específico em uma grade sem mostrar-lhe um mapa. Não oferecemos (quase) nenhuma restrição sobre o que eles podem dizer ou como – simplesmente damos-lhes a tarefa e deixamos que a resolvam como quiserem.
Como a resolução destas tarefas exige que os agentes comuniquem entre si, podemos estudar como a sua comunicação evolui ao longo do tempo para ter uma ideia de como a linguagem pode evoluir.
Relacionado: Equipe de pai e filha decodifica ‘sinal alienígena’ de Marte que deixou o mundo perplexo por um ano
Semelhante experimentos foram feitos com humanos. Imagine que você, um falante de inglês, está emparelhado com alguém que não fala inglês. Sua tarefa é instruir seu parceiro a pegar um cubo verde de uma variedade de objetos sobre uma mesa.
Você pode tentar gesticular em forma de cubo com as mãos e apontar para a grama do lado de fora da janela para indicar a cor verde. Com o tempo, vocês desenvolveriam juntos uma espécie de protolinguagem. Talvez você crie gestos ou símbolos específicos para “cubo” e “verde”. Através de interações repetidas, estes sinais improvisados tornar-se-iam mais refinados e consistentes, formando um sistema básico de comunicação.
Isso funciona de forma semelhante para IA. Através tentativa e erro, eles aprendem para se comunicarem sobre os objetos que veem, e seus interlocutores aprendem a entendê-los.
Mas como sabemos do que eles estão falando? Se eles só desenvolvem esta linguagem com o seu interlocutor artificial e não connosco, como saberemos o que cada palavra significa? Afinal, uma palavra específica pode significar “verde”, “cubo” ou pior – ambos. Este desafio de interpretação é uma parte fundamental da minha pesquisa.
Quebrando o código
A tarefa de compreender a linguagem da IA pode parecer quase impossível à primeira vista. Se eu tentasse falar polonês (minha língua materna) com um colaborador que só fala inglês, não conseguiríamos nos entender nem saber onde começa e termina cada palavra.
O desafio com as linguagens de IA é ainda maior, pois podem organizar a informação de formas completamente estranhas aos padrões linguísticos humanos.
Felizmente, os linguistas desenvolveram sofisticado ferramentas usando a teoria da informação para interpretar línguas desconhecidas.
Assim como os arqueólogos reúnem línguas antigas a partir de fragmentos, usamos padrões em conversas de IA para compreender a sua estrutura linguística. Às vezes encontramos semelhanças surpreendentes às línguas humanas, e outras vezes descobrimos formas inteiramente novas de comunicação.
Estas ferramentas ajudam-nos a espreitar a “caixa negra” da comunicação da IA, revelando como os agentes artificiais desenvolvem as suas próprias formas únicas de partilhar informações.
Meu trabalho recente concentra-se em usar o que os agentes veem e dizem para interpretar sua linguagem. Imagine ter a transcrição de uma conversa em um idioma desconhecido, junto com o que cada interlocutor estava vendo. Podemos combinar padrões na transcrição com objetos no campo de visão do participante, construindo conexões estatísticas entre palavras e objetos.
Por exemplo, talvez a frase “yayo” coincida com um pássaro voando – poderíamos adivinhar que “yayo” é a palavra do locutor para “pássaro”. Através de uma análise cuidadosa desses padrões, podemos começar a decodificar o significado por trás da comunicação.
Em o último artigo por mim e por meus colegas, que aparecerão nos anais da conferência Neural Information Processing Systems (NeurIPS), mostramos que tais métodos podem ser usados para fazer engenharia reversa de pelo menos partes da linguagem e sintaxe das IAs, dando-nos insights sobre como eles pode estruturar a comunicação.
Alienígenas e sistemas autônomos
Como isso se conecta aos alienígenas? Os métodos que estamos desenvolvendo para compreender as linguagens da IA podem nos ajudar a decifrar quaisquer futuras comunicações alienígenas.
Se conseguirmos obter algum texto estranho escrito juntamente com algum contexto (como informação visual relativa ao texto), poderemos aplicar as mesmas ferramentas estatísticas para analisá-los. As abordagens que estamos a desenvolver hoje podem ser ferramentas úteis no estudo futuro de línguas alienígenas, conhecidas como xenolinguística.
Mas não precisamos encontrar extraterrestres para nos beneficiarmos desta pesquisa. Há inúmeras aplicaçõesde melhorando modelos de linguagem como ChatGPT ou Claude para melhorar a comunicação entre veículos autônomos ou drones.
Ao decodificar linguagens emergentes, podemos tornar a tecnologia futura mais fácil de entender. Quer se trate de saber como os carros autónomos coordenam os seus movimentos ou como os sistemas de IA tomam decisões, não estamos apenas a criar sistemas inteligentes – estamos a aprender a compreendê-los.
Este artigo editado foi republicado em A conversa sob uma licença Creative Commons. Leia o artigo original.