Admin
Quão perto a IA está da inteligência humana?
Modelos de linguagem avançados, como o o1 da OpenAI, reacenderam o debate sobre a possibilidade de alcançar a inteligência artificial geral (IAG). No entanto, muitos especialistas afirmam que esses modelos não alcançarão esse marco sozinhos.
Em setembro, a OpenAI lançou seu mais recente sistema de inteligência artificial com uma promessa ambiciosa: apresentar o o1, um conjunto de modelos de linguagem avançados, como uma IA mais próxima de como uma pessoa pensa, em comparação com versões anteriores. A OpenAI, com sede em São Francisco, afirma que o o1 representa um novo nível de capacidade de IA.
Este lançamento reacendeu o debate que existe há décadas: quanto falta para que uma máquina seja capaz de realizar todas as tarefas cognitivas que os cérebros humanos podem lidar, como a capacidade de generalizar de uma tarefa para outra, raciocínio abstrato, planejamento e a escolha dos aspectos do mundo a investigar e aprender? Uma inteligência artificial geral (IAG) poderia lidar com problemas complexos como as mudanças climáticas, pandemias ou curas para doenças como câncer e Alzheimer. No entanto, seu enorme poder também traria incerteza e riscos para a humanidade. Como alerta Yoshua Bengio, pesquisador de aprendizado profundo da Universidade de Montreal, “coisas ruins podem acontecer devido ao mau uso da IA ou pela perda de controle sobre ela”.
A revolução nos modelos de linguagem dos últimos anos gerou especulações sobre a possibilidade de que a IAG esteja mais próxima do que nunca. No entanto, devido à forma como os modelos de linguagem são construídos e treinados, alguns pesquisadores afirmam que eles não serão suficientes para alcançar a IAG sozinhos. “Ainda faltam algumas peças”, diz Bengio.
Por que o debate sobre a IAG mudou?
O termo inteligência artificial geral ganhou popularidade em 2007, quando foi mencionado em um livro editado pelos pesquisadores Ben Goertzel e Cassio Pennachin. Embora seu significado exato ainda seja impreciso, geralmente se refere a um sistema de IA com habilidades de raciocínio e generalização semelhantes às humanas. Ao longo da história da IA, ficou claro que ainda não alcançamos a IAG. Por exemplo, o AlphaGo, programa de IA da Google DeepMind, derrotou os melhores jogadores humanos no jogo de tabuleiro Go, mas suas habilidades são limitadas a esse único campo.
As novas capacidades dos modelos de linguagem mudaram radicalmente esse cenário. Assim como o cérebro humano, os modelos de linguagem possuem uma ampla gama de habilidades que levaram alguns pesquisadores a considerar seriamente que uma forma de IAG pode estar prestes a surgir, ou até mesmo já estar aqui.
O processo de treinamento dos Modelos de Linguagem
Modelos de linguagem como o o1, Claude (da Anthropic) e Gemini (da Google) são redes neurais, modelos de aprendizado de máquina inspirados no cérebro. Essas redes consistem em neurônios artificiais organizados em camadas, com parâmetros ajustáveis que determinam a força das conexões entre eles. Durante o treinamento, os modelos são alimentados com fragmentos de texto e programação. Por meio de um processo chamado predição do próximo token, o modelo deve prever o token ausente em uma sequência de texto. Esse processo permite que o modelo adquira a estrutura estatística da linguagem e o conhecimento contido nos dados.
A arquitetura de rede neural conhecida como transformador permitiu que os modelos de linguagem avançassem além das realizações anteriores. Essa arquitetura permite que um modelo aprenda quais tokens têm uma influência particular sobre outros, mesmo que estejam muito distantes dentro de uma sequência de texto. Essa abordagem tem sido altamente bem-sucedida em tarefas como gerar programas de computador, resumir artigos acadêmicos e responder a perguntas de matemática.
As limitações dos Modelos de Linguagem
Apesar das impressionantes capacidades dos modelos de linguagem, eles ainda têm limitações. Por exemplo, em tarefas que exigem planejamento, o modelo o1 tem um bom desempenho em tarefas com até 16 etapas, mas seu desempenho diminui rapidamente quando o número de etapas supera 20 ou 40. Além disso, o modelo tem dificuldades com o raciocínio abstrato e a generalização, como demonstrado em um teste projetado para avaliar o progresso em direção à IAG. Esses modelos, segundo os especialistas, não podem se adaptar verdadeiramente à novidade, pois não têm a capacidade de recombinar o que aprenderam para lidar com novas tarefas.
Os Modelos de Linguagem podem alcançar a IAG?
Os modelos de linguagem alcançarão a IAG? Os transformadores que sustentam os modelos de linguagem têm a capacidade de processar e encontrar padrões estatísticos não apenas em texto, mas também em imagens e áudios. Embora alguns pesquisadores acreditem que a IAG ainda esteja fora de alcance, os modelos de linguagem baseados em transformadores já exibem alguns comportamentos semelhantes aos da IAG.
No entanto, existem sinais de que os modelos de linguagem baseados em transformadores têm limites. Os dados usados para treinar esses modelos estão se esgotando, e alguns pesquisadores apontam que os avanços nesses modelos estão desacelerando. Além disso, as arquiteturas baseadas apenas em transformadores, de acordo com Raia Hadsell, do Google DeepMind, podem não ser suficientes por si só para alcançar a IAG. Modelos que geram soluções de uma vez ou em grandes blocos podem nos aproximar mais da IAG.
Construindo um Modelo do Mundo
Os avanços em direção à IAG podem se inspirar nas ideias de neurocientistas, que sugerem que nossa inteligência é resultado da capacidade do cérebro de construir um “modelo do mundo”. Esse modelo nos permite imaginar diferentes cursos de ação, prever suas consequências, planejar e raciocinar. Além disso, ele nos permite generalizar habilidades aprendidas em um domínio para novas tarefas, simulando diferentes cenários.
Em conclusão, embora os modelos de linguagem estejam avançando rapidamente, ainda estamos longe de alcançar a IAG. Embora esses modelos mostrem comportamentos surpreendentes, eles ainda são limitados em sua capacidade de raciocinar abstratamente, adaptar-se a novas situações e combinar conhecimentos para resolver tarefas complexas. O caminho até a IAG será longo e exigirá superar vários obstáculos fundamentais.
Fonte: Source: Nature, 2024. www.nature.com