Este artigo de Stanford e Harvard explica por que a maioria dos sistemas de “IA agentic” parecem impressionantes em demonstrações e depois desmoronam completamente no uso real.


Chama-se “Adaptação de IA Agentic” e é o artigo mais importante que li este ano.
Neste momento, todos estão obcecados em construir agentes autónomos. Damos-lhes ferramentas, memória e um objetivo, e esperamos que façam o nosso trabalho.
Mas, quando implantados no mundo real, eles hallucinam chamadas de ferramentas. Falham no planeamento a longo prazo. Quebram-se.
Aqui está o porquê:
Estamos a tentar enfiar toda a aprendizagem no cérebro da IA.
Quando os desenvolvedores tentam corrigir um agente com problemas, geralmente apenas ajustam o modelo principal para produzir respostas finais melhores.
Os investigadores descobriram uma falha fatal nesta abordagem.
Se recompensar uma IA apenas por acertar na resposta final, ela fica preguiçosa.
Ela literalmente aprende a deixar de usar as suas ferramentas. Tenta adivinhar a resposta em vez de fazer o trabalho. Ignora a calculadora e tenta fazer as contas na cabeça.
Para corrigir isto, os investigadores delinearam uma nova estrutura de 4 partes para como os agentes devem realmente aprender.
E a maior conclusão inverte completamente a meta atual.
Em vez de treinar constantemente o “cérebro” enorme e caro do agente, os sistemas mais fiáveis fazem o oposto.
Eles congelam o cérebro. E adaptam as ferramentas.
Chama-se Adaptação de Ferramentas Supervisionada por Agentes.
#GateSquareAprilPostingChallenge
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar