Karpathy: A perceção das capacidades da IA apresenta uma falha grave; a versão gratuita e o Agent de ponta são «produtos completamente diferentes»

O antigo diretor-geral de IA da Tesla e membro fundador da OpenAI, Andrej Karpathy, publicou um longo texto no X no dia 9 de abril, afirmando que a perceção do público sobre as capacidades da IA está a dividir-se gravemente. Segundo ele, as pessoas que usam o ChatGPT na versão gratuita e os técnicos que usam diariamente ferramentas de agentes de ponta como Codex e Claude Code estão, na prática, a discutir “produtos completamente diferentes”, mas ambos os lados acreditam que estão a ver a totalidade do que é a IA.

Dois mundos, duas perceções de IA

Karpathy divide os utilizadores atuais de IA em dois grupos.

O primeiro grupo experimentou a versão gratuita do ChatGPT em algum momento do ano passado e formou com isso a sua perceção global da IA. O que veem são vários erros do modelo — alucinações, resultados de pesquisa absurdos e até falhas em problemas simples, como “devo conduzir ou ir a pé para lavar o carro” no modo de voz. Karpathy reconhece que estes problemas de facto existem, mas sublinha que a versão gratuita e modelos desatualizados não conseguem representar com fidelidade as capacidades reais dos modelos de agentes de ponta até 2026.

O segundo grupo cumpre simultaneamente duas condições: usa, com pagamento, os mais recentes modelos de agentes de ponta (como OpenAI Codex ou Claude Code) e recorre a eles de forma profissional em áreas técnicas como desenvolvimento de software, matemática e investigação. Karpathy chama a este grupo um estado de “psicose de IA” altamente intenso, porque os progressos recentes destes modelos nas áreas técnicas “só podem ser descritos como surpreendentes” — é possível ver, literalmente, como resolvem em uma hora problemas de arquitetura de programação que antes exigiam dias ou até semanas.

Porque o progresso se concentra nas áreas técnicas

Karpathy explica porque é que a melhoria nas capacidades de IA é especialmente marcante em áreas técnicas como desenvolvimento de programação, mas menos evidente em usos gerais como pesquisa, escrita e recomendações.

Existem duas razões: primeiro, as áreas técnicas fornecem funções de recompensa verificáveis (por exemplo, se os testes unitários passam), o que permite que o treino por aprendizagem por reforço funcione de forma eficaz; em contrapartida, é difícil determinar de forma clara a qualidade de um texto. Segundo, as áreas técnicas têm mais valor comercial em cenários B2B, por isso as empresas de IA investem a maior parte dos recursos das suas equipas nessas direções.

Estes dois grupos não se conseguem entender

Karpathy conclui que estes dois grupos estão a “falar entre si”. O modo de voz da versão gratuita da OpenAI falha em problemas do dia a dia, enquanto o Codex da versão paga mais avançada da OpenAI consegue, em uma hora, reestruturar toda a base de código ou detetar vulnerabilidades do sistema — e ambas as coisas são verdade ao mesmo tempo.

Nas suas respostas subsequentes, ele acrescentou que alguém lhe apresentou uma perspetiva: o incidente do OpenClaw atraiu tanta atenção social precisamente porque fez com que muitos não especialistas em tecnologia tivessem contacto pela primeira vez com os modelos de agentes mais recentes, e essas pessoas até então só sabiam que IA era sinónimo de ChatGPT na versão web.

Este artigo de Karpathy: a perceção das capacidades de IA apresenta uma rutura grave, a versão gratuita e os agentes de ponta são “produtos completamente diferentes” apareceu pela primeira vez em Cadeia de Notícias ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Solana Foundation, Google Cloud lança o sistema de pagamentos do agente de IA Pay.sh

A Solana Foundation fez parceria com a Google Cloud para desenvolver o Pay.sh, um novo sistema de pagamentos para bots de IA que permite aos agentes descobrir, aceder e pagar o uso de APIs utilizando stablecoins na Solana, segundo um anúncio na terça-feira. Através deste padrão aberto, os agentes de IA poderão

CryptoFrontier2h atrás

A Anthropic lança dez agentes de IA para serviços financeiros na terça-feira

A Anthropic lançou na terça-feira dez novos agentes de IA concebidos para lidar com tarefas de serviços financeiros, incluindo a elaboração de apresentações para reuniões com clientes, a revisão de demonstrações financeiras e a escalada de casos para revisão de conformidade. As ferramentas visam profissionais nos setores bancário, de seguros, gestão de ativos e fintech.

GateNews4h atrás

Oobit lança cartões Visa USDT com IA para empresas a 5 de maio

De acordo com a Oobit, a 5 de maio, a plataforma de pagamentos suportada pela Tether lançou cartões virtuais Visa que permitem que agentes de IA realizem transações de forma autónoma usando USDT. Os cartões permitem que sistemas orientados por IA executem decisões de gastos sem intervenção humana direta, assinalando um passo significativo

GateNews4h atrás

A Animoca Brands lança um programa de investimento de 10 milhões de dólares para programadores de agentes de IA da Minds

De acordo com a ChainCatcher, a Animoca Brands lançou um programa de investimento de 10 milhões de dólares para apoiar os primeiros programadores a construírem aplicações na sua plataforma de agentes Minds AI, acelerando o desenvolvimento do ecossistema da Agentic Web (Web4). O programa visa equipas com uma lógica de produto clara e escalável

GateNews4h atrás

Cimeira AMPLIFY 2026 em Hong Kong é concluída a 20-21 de abril, com foco em IA, Web3 e crescimento quantitativo

O AMPLIFY 2026 Hong Kong Summit terminou a 20-21 de abril, reunindo CEOs de importantes instituições cripto-financeiras globais, investidores de destaque e especialistas do setor para dois dias de discussões. Organizado pela ChainTimes e GAEA VENTURES, e coorganizado pela AetheriumX, Origins Network, Monera

GateNews5h atrás

Yield.xyz e Privy lançam uma infraestrutura de agente de rendimento com IA para suportar mais de 80 blockchains a 5 de maio

De acordo com a BlockBeats, a 5 de maio, a plataforma de infraestruturas de rentabilidade DeFi Yield.xyz e a Privy, empresa de infraestruturas de carteira cripto da Stripe, lançaram uma infraestrutura de agente de rentabilidade com IA que suporta a execução automatizada de estratégias em mais de 80 blockchains e mais de 2.900 oportunidades de rentabilidade DeFi. A solução

GateNews5h atrás
Comentar
0/400
Nenhum comentário