O Agente de IA já pode reproduzir de forma independente artigos acadêmicos complexos: Mollick diz que os erros estão mais no texto original humano do que na IA

Professor Ethan Mollick, da Wharton School da Universidade da Pensilvânia, fez em 25/4 no X uma postagem com uma observação que causa forte impacto na comunidade acadêmica: atualmente, os agentes de IA já conseguem reproduzir de forma independente resultados complexos de pesquisas acadêmicas apenas com descrições públicas do método e dos dados, sem a necessidade de o artigo original e sem o código original. Mollick ainda apontou que, quando essas versões reproduzidas por IA diferem do artigo original, “os erros muitas vezes estão no próprio texto humano, e não na IA”. Isso representa uma virada concreta para a crise de reprodutibilidade na era da IA generativa — a validação entre pares, que antes exigia mão de obra cara, está sendo concluída em larga escala e a baixo custo por IA.

Claude reproduz múltiplos artigos e depois usa o GPT-5 Pro para uma dupla verificação

Em seu blog OneUsefulThing e nesta postagem, Mollick descreveu um experimento específico com Claude: pegar um artigo acadêmico, pedir que ele abra o arquivo de arquivamento, organize os arquivos, converta automaticamente o código do STATA usado para a estatística para Python e, então, execute um a um todos os achados do artigo. Depois de o Claude concluir, ele faz uma segunda rodada de checagem do mesmo resultado de reprodução com o GPT-5 Pro. Vários artigos foram testados do mesmo modo; os resultados foram, em geral, bem-sucedidos, sendo que houve impedimentos apenas quando os arquivos de dados são grandes demais ou quando há problemas com os próprios dados originais de replication data.

Para a comunidade acadêmica, esse tipo de processo normalmente exigia, no passado, que assistentes de pesquisa gastassem semanas ou até meses. A escala de tempo descrita por Mollick é de uma tarde a um dia, e o custo de execução é apenas o custo de tokens de uma API de LLM comercial.

Mais erros estão no texto humano, não na IA

Mais controverso ainda é o julgamento de Mollick sobre “quem errou”. Em sua postagem, ele deixou claro que, quando os resultados reproduzidos por IA não coincidem com o artigo original, na maioria das vezes não é a IA que erra, e sim que o artigo original tem erros no processamento de dados, uso incorreto do modelo ou conclusões além do alcance dos dados que sustentam o estudo. Na psicologia, economia comportamental, administração e outras ciências sociais, já ocorreram várias crises importantes de reprodutibilidade nos últimos dez anos; o caso mais famoso é o grande estudo de reprodução do Open Science Collaboration em 2015, no qual apenas cerca de 36% dos resultados dos artigos de psicologia puderam ser reproduzidos independentemente. O agent de IA está levando esse processo de verificação da fronteira em que “precisa de adequação de recursos humanos” para a fronteira em que “pode ser executado de forma universal”.

Aprenderam ainda não deixar AI entrar na revisão por pares; instituição atrasada em relação à tecnologia

Em outra postagem de 4/25, Mollick citou explicitamente que, na área à qual pertence, a maior associação, a Academy of Management, ainda proíbe formalmente que IA entre no processo de submissão de artigos para avaliação. Ele citou estudos existentes que indicam que a revisão por IA já é superior a alguns avaliadores humanos tradicionais em precisão, consistência e controle de vieses; por isso, “a postura de ‘proibir’” pode, na prática, agravar ainda mais a falha do sistema de revisão que já existe. A lacuna entre esse tipo de instituição e a tecnologia é um tema de política que a comunidade de publicações acadêmicas, as associações e as agências de fomento terão de enfrentar nos próximos 1–2 anos.

Para os leitores, este debate não se limita ao meio acadêmico. Quando o agent de IA consegue verificar descobertas de pesquisa em tempo real, a base acadêmica nas citações de pesquisas industriais, relatórios de políticas e decisões financeiras passará a entrar em um novo critério de verificação: “as conclusões aguentam uma reprodução independente por IA?”. Em complemento à postagem de outro Tweet de Mollick, ele acredita que o governo é a única entidade que pode definir a âncora desse critério de verificação à medida que a intensidade das ferramentas continua a aumentar — e a complexidade do design de políticas, de forma sincronizada, se tornará também um eixo relativamente negligenciado nas discussões de governança de IA.

Este artigo mostra que o AI Agent já pode reproduzir independentemente artigos acadêmicos complexos: Mollick diz que os erros estão mais no texto humano do que na IA, com a primeira aparição em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Bakkt conclui aquisição da DTR em meio a crescimento de receita e reestruturação estratégica

Bakkt concluiu a aquisição da Distributed Technologies Research, uma medida destinada a integrar a infraestrutura de stablecoins nativa de inteligência artificial (IA) aos seus serviços financeiros centrais. Modernizando a liquidação global A Bakkt Inc. finalizou sua aquisição da Distributed Technologies

Coinpedia1h atrás

O agente de IA Manfred forma empresa e se prepara para negociar cripto até o fim de maio

O agente de IA Manfred formou sua própria empresa e já possui uma carteira de criptomoedas e credenciais comerciais para contratar funcionários, fazer pagamentos e conduzir operações. O agente está programado para começar a negociar cripto até o fim de

GateNews2h atrás

O agente de IA Manfred forma a empresa, recebe uma carteira de criptomoedas e credenciais de contratação antes do lançamento das negociações no fim de maio

O agente de IA Manfred formou sua própria empresa e obteve uma carteira de criptomoedas junto com credenciais para contratar funcionários, fazer pagamentos e conduzir negócios, segundo relatos. O agente está programado para começar a negociar cripto até o fim de

GateNews8h atrás

MoonPay Lança o Cartão MoonAgents, uma Mastercard Virtual para Agentes de IA, na sexta-feira

De acordo com a The Block, a MoonPay lançou a MoonAgents Card, um cartão de débito virtual Mastercard, na sexta-feira. O cartão foi projetado tanto para agentes de IA quanto para usuários, convertendo stablecoins em moeda fiduciária no momento do pagamento e permitindo gastos em qualquer comerciante online global que aceite Mastercard. O cartão i

GateNews14h atrás

Agente de IA Manfred forma empresa e se prepara para negociar criptomoedas até o fim de maio

O agente de IA Manfred já estabeleceu uma empresa e obteve uma carteira de criptomoedas, juntamente com credenciais para contratar funcionários, fazer pagamentos e conduzir negócios. O agente está programado para começar a negociar criptomoedas até o fim de

GateNews14h atrás

Usuários do ChatGPT agora podem acessar assinaturas na plataforma OpenClaw, anuncia Sam Altman

De acordo com o anúncio de Sam Altman hoje, os usuários do ChatGPT agora podem fazer login na plataforma de agentes OpenClaw usando suas contas do ChatGPT e acessar diretamente suas assinaturas existentes do ChatGPT na plataforma.

GateNews20h atrás
Comentário
0/400
Sem comentários