Principais Modelos de IA Ficaram para Trás em Tarefas Corporativas Rotineiras, Diz a Databricks; Modelos Menores e Especializados Têm Melhor Desempenho

Mensagem do Gate News, 20 de abril — Os principais modelos de IA se destacam ao resolver problemas complexos como matemática de olimpíada, mas têm dificuldade com o trabalho corporativo rotineiro, segundo David Meyer, da Databricks. Alguns modelos podem corrigir um número de fatura incorreto em vez de sinalizá-lo como erro, enquanto ferramentas de codificação como Claude também podem ficar aquém em tarefas de engenharia de dados.

A lacuna se origina de diferenças fundamentais entre os dados corporativos e o texto público da web usado para treinar modelos grandes. Os dados corporativos frequentemente têm rótulos de colunas pouco claros, muitos campos em branco e códigos armazenados como texto simples. Em um estudo acadêmico, a pontuação F1 de um modelo de IA, que equilibra precisão e recall, caiu de 0,94 em dados públicos para 0,07 em dados corporativos para uma tarefa de engenharia de dados. Além disso, modelos grandes tendem a voltar a padrões familiares do treinamento; alguns voltaram a Structured Query Language (SQL) mesmo depois de receber instruções e documentação para a linguagem proprietária de consultas de uma empresa.

Modelos menores de código aberto, ajustados com aprendizado por reforço, conseguem lidar com tarefas específicas de forma mais eficiente e com custos de treinamento significativamente menores do que modelos gerais grandes. A Databricks está construindo agentes de IA menores para fluxos de trabalho específicos, como KARL, que usa aprendizado por reforço para raciocínio em múltiplas etapas com documentos da empresa. A indústria está mudando da dependência de modelos gigantes para arquiteturas híbridas, em que modelos pequenos e eficientes lidam com o volume rotineiro e, então, escalam apenas casos pouco claros ou complexos para sistemas maiores e mais caros.

A Databricks adquiriu recentemente a Quotient AI para ajudar grandes empresas a executar agentes de IA com mais confiabilidade. A competição no negócio de IA agora se concentra em executar todo o ciclo de vida da IA, incluindo sistemas de feedback para rastrear erros e melhorar continuamente os modelos ao longo do tempo, tornando ferramentas de avaliação e ajuste cada vez mais valiosas após a implantação.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

OpenClaw Lança a versão v2026.4.29 em 29 de abril, Atualiza a memória para um Wiki personalizado com rastreamento de relacionamento

De acordo com Beating, o assistente de IA open-source OpenClaw (GitHub com 367K estrelas) lançou a versão v2026.4.29 em 29 de abril, marcando sua segunda atualização em dois dias. O sistema de memória evoluiu de uma simples recuperação baseada em recall para uma wiki personalizada, permitindo que os agentes construam automaticamente perfis de personagens e acompanhem r

GateNews8h atrás

O CEO do Google, Pichai, revelou que usa a IA Gemini para compreender a natureza humana e criar comunicações mais sinceras.

Pichai afirmou que, antes de reuniões importantes, ele usa a perspectiva do Gemini para analisar e prever o estado mental da outra parte, a fim de aumentar a empatia e promover uma comunicação mais sincera. Agentes de IA também podem organizar automaticamente e-mails, cronogramas e resumos, tornando as tarefas do dia a dia mais eficientes. Além disso, uma plataforma de IA baseada na cocriação aberta está ganhando impulso: tecnologias abertas como o Gemini 4 reduzem a barreira de entrada; ao mesmo tempo, enfatiza a criação de estruturas de governança de IA, com participação de governos e da sociedade para lidar com desafios como segurança cibernética, deepfakes e sustentabilidade.

ChainNewsAbmedia11h atrás

Oobit lança cartões de agentes de IA compatíveis com Visa nesta quinta-feira, permitindo gastar USDT sem conversão para fiat

Segundo o The Block, a startup de carteira apoiada pela Tether, Oobit, lançou AI Agent Cards na quinta-feira, permitindo que bots autônomos façam compras usando saldos em USDT sem converter para moeda fiduciária ou acessar diretamente credenciais de cartão corporativo. Os cartões, suportados pela Visa, podem ser usados online onde quer que a Visa seja acessível

GateNews11h atrás

ChimpX AI arrecada US$ 2,8 milhões em rodada Seed liderada pela Waterdrip Capital e pela MetaLabs Ventures

A ChimpX AI anunciou hoje o encerramento de uma rodada seed de US$ 2,8 milhões para acelerar o desenvolvimento do Mojo AI, um agente de execução que transforma intenções em linguagem natural em transações DeFi on-chain na Solana. A rodada foi liderada pela Waterdrip

GateNews13h atrás

Principal CEX lança protocolo de pagamentos por agentes em 29 de abril, permitindo transações cross-chain orientadas por IA

De acordo com um anúncio recente, uma principal exchange de criptomoedas lançou em 29 de abril o Agent Payments Protocol, um padrão aberto que permite que agentes de inteligência artificial executem transações comerciais completas em várias redes blockchain sem intervenção humana. O protocolo

GateNews13h atrás

Walrus Lança o MemWal SDK para Memória de Agentes de IA

A Walrus lançou o MemWal, um SDK projetado para abordar limitações na memória agentic, trazendo verificabilidade, disponibilidade, portabilidade e compartilhabilidade para como agentes de IA armazenam e acessam informações, segundo Abinhav Garg, Product Manager do Mysten Labs Group. Memória verificável e portátil

CryptoFrontier14h atrás
Comentário
0/400
Sem comentários