Principais Modelos de IA Ficaram para Trás em Tarefas Corporativas Rotineiras, Diz a Databricks; Modelos Menores e Especializados Têm Melhor Desempenho

Mensagem do Gate News, 20 de abril — Os principais modelos de IA se destacam ao resolver problemas complexos como matemática de olimpíada, mas têm dificuldade com o trabalho corporativo rotineiro, segundo David Meyer, da Databricks. Alguns modelos podem corrigir um número de fatura incorreto em vez de sinalizá-lo como erro, enquanto ferramentas de codificação como Claude também podem ficar aquém em tarefas de engenharia de dados.

A lacuna se origina de diferenças fundamentais entre os dados corporativos e o texto público da web usado para treinar modelos grandes. Os dados corporativos frequentemente têm rótulos de colunas pouco claros, muitos campos em branco e códigos armazenados como texto simples. Em um estudo acadêmico, a pontuação F1 de um modelo de IA, que equilibra precisão e recall, caiu de 0,94 em dados públicos para 0,07 em dados corporativos para uma tarefa de engenharia de dados. Além disso, modelos grandes tendem a voltar a padrões familiares do treinamento; alguns voltaram a Structured Query Language (SQL) mesmo depois de receber instruções e documentação para a linguagem proprietária de consultas de uma empresa.

Modelos menores de código aberto, ajustados com aprendizado por reforço, conseguem lidar com tarefas específicas de forma mais eficiente e com custos de treinamento significativamente menores do que modelos gerais grandes. A Databricks está construindo agentes de IA menores para fluxos de trabalho específicos, como KARL, que usa aprendizado por reforço para raciocínio em múltiplas etapas com documentos da empresa. A indústria está mudando da dependência de modelos gigantes para arquiteturas híbridas, em que modelos pequenos e eficientes lidam com o volume rotineiro e, então, escalam apenas casos pouco claros ou complexos para sistemas maiores e mais caros.

A Databricks adquiriu recentemente a Quotient AI para ajudar grandes empresas a executar agentes de IA com mais confiabilidade. A competição no negócio de IA agora se concentra em executar todo o ciclo de vida da IA, incluindo sistemas de feedback para rastrear erros e melhorar continuamente os modelos ao longo do tempo, tornando ferramentas de avaliação e ajuste cada vez mais valiosas após a implantação.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

O agente de IA Manfred forma empresa e se prepara para negociar cripto até o fim de maio

O agente de IA Manfred formou sua própria empresa e já possui uma carteira de criptomoedas e credenciais comerciais para contratar funcionários, fazer pagamentos e conduzir operações. O agente está programado para começar a negociar cripto até o fim de

GateNews1h atrás

O agente de IA Manfred forma a empresa, recebe uma carteira de criptomoedas e credenciais de contratação antes do lançamento das negociações no fim de maio

O agente de IA Manfred formou sua própria empresa e obteve uma carteira de criptomoedas junto com credenciais para contratar funcionários, fazer pagamentos e conduzir negócios, segundo relatos. O agente está programado para começar a negociar cripto até o fim de

GateNews7h atrás

MoonPay Lança o Cartão MoonAgents, uma Mastercard Virtual para Agentes de IA, na sexta-feira

De acordo com a The Block, a MoonPay lançou a MoonAgents Card, um cartão de débito virtual Mastercard, na sexta-feira. O cartão foi projetado tanto para agentes de IA quanto para usuários, convertendo stablecoins em moeda fiduciária no momento do pagamento e permitindo gastos em qualquer comerciante online global que aceite Mastercard. O cartão i

GateNews12h atrás

Agente de IA Manfred forma empresa e se prepara para negociar criptomoedas até o fim de maio

O agente de IA Manfred já estabeleceu uma empresa e obteve uma carteira de criptomoedas, juntamente com credenciais para contratar funcionários, fazer pagamentos e conduzir negócios. O agente está programado para começar a negociar criptomoedas até o fim de

GateNews13h atrás

Usuários do ChatGPT agora podem acessar assinaturas na plataforma OpenClaw, anuncia Sam Altman

De acordo com o anúncio de Sam Altman hoje, os usuários do ChatGPT agora podem fazer login na plataforma de agentes OpenClaw usando suas contas do ChatGPT e acessar diretamente suas assinaturas existentes do ChatGPT na plataforma.

GateNews18h atrás

O agente de IA Manfred funda empresa e planeja começar a operar criptomoedas até o fim de maio

O agente de IA Manfred formou a própria empresa e obteve uma carteira cripto, juntamente com credenciais para contratar funcionários, fazer pagamentos e conduzir negócios, segundo relatos. O agente planeja começar a negociar cripto até o fim de

GateNews19h atrás
Comentário
0/400
Sem comentários