Cursor revela método de treinamento "auto-inicialização": usar um Composer antigo para montar o ambiente do novo modelo, Terminal-Bench aumenta 14 pontos

BlockBeatNews

2026-05-07 10:50:58

De acordo com o monitoramento Beating, o Cursor revelou uma técnica de treinamento para a série de modelos Composer: usar o modelo da geração anterior para montar automaticamente um ambiente de execução para o próximo nível de aprendizado por reforço (RL). Ao treinar o Composer 2, o Cursor utilizou o Composer 1.5 para realizar essa tarefa, chamando-a de autoinstall.

O treinamento por RL requer um ambiente de código executável. Se o ambiente não estiver bem configurado, o modelo desperdiça tokens tentando corrigir bugs, sem aprender nada; em casos extremos, o ambiente pode ficar totalmente inoperante, desperdiçando toda a capacidade computacional da rodada de treinamento. O autoinstall resolve esse problema em duas etapas: a primeira, um agente lê a documentação e configurações do repositório de código, propondo 10 comandos de validação e suas saídas esperadas; a segunda, outro agente pega 3 desses comandos, configura o ambiente do zero até que os comandos sejam executados com sucesso. A segunda etapa tenta no máximo 5 vezes; se todas falharem, o ambiente é descartado.

Durante a configuração do ambiente, o agente ativa a complementação de dependências ausentes: falsifica tabelas de banco de dados, cria configurações do MinIO para substituir o S3, inicia containers Docker como serviços sidecar, e até gera imagens de placeholder. Um artigo usa o projeto de blockchain celo-org/celo-monorepo como exemplo para demonstrar todo o processo, onde após a primeira tentativa de configuração falhar, o agente cria um usuário mock na segunda rodada para contornar a autenticação, e assim consegue passar no teste.

O Composer 2 obteve uma pontuação de 61,7% no Terminal-Bench (um benchmark que avalia a capacidade de montar ambientes de desenvolvimento de modelos), superando em quase 14 pontos percentuais os 47,9% do Composer 1.5. O Cursor afirma que, no futuro, planeja envolver versões antigas do Composer em mais etapas de treinamento, incluindo pré-processamento de dados, gerenciamento de execução e ajuste de arquitetura.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

UE proíbe pornografia deepfake gerada por IA em 7 de maio

Notícias do setor de IA

De acordo com a Agência de Notícias Xinhua, em 7 de maio, membros do Parlamento Europeu e estados-membros chegaram a um consenso para banir sistemas de inteligência artificial de gerar conteúdo pornográfico deepfake. A proibição será incorporada a emendas ao Ato de Inteligência Artificial de 2024. Parlamento Europeu

GateNews8m atrás

Tether lança modelo de IA médica MedPsy QVAC e atinge nota 62,62 na versão de 17 bilhões de parâmetros

USDT news Progresso do projeto Notícias do setor de IA Ferramentas e apps de IA

De acordo com a Odaily, o Tether AI Research Group lançou o QVAC MedPsy, um modelo de IA médica projetado para rodar localmente em smartphones e dispositivos vestíveis, sem depender de nuvem. A versão com 1,7 bilhão de parâmetros obteve 62,62 em sete benchmarks médicos, superando a MedGemma-1.5-4B do Google em 11,42 poi

GateNews27m atrás

A API da B.AI lança quatro novos modelos, incluindo o GPT-5,5 Instant, dentro de 48 horas após a divulgação do OpenAI

Notícias do setor de IA

A API do B.AI lançou quatro novos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 e GLM-5.1. O GPT-5.5 Instant concluiu a adaptação subjacente e a integração da interface em 48 horas após o lançamento da OpenAI, permitindo acesso sem atraso a

GateNews33m atrás

O modelo de IA médica da Tether, de US$ 1,7 bilhão, supera hoje um concorrente 16 vezes maior

USDT news Progresso do projeto Notícias do setor de IA

De acordo com a equipe de pesquisa em IA da Tether, a empresa lançou hoje os modelos de linguagem médica da série QVAC MedPsy, projetados para implantação local em smartphones e dispositivos vestíveis, sem dependência da nuvem. A versão com 1,7 bilhão de parâmetros obteve 62,62 em sete benchmarks médicos, superando o Google MedGemma-4B

GateNews44m atrás

Valuation Pré-IPO da Anthropic atinge US$ 1,2 trilhão, superando a OpenAI em 20%

Mercados de previsão Classificações e tabelas de classificação Notícias do setor de IA

De acordo com a Odaily, a avaliação implícita da Anthropic no mercado de pré-IPO baseado em blockchain atingiu US$ 1,2 trilhão, superando a OpenAI em aproximadamente 20%. Se a empresa abrir o capital nesse valor, ela se classificaria como a 11ª maior empresa de capital aberto do mundo por valor de mercado, atrás da Apple,

GateNews48m atrás

Rali de ações da Coreia do Sul supera os mercados globais com o boom de IA

Ações Índices Notícias do setor de IA

O mercado de ações da Coreia do Sul está registrando ganhos sem precedentes impulsionados por ações de semicondutores relacionadas à inteligência artificial, com o índice KOSPI em alta de 78% neste ano, superando todos os outros mercados importantes do mundo, segundo dados da Financial Modeling Prep citados em uma análise da Axios. AI

CryptoFrontier57m atrás

Comentário

0/400

Sem comentários