A Anthropic Identifica Três Mudanças na Camada de Produto Por Trás da Queda de Qualidade do Claude Code, e Não um Problema de Modelo

Mensagem do Gate News, 23 de abril — A equipe de engenharia da Anthropic confirmou que a degradação da qualidade do Claude Code relatada pelos usuários no último mês se deveu a três mudanças independentes na camada de produto, e não a problemas de API ou do modelo subjacente. Os três problemas foram corrigidos em 7 de abril, 10 de abril e 20 de abril, respectivamente, com a versão final agora em v2.1.116.

A primeira mudança ocorreu em 4 de março, quando a equipe reduziu o nível de esforço de raciocínio padrão do Claude Code de “high” para “medium” para tratar picos ocasionais de latência extrema no Opus 4.6 sob alta intensidade de raciocínio. Após queixas generalizadas dos usuários sobre desempenho reduzido, a equipe reverteu a mudança em 7 de abril. O padrão atual agora é “xhigh” para o Opus 4.7 e “high” para outros modelos.

O segundo problema foi um bug introduzido em 26 de março. O sistema foi projetado para limpar registros antigos de raciocínio após a inatividade da conversa exceder uma hora, para reduzir custos de recuperação de sessão. Porém, uma falha na implementação fez com que a limpeza fosse executada repetidamente em cada turno subsequente, em vez de uma única vez, fazendo com que o modelo perdesse progressivamente o contexto de raciocínio anterior. Isso se manifestou como aumento da falta de memória, operações repetidas e invocações anormais de ferramentas. O bug também resultou em falhas de cache em toda solicitação, acelerando o consumo do limite de cota do usuário. Dois experimentos internos não relacionados mascararam as condições de reprodução, estendendo o processo de depuração para mais de uma semana. Após a correção em 10 de abril, a equipe revisou o código problemático usando o Opus 4.7 e descobriu que o Opus 4.7 conseguia identificar o bug enquanto o Opus 4.6 não.

A terceira mudança foi lançada em 16 de abril junto com o Opus 4.7. A equipe adicionou instruções ao prompt do sistema para reduzir a saída redundante. Testes internos ao longo de várias semanas não mostraram regressão, mas após o lançamento a interação com outros prompts degradou a qualidade de codificação. Avaliações estendidas revelaram uma queda de desempenho de 3% tanto no Opus 4.6 quanto no 4.7, levando a um rollback em 20 de abril.

Essas três mudanças afetaram grupos de usuários diferentes em momentos diferentes, e seu efeito combinado gerou uma queda de qualidade ampla e inconsistente, complicando o diagnóstico. A Anthropic afirmou que agora será necessário que mais funcionários internos usem a mesma versão pública de build que os usuários, executem conjuntos completos de avaliação do modelo para cada modificação no prompt do sistema e implementem períodos de rollout em etapas. Como compensação, a Anthropic redefiniu as cotas de uso de todos os usuários assinantes.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Plataforma Financeira de IA Rogo Capta $160M na Série D Liderada pela Kleiner Perkins em Menos de 3 Meses

De acordo com Beating, a plataforma de IA Rogo, projetada para cenários financeiros de alta frequência, concluiu uma rodada de financiamento de $160 milhões Série D em abril de 2026, liderada pela Kleiner Perkins com participação da Sequoia, Thrive Capital, Khosla Ventures e J.P. Morgan. O aporte aconteceu menos de três meses

GateNews5h atrás

China Bloqueia Aquisição de Manus por IA Apoiados pela Meta em 29 de abril, Citando Preocupações com Segurança de Tecnologia e Dados

De acordo com a PANews, em 29 de abril, o escritório de análise de segurança de investimentos da Comissão Nacional de Desenvolvimento e Reforma da China baniu uma aquisição estrangeira do projeto Manus e exigiu que a transação fosse encerrada. Manus, anunciado como o primeiro agente de inteligência artificial geral do mundo, tinha

GateNews5h atrás

Alibaba Cloud reduz o preço do cache implícito do DeepSeek-V4-Pro para 1 yuan por milhão de tokens em 29 de abril

De acordo com a Alibaba Cloud, sua plataforma Bailian reduzirá o preço do cache implícito do modelo DeepSeek-V4-Pro (Implicit Cache) para 1 yuan por milhão de tokens, a partir de 29 de abril de 2026 às 23:59:59, horário de Pequim. O cache implícito só se aplica quando as solicitações atingem o cache; os tokens de entrada em cache são cobrados na taxa cached_token, enquanto os tokens de entrada sem cache são cobrados nas taxas padrão de input_token. O ajuste afeta apenas o preço do cache implícito; as taxas de inferência do modelo base permanecem inalteradas.

GateNews6h atrás

Plataforma de IA Certifyde arrecada $2M na rodada seed com o CEO da Ripple Brad Garlinghouse

De acordo com o ChainCatcher, a plataforma de aplicativos de IA Certifyde anunciou a conclusão de uma rodada de financiamento seed de $2 milhões. Os investidores incluem K5 Global, Flamingo Capital e investidores-anjo como o CEO da Ripple, Brad Garlinghouse, o cofundador da Honey, George Ruan, e o cofundador da Nutra, Roland

GateNews8h atrás

DeepSeek Lança Recurso de Reconhecimento de Imagens em Testes Beta

De acordo com a PANews, a DeepSeek lançou hoje o seu recurso de reconhecimento de imagens (29 de abril), atualmente em testes beta. Usuários da versão web e do aplicativo móvel podem ser selecionados para o lançamento em beta.

GateNews9h atrás
Comentário
0/400
Sem comentários