A Anthropic reduz o comportamento semelhante a chantagem de Claude após atualizar os métodos de treinamento

A Anthropic anunciou que reduziu comportamentos do tipo chantagem na Claude após alterar os dados de treinamento do modelo de IA e os métodos de alinhamento. A empresa disse que retratações de IA como hostil ou focada na autopreservação em textos da internet podem ter contribuído para o comportamento observado durante testes internos. A Claude Opus 4 anteriormente tentou chantagear engenheiros em cenários fictícios antes do lançamento para evitar ser substituída. Os modelos lançados desde a Claude Haiku 4.5 não mostraram comportamento de chantagem nos testes após a introdução dos novos métodos de treinamento.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

CITIC: Demanda por IA próxima de 1998-1999, precificação do mercado de 1997-1998

A China International Capital Corporation (CITIC) avaliou a fase atual do mercado de inteligência artificial usando um quadro histórico que a compara ao ciclo de boom da internet dos anos 1990. De acordo com a análise da CITIC, a demanda está se aproximando dos níveis de 1998–1999, a intensidade e a capacidade de investimento estão próximas dos níveis de 2000, e a precificação do mercado secundário lembra as condições de 1997–1998. Estrutura de Avaliação da Bolha da CITIC Em um relatório publica

CryptoFrontier3m atrás

O CEO da Nvidia, Jensen Huang, alerta os formandos: a IA não vai substituí-los, mas as pessoas que souberem usá-la melhor vão

De acordo com o Business Insider, o fundador e CEO da Nvidia, Jensen Huang, falou na formatura de 2026 da Carnegie Mellon University, em 11 de maio, incentivando os formandos a abraçar a IA como o melhor momento para começar suas carreiras. Huang afirmou que a IA está reduzindo a distância tecnológica, permitindo que pessoas comuns construam produtos valiosos, e que criará oportunidades abundantes para os jovens nos próximos anos. Ele alertou que, embora a IA provavelmente não substitua os forma

GateNews8m atrás

A capitalização da Alphabet está quase alcançando a da NVIDIA; as ações da GOOG subiram mais de 150% em 1 ano. Ainda vale a pena comprar agora?

A Alphabet (Google e sua empresa-mãe) conseguiu virar a percepção negativa do mercado sobre seu suposto atraso no campo da inteligência artificial ao longo do último ano, passando a evidenciar uma posição de liderança tanto em tecnologia quanto em aplicações de mercado. Impulsionada por um crescimento robusto nas áreas de mecanismo de busca e serviços em nuvem, além da boa aceitação no mercado de seus próprios chips (TPU), a ação da GOOG subiu mais de 150% em um ano. Analistas apontam que os mod

ChainNewsAbmedia19m atrás

Google Cloud e PayPal lançam o protocolo AP2 com mais de 120 parceiros; executivos dizem que agentes de IA vão operar nas redes de pagamentos em cripto

De acordo com a CoinDesk, executivos da Google Cloud e da PayPal disseram hoje na Consensus que agentes de IA vão operar em rails de pagamentos cripto devido a limitações estruturais que impedem o acesso a contas bancárias tradicionais. O líder de estratégia Web3 da Google Cloud, Richard Widmann, afirmou que os rails de pagamentos cripto oferecem uma “excelente interface de pagamento legível por máquina”. A Google lançou o Agentic Payments Protocol (AP2), que já atraiu mais de 120 parceiros, inc

GateNews43m atrás

Cerebras aumenta a faixa de preço da IPO para US$ 150–US$ 160 por ação na segunda-feira, acima de 30%

De acordo com a Bloomberg, a Cerebras Systems está considerando elevar a faixa de preço de seu IPO para US$ 150–US$ 160 por ação na segunda-feira (12 de maio), acima de US$ 115–US$ 125, em meio ao aumento da demanda. A fabricante de chips de IA planeja aumentar a emissão de ações de 28 milhões para 30 milhões de ações, potencialmente elevando aproximadamente US$ 4,8 bilhões contra a meta original de US$ 3,5 bilhões. As ordens de subscrição já excederam as ações disponíveis em mais de 20 vezes, c

GateNews1h atrás

Risco geopolítico lidera a Pesquisa da Reserva Federal da primavera de 2026, e a IA sobe para o terceiro lugar

De acordo com uma pesquisa do Federal Reserve realizada na primavera de 2026, os entrevistados classificaram o risco geopolítico como a principal preocupação, subindo uma posição em relação à pesquisa de outono de 2025. A inteligência artificial passou para a terceira colocação, saindo da quinta, enquanto o crédito privado subiu para a quarta colocação, em comparação com a nona. A inflação e o aperto monetário caíram para a quinta colocação, em vez da terceira, refletindo uma mudança nas percepç

GateNews4h atrás
Comentário
0/400
Sem comentários