A Anthropic pede desculpa pelo “Claude Fable 5” com salvaguardas ocultas, substitui por fallbacks visíveis para o Opus 4,8 esta semana

De acordo com a conta oficial de X da Anthropic a 11 de junho, a empresa pediu desculpa por ter degradado secretamente respostas do Claude Fable 5 para utilizadores suspeitos de construir modelos de IA concorrentes, reconhecendo que as proteções invisíveis eram um "mau equilíbrio". A partir desta semana, os pedidos sinalizados vão recuar de forma visível para o Claude Opus 4.8 em vez de entregar silenciosamente respostas degradadas. Na API, os utilizadores vão agora receber um motivo declarado quando um pedido for recusado, com notificações de retrocesso no lado do servidor a começarem a ser disponibilizadas nos próximos dias. A Anthropic reconheceu o equilíbrio: ao tornar as proteções visíveis, elas ficam mais fáceis de contornar, o que significa que poderão ocorrer mais falsos positivos para trabalhos legítimos de aprendizagem automática à medida que a empresa ajusta os seus sistemas.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário