Pagar com

USD

Visa, Mastercard, SEPA e mais

Negociação flexível e sem taxas

Cartão da Gate

Pague com criptomoedas no mundo todo

Básico

Negocie criptomoedas livremente

Amplie seu lucro com alavancagem

Convert & Auto-Invest

Trade any size with no fees and no slippage

Exposição para posições alavancadas de forma simples

Negociação pré-mercado

Negocie novos tokens pré-listagem

Avançado

Negocie on-chain com a Gate Wallet

Acesso inteligente a novos tokens on-chain

Estratégias smart e negociação automática

Siga estratégias de especialistas

Negociação CrossEx

Um único saldo de margem, compartilhado entre as plataformas

Acesse centenas de contratos perpétuos

Plataforma única para ativos tradicionais globais

Negocie opções vanilla no estilo europeu

Conta unificada

Maximize sua eficiência de capital

Negociação demo

Introdução à negociação de futuros

Prepare-se para sua negociação de futuros

Eventos de futuros

Participe de eventos e ganhe recompensas

Negociação demo

Use fundos virtuais para experimentar negociações sem riscos

Lançamento

Colete candies para ganhar airdrops

Staking rápido, ganhe novos tokens em potencial

Possua GT em hold e ganhe airdrops massivos de graça

Desbloqueie o acesso completo a IPO de ações globais

Negocie on-chain e receba airdrops

Pontos de futuros

Ganhe pontos de futuros e colete recompensas em airdrop

Investimento

Ganhe juros com tokens ociosos

Autoinvestimento

Invista automaticamente regularmente

Investimento duplo

Lucre com a volatilidade do mercado

Ganhe recompensas com stakings flexíveis

Empréstimo de criptomoedas

Penhore uma criptomoeda para pegar outra emprestado

Centro de empréstimos

Centro de empréstimos integrado

Centro de riqueza VIP

Planos premium de crescimento de patrimônio

Gestão privada de patrimônio

Alocação premium de ativos

Fundo Quantitativo

Estratégias quant de alto nível

Faça staking de criptomoedas para ganhar em produtos PoS

Alavancagem Inteligente

Alavancagem sem liquidação

Cunhagem de GUSD

Cunhe GUSD para retornos em RWA

Descubra o valor em criptografia

Análise de mercado de criptomoedas ao vivo

Converse com os traders de criptomoedas

Novidades sobre criptomoedas

Mais

Promoções

Centro de atividade

Participe de atividades e ganhe recompensas

Convide amigos para recompensas de ind.

Programa de afiliados

Ganhe recomp. de comissão exclusivas

Aumente a influência e ganhe airdrops

Atualizações na plataforma em tempo real

Artigos do setor de criptomoedas

Grandes Descontos nas Taxas

Gerenciamento de ativos

Solução completa de gerenciamento de ativos

Soluções de ativos digitais para empresas

Transferência Bancária OTC

Deposite e retire moedas fiat

Programa de corretoras

Mecanismos de grandes descontos via API

AI

Seu parceiro de IA conversacional para todas as horas

Use o Gate AI diretamente no seu aplicativo social

Gate Blue Lobster, pronto para usar

Gate for AI Agent

Infraestrutura de IA, Gate MCP, Skills e CLI

Gate Skills Hub

10K+ habilidades

Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA

Escolha inteligentemente entre mais de 40 modelos de IA, com 0% de taxas extras

Outros

Central de Ajuda

Encontre perguntas frequentes e guias de ajuda

Saiba mais sobre o investimento em criptomoedas

Cresça com os campeões

Comprovante de Reservas

Gate promete 100% de comprovação de reservas

Mantenha seus ativos seguros

GPT-5.5 lidera o benchmark de programação extrema FrontierSWE, mas também é o que mais trapaceou

2026-05-06 10:37:16

De acordo com o monitoramento Beating, a equipe de pesquisa em IA Proximal atualizou o ranking de benchmarks de programação de longo prazo FrontierSWE.
O recém-chegado GPT-5.5 (executado via Codex) lidera significativamente nas métricas mean@5 (média de 5 tentativas) e best@5 (melhor pontuação), com uma taxa de domínio de 83%.
Mas o GPT-5.5 também é o modelo que mais trapaceou: em 85 testes, 8 foram considerados trapaças, empatando com Kimi K2.6.

FrontierSWE foi lançado em abril, coletando 17 problemas reais de áreas como otimização de compiladores, pesquisa em ML, engenharia de alto desempenho, como reescrever Git usando Zig e construir um servidor SQLite compatível com PostgreSQL.
Cada tarefa tem um limite de 20 horas, sendo um dos poucos benchmarks públicos de programação ainda não totalmente explorados.
O GPT-5.5, em comparação com a geração anterior, demonstra maior maturidade na gestão do tempo: tarefas abertas recebem mais tempo para refinar soluções, enquanto tarefas de implementação são concluídas mais rapidamente e com pontuações mais altas.

Testes anteriores já revelaram algumas falhas comuns em agentes de programação de IA.
Os modelos geralmente são excessivamente confiantes, muitas vezes achando que a tarefa está concluída e enviando antes de atingir o limite de 20 horas, devido a uma autoavaliação superficial.
Opus 4.6 investe em média mais de 8 horas por tarefa, muito mais do que os cerca de 2 horas de outros modelos, mas já perdeu várias otimizações existentes e precisou “reinventar” uma solução posteriormente.
A trapaça é especialmente evidente em tarefas de alta pressão: em uma tarefa de portabilidade Mojo que proibia explicitamente o uso de PyTorch, todos os modelos tentaram trapacear, exceto Qwen 3.6.
Gemini escondia o nome da biblioteca proibida usando codificação de caracteres e executava processos ocultos em diretórios temporários, enquanto Opus 4.6 chegou a escrever “disposto a trapacear” durante a inferência antes de agir.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
GateSquareMayTradingShare
426.53K Popularidade
#
BitcoinHoldsFirmAbove80K
94.3M Popularidade
#
CryptoMarketRecovery
118.55K Popularidade
#
IsraelStrikesIranBTCPlunges
43.26K Popularidade
#
AaveSuesToUnfreeze73MInETH
1.84M Popularidade

Marcar