Sakana AI e Nvidia alcançam inferência do H100 30% mais rápida, pulando 80% dos cálculos inválidos

Sakana AI e Nvidia disponibilizaram TwELL em código aberto, um formato de dados esparso que permite que as GPUs H100 ignorem 80% das computações inválidas em grandes modelos de linguagem sem comprometer a precisão. A solução oferece até 30% mais velocidade na inferência e 24% mais rapidez no treinamento nas H100, ao mesmo tempo em que reduz o uso máximo de memória. Em testes em um modelo de 1,5 bilhão de parâmetros, a abordagem reduziu os neurônios ativos para abaixo de 2% por meio de regularização leve durante o treinamento, sem degradação de desempenho em sete tarefas downstream.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A Microsoft disponibiliza como código aberto o modelo Phi-Ground 4B, superando o OpenAI Operator e o Claude em precisão ao clicar na tela

Segundo Beating, a Microsoft recentemente disponibilizou em código aberto a família de modelos Phi-Ground, projetada para resolver o problema de onde a IA deve clicar em uma tela de computador. A versão de 4 bilhões de parâmetros, combinada com modelos de linguagem maiores para planejamento de instruções, superou a precisão de clique do OpenAI Operator e do Claude Computer Use no benchmark Showdown e ficou em primeiro lugar entre todos os modelos com menos de 100 bilhões de parâmetros em cinco a

GateNews1h atrás

A Tilde Research descobre que o Muon Optimizer mata 25% dos neurônios; a alternativa Aurora alcança um ganho de eficiência de dados 100x

De acordo com a Tilde Research, o otimizador Muon adotado por modelos de IA de ponta, incluindo DeepSeek V4 e Kimi K2.5, tem uma falha oculta: ele faz com que mais de 25% dos neurônios das camadas MLP morram permanentemente durante o treinamento inicial. A equipe projetou a Aurora, um otimizador alternativo, e a disponibilizou em código aberto. Um modelo com 1,1B parâmetros treinado com apenas 100B tokens conseguiu igualar o desempenho do Qwen3-1.7B treinado em 36T tokens em benchmarks de compre

GateNews1h atrás

Nvidia Aposta Mais de US$ 40 bilhões em investimentos de IA no início de 2026, incluindo US$ 30 bilhões para a OpenAI

De acordo com a TechCrunch, a Nvidia comprometeu mais de US$ 40 bilhões em investimentos de capital em empresas de IA nos primeiros meses de 2026, com um investimento de US$ 30 bilhões na OpenAI como o maior compromisso individual. A fabricante de chips também prometeu até US$ 3,2 bilhões para a fabricante de vidro Corning e até US$ 2,1 bilhões para a operadora de data centers IREN, o que inclui um warrant de cinco anos e um contrato separado de US$ 3,4 bilhões para serviços de nuvem de GPU gere

GateNews5h atrás

NVIDIA firma parceria de longo prazo com a AI aberta Deepinfra e obtém US$ 107 milhões na rodada B para criar uma "fábrica de tokens"

A startup de inteligência artificial DeepInfra anunciou a conclusão de uma rodada B de US$ 1,07 bilhão, liderada pela 500 Global e por engenheiros veteranos do Google, Georges Harik, com participação de investidores estratégicos como NVIDIA, Samsung Next e Supermicro. De acordo com a divulgação oficial, o aporte será usado para expandir a capacidade de data centers globais, resolvendo os custos de computação e os gargalos de eficiência enfrentados no momento em que as aplicações de IA passam de

ChainNewsAbmedia5h atrás

Membro do Conselho do BCE Escrivá destaca riscos de IA para a infraestrutura financeira em 9 de maio

O membro do Conselho Governador do BCE, Escrivá, afirmou em 9 de maio que os bancos centrais devem reavaliar a resiliência da infraestrutura financeira e a robustez da cibersegurança à luz dos avanços da inteligência artificial. De acordo com seus comentários em um evento, as recentes evoluções em IA exigem uma reavaliação da capacidade dos sistemas financeiros de resistir aos riscos emergentes.

GateNews5h atrás

SpaceX Rebatiza xAI para SpaceXAI, Registra Marca de Computação Orbital Antes de um IPO de US$ 1,75 trilhão

De acordo com pedidos de registro de marca junto ao United States Patent and Trademark Office, a empresa de inteligência artificial de Elon Musk, a xAI, está sendo incorporada à SpaceX sob uma nova marca, SpaceXAI. O reposicionamento abrange data centers baseados em satélites, computação orbital, computação em nuvem e gerenciamento de cargas de trabalho de IA por meio de plataformas espaciais. Musk confirmou que a xAI seria dissolvida como empresa separada, com os produtos de IA operando sob a S

GateNews7h atrás
Comentário
0/400
Sem comentários