De acordo com a análise mais recente no blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas entregam custos de inferência por token 35 vezes mais baixos. Usando o modelo de teste DeepSeek-R1, a Blackwell (GB300 NVL72) é alugada a 2,65 USD por GPU por hora, face aos 1,41 USD da Hopper, mas o throughput de um único GPU salta de 90 para 6.000 tokens por segundo. Este ganho de throughput de 65x reduz os custos por milhão de tokens de 4,20 USD para 0,12 USD.
O valor de 0,12 USD assume optimização total de software, incluindo inferência com baixa precisão FP4 e previsão multi-token (MTP). Sem MTP activado, os custos por milhão de tokens atingem aproximadamente 2,35 USD, descendo para 0,11 USD com ele ativo, demonstrando um impacto de optimização de 21x apenas com essa funcionalidade.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Índia alerta para riscos cibernéticos após o AI Mythos da Anthropic violar as defesas em 83 dos 100 casos de teste
De acordo com o The Economic Times, a agência de cibersegurança da Índia emitiu recentemente um aviso de elevada severidade depois de o AI Mythos da Anthropic ter demonstrado a capacidade de encontrar dezenas de milhares de vulnerabilidades e de converter erros de software em ataques exploráveis em minutos.
Palo Alto Networks' Unit 42 e
GateNews1m atrás
Um investidor, com 1 ação, consegue ficar com 480 ações — a oportunidade de entrar antes da próxima cisão de ações da Nvidia é agora?
Este texto recorda várias divisões de acções da Nvidia desde a sua entrada em bolsa em 1999, que aumentaram as participações dos acionistas iniciais para 480 acções através desses desdobramentos, e que, em 2024, ajustaram o preço das acções para cerca de 120 dólares com um desdobramento de 10 por 1. Impulsionada pela procura global por infra-estruturas de IA, a Nvidia tornou-se um fornecedor central para os centros de dados, com uma capitalização bolsista a aproximar-se dos 5 biliões de dólares, e a dinâmica de crescimento mantém-se forte. Os analistas prevêem que a próxima divisão dependerá do preço das acções e do desempenho de crescimento; neste momento, o preço ronda os 198 dólares e, se o crescimento continuar, ou se surgir uma nova oportunidade de entrada, pode haver margem para novas reacções do mercado, mas trata-se apenas de uma observação do mercado, não de uma recomendação de investimento.
ChainNewsAbmedia8m atrás
A Google e a VNG lançam o Laboratório de IA Aplicada no Vietname a 4 de maio
De acordo com a VNG Corporation, a Google, a VNG e a Universidade Nacional do Vietname, Cidade de Ho Chi Minh, lançaram um Laboratório de IA Aplicada no Vietname através do Saigon AI Hub a 4 de maio. O Google Labs e a AI Future Funds vão proporcionar às equipas selecionadas acesso antecipado às tecnologias da Google, apoio técnico da Google e
GateNews11m atrás
Anthropic, BlackRock e Goldman Sachs para lançar uma JV de consultoria em IA com investimento de 1,5 mil milhões de dólares
De acordo com o WSJ, a Anthropic está a finalizar um acordo para lançar uma joint venture com a BlackRock, a Goldman Sachs e outras empresas de Wall Street na segunda-feira, com o objectivo de vender ferramentas de inteligência artificial a empresas apoiadas por private equity. A venture deverá servir como braço de consultoria da Anthropic,
GateNews52m atrás
A China bloqueia a aquisição da US$2B Manus AI da Meta
A China anunciou que está a bloquear a aquisição de 2 mil milhões de dólares da Meta da empresa de agentes de IA Manus, citando preocupações com a transferência de propriedade intelectual de inteligência artificial chinesa para uma empresa dos EUA, segundo a informação da Tech in Asia.
Manus, uma empresa fundada na China que mudou a sede para
CryptoFrontier1h atrás
A Tencent usou o código do Anthropic, o Claude Code, no mais recente treino do modelo Hy3, noticia o The Information
De acordo com o The Information, citando memorandos internos da Tencent e fontes, os funcionários da Tencent usaram o Claude Code da Anthropic durante a fase de pós-treino do Hy3, o mais recente grande modelo de linguagem da empresa, apesar da proibição explícita da Anthropic de serviços comerciais a empresas chinesas, alegando nacional
GateNews1h atrás