Google lança chips de TPU de oitava geração com melhor relação preço-desempenho, separa treino e inferência

Mensagem do Gate News, 22 de Abril — A Google Cloud anunciou a disponibilização dos seus chips TPU (Tensor Processing Unit) personalizados de oitava geração, a 22 de Abril. A nova gama inclui o TPU 8t, concebido especificamente para tarefas de treino de IA, e o TPU 8i, optimizado para cargas de trabalho de inferência de IA. Ambos os chips ficarão disponíveis mais tarde este ano. A Google também revelou novas ferramentas para criar agentes de IA e anunciou um fundo de $750 milhões para impulsionar a adopção de IA nas empresas.

O TPU 8t oferece 2,8 vezes o desempenho do TPU Ironwood da geração anterior da Google, no mesmo patamar de preço. O TPU 8i melhora o desempenho em 80% face ao seu antecessor e incorpora uma arquitectura de memória estática de acesso aleatório (SRAM) para proporcionar “transferência em grande escala com custo-efectivo e baixa latência, permitindo que milhões de agentes corram em simultâneo”, segundo o CEO Sundar Pichai. Em comparação com o Ironwood, tanto o TPU 8t como o TPU 8i atingem uma eficiência superior a dobrar por watt, com o TPU 8t a melhorar 124% e o TPU 8i a melhorar 117%. A Google optimizou a eficiência energética em toda a pilha tecnológica e integrou sistemas de gestão de potência dinâmica que ajustam o consumo com base na procura em tempo real.

Os modelos de primeira parte da Google processam agora mais de 160 mil milhões de tokens por minuto através de chamadas directas de API dos clientes, acima dos 100 mil milhões no trimestre passado. A IA passa agora a gerar 75% de todo o novo código na Google, em comparação com 50% no outono do ano passado. O Gemini Enterprise, a oferta empresarial da Google, cresceu 40% em cadeia, no trimestre, em utilizadores mensais activos pagantes. A empresa espera investir ligeiramente mais de metade do seu orçamento de computação de aprendizagem automática em serviços na nuvem até 2026, para servir melhor clientes e parceiros na nuvem. A Google está também a alargar a sua colaboração com a Broadcom para desenvolver e fornecer chips TPU personalizados para futuras gerações, à medida que grandes empresas tecnológicas procuram alternativas às GPUs caras e com fornecimento limitado da NVIDIA e da AMD.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Sam Altman e Dario Amodei são ambos insuportáveis! As teorias do fim do mundo da IA e a sensação de privação relativa têm feito com que os cidadãos dos EUA desenvolvam aversão à IA

O popular podcast de Silicon Valley «All-In Podcast» discutiu a indústria da IA e apresentou uma observação bastante incisiva: a atitude da sociedade norte-americana face à IA está a mudar para o negativo e, como forma de libertar mais concretamente essa tensão, o alvo mais específico são os centros de dados que as empresas de IA estão a construir à pressa por todo o país. A origem desta repulsa pode incluir o apocalipsismo da IA, o receio do desemprego ou um descontentamento mais profundo: a nova vaga de inovação tecnológica parece outra vez beneficiar apenas alguns poucos, enquanto a maioria das pessoas não vê uma melhoria clara nas suas vidas. Nos EUA, já houve governos locais que derrubaram casos de construção de centros de dados Chamath Palihapitiya afirmou no programa que os problemas que a indústria da IA enfrenta neste momento não se resumem à competição entre modelos, ao aumento do investimento de capital ou à escassez de capacidade de computação, mas sim que «as pessoas dos EUA estão, de um modo geral, cada vez mais ressentidas com o tema da IA». Ele apontou que a origem desse desagrado pode incluir o apocalipsismo da IA

ChainNewsAbmedia34m atrás

Perguntas da Comunidade sobre Viés Ideológico nos Modelos de IA Convencionais em 4 de Maio

De acordo com o BlockBeats, a 4 de maio, o utilizador da comunidade de IA X Freeze colocou em causa se modelos de IA mainstream, incluindo ChatGPT, Claude e Gemini, apresentam enviesamentos sistemáticos por serem menos alinhados com posições conservadoras em temas como género, imigração e crime. O utilizador sugeriu que, à medida que a IA

GateNews2h atrás

Cerebras prepara um IPO na $4B Nasdaq, inicia roadshow a 4 de maio a 115-125 dólares por ação

De acordo com a Reuters, a empresa de chips de IA Cerebras Systems iniciou o seu roadshow de IPO a 4 de Maio para cotar no Nasdaq sob o símbolo CBRS. A empresa prevê fixar o preço das ações entre 115 e 125 dólares dos EUA e poderá angariar até US$4 mil milhões numa avaliação de aproximadamente 40 mil milhões de dólares dos EUA. Isto marca a segunda

GateNews2h atrás

A IA impulsiona o crescimento do PIB dos EUA no 1.º trimestre em 75%; em 2027, os cinco maiores grupos podem aumentar o seu investimento em capital para mais de 1,1 biliões de dólares

Morgan Stanley voltou a subir a estimativa de capital expenditure (capex) dos cinco maiores gigantes da cloud dos EUA: cerca de 805 mil milhões de dólares em 2026 e cerca de 1,116 bilião de dólares em 2027, e em 2026 o investimento em empresas não tecnológicas deverá ser semelhante ao de 2025. David Sacks aponta que a contribuição do capex em IA para o PIB ronda os 2,5% e que no próximo ano poderá ultrapassar os 3%, sendo visto como um novo motor da economia dos EUA.

ChainNewsAbmedia3h atrás

Para entrar na corrida aos IPOs da SpaceX, da OpenAI e da Anthropic, a Nasdaq e a S&P baixam os critérios

O The Wall Street Journal indica que, para acolher IPO de empresas como SpaceX, OpenAI, Anthropic, entre outras, o S&P e a Nasdaq relaxaram os critérios de elegibilidade das ações que podem entrar no índice. O S&P reduziu o período de observação para as novas ações para 6 meses, ou concede isenção do limiar de lucros; a Nasdaq 100 lançou uma entrada rápida, em que IPO de grande escala podem entrar no índice no 15.º dia após a listagem. A inclusão passou a depender de capitalização bolsista total, eliminando a exigência de free float mínimo, e adotando ponderação dinâmica. Especialistas questionam se estas mudanças poderão amplificar o risco de ações muito procuradas e distorcer a formação de preços quando esta for insuficiente.

ChainNewsAbmedia3h atrás

A ASX Adverte as Empresas para Não Exagerarem o Impacto da IA a 4 de Maio

De acordo com a Bloomberg, a 4 de maio, a operadora da bolsa australiana ASX alertou as empresas para não exagerarem o impacto da inteligência artificial nos seus negócios. A diretora-chefe de conformidade da ASX, Lucinda McCann, afirmou que a bolsa está a acompanhar a existência de «ramping» ou de alegações destinadas a impulsionar os preços das ações

GateNews3h atrás
Comentar
0/400
Nenhum comentário