O Google Gemini 3.1 Flash-Lite é oficialmente lançado: preço de entrada 75% mais barato que o Claude 4.5 Haiku, pontuação do GPQA 86,9%

De acordo com Beating, o Google Gemini 3.1 Flash-Lite saiu da prévia e entrou em disponibilidade geral (GA) em 8 de maio, tornando-se o modelo mais barato e mais rápido da série Gemini 3. O preço de entrada foi definido em US$ 0,25 por 1 milhão de tokens e o de saída em US$ 1,50 por 1 milhão de tokens — os custos de entrada ficam 75% menores do que o Claude 4.5 Haiku (US$ 1,00) e os de saída ficam 70% menores (US$ 5,00). O modelo tem uma janela de contexto de 1 milhão de tokens e alcança 363 tokens por segundo de throughput, 45% mais rápido do que seu antecessor Gemini 2.5 Flash.

Em benchmarks de desempenho, o GPQA Diamond (raciocínio em ciência no nível de graduação) chega a 86,9%, superando os 73,0% do Claude 4.5 Haiku e os 82,3% do GPT-5 mini. O MMMU-Pro (raciocínio multimodal) atinge 76,8%. Entre os primeiros adotantes estão a plataforma de atendimento ao cliente Gladly, que relata redução de 60% de custos e taxa de sucesso de 99,6% em cargas de trabalho em produção, e a JetBrains, que está integrando o Flash-Lite em ferramentas de assistência dentro do IDE.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A OpenAI muda o modelo padrão do ChatGPT para o GPT-5.5 instantâneo, reduz alucinações em 52,5%

De acordo com a OpenAI, a empresa mudou o modelo padrão do ChatGPT para GPT-5.5 Instant em 8 de maio. Em testes internos, o modelo gerou 52,5% menos afirmações alucinatórias do que o GPT-5.3 Instant em prompts de alto risco, enquanto reduziu em 37,3% as afirmações imprecisas em conversas sinalizadas pelos usuários por erro factual.

GateNews7m atrás

CEO da Nvidia, Huang: A infraestrutura de IA de próxima geração exige conexões ópticas extensas; cobre é insuficiente em 8 de maio

De acordo com a BlockBeats, em 8 de maio, o CEO da Nvidia, Jensen Huang, afirmou que a infraestrutura de IA de próxima geração exigirá extensas conexões ópticas, já que o cobre não consegue atender às crescentes demandas computacionais. Huang elogiou a nova parceria da Nvidia com a Corning, chamando-a de uma oportunidade importante

GateNews11m atrás

A Cloudflare demite mais de 1.100 funcionários (20% da força de trabalho) para migrar para operações orientadas por IA

De acordo com a Reuters, a Cloudflare demitiu mais de 1.100 funcionários, o que representa aproximadamente 20% de sua força de trabalho, em 8 de maio, para reestruturar as operações em torno de ferramentas de IA. O CEO Matthew Prince afirmou que a empresa está redesenhando todas as equipes e funções para se adaptar a uma era de IA agentic, destacando o uso interno de IA

GateNews25m atrás

O Google Lança o Fitbit Air por US$ 99,99; o rastreador sem tela se torna o hub do Gemini Health Coach em 26 de maio

De acordo com Beating, a Google lançou o Fitbit Air, um rastreador de saúde sem tela, com preço de US$ 99,99, com previsão de envio para 26 de maio. O dispositivo pesa apenas 5,2 gramas e conta com uma bateria de 7 dias, com capacidade de recarga rápida de 5 minutos. Os sensores rastreiam a frequência cardíaca 24 horas, detecção de fibrilação atrial, oxigênio no sangue, h

GateNews27m atrás

OpenAI lança três modelos de voz na API em tempo real; GPT-Realtime-2 oferece janela de contexto de 128K

Segundo Beating, a OpenAI lançou três modelos de voz na sua Realtime API: GPT-Realtime-2 para conversas por voz com raciocínio, GPT-Realtime-Translate para tradução em tempo real e GPT-Realtime-Whisper para transcrição em streaming. O GPT-Realtime-2 é o primeiro modelo de voz da OpenAI com nível de GPT-5-level de re

GateNews43m atrás

A previsão de receita da Cloudflare decepciona, com demissão de 1.100 funcionários, e as ações despencam 19% após o fechamento

O relatório financeiro do primeiro trimestre da Cloudflare, divulgado na quinta-feira, mostrou que sua receita e seus lucros tiveram desempenho acima do esperado pelo mercado, evidenciando um forte impulso de crescimento. No entanto, como a empresa fez uma projeção de receita para o segundo trimestre ligeiramente abaixo das estimativas dos analistas, o mercado passou a questionar se esse impulso de crescimento continuará. Ao mesmo tempo, a Cloudflare anunciou que vai cortar cerca de 1.100 funcionários, o equivalente a aproximadamente 20% do total de seu quadro de pessoal. O CEO Matthew Prince destacou que a IA e os agentes já se tornaram a produtividade central da empresa, e que o modelo operacional passa por uma transformação fundamental. Com a notícia de frustração nas projeções e um grande corte de pessoal, a ação da empresa (NET) caiu quase 19% no pregão após o fechamento. Frustração na previsão da Cloudflare faz ação despencar 19% após o pregão A receita da Cloudflare no primeiro trimestre chegou a US$ 639,8 milhões

ChainNewsAbmedia1h atrás
Comentário
0/400
Sem comentários