Mensagem do Gate News, 24 de abril — Zhang Chi, ex-engenheiro da equipe Seed da ByteDance e atual professor assistente na Universidade de Pequim, revelou no podcast “Into Asia” que a ByteDance exige aproximadamente seis meses para concluir um ciclo completo de treinamento de pré-treinamento de modelo de linguagem grande (pretraining mais pós-treinamento), enquanto o Google, supostamente, precisa apenas de três meses. Zhang atribuiu a diferença de velocidade como um motivo central pelo qual as empresas chinesas têm dificuldades para alcançar o ritmo no desenvolvimento de IA.
Zhang descreveu uma “cultura de benchmarking” dentro da Seed, em que os líderes de equipe são avaliados com base nas pontuações de benchmarks que eles supervisionam, e todos os membros se concentram em aumentar os números. No entanto, ele observou que isso não se traduz em uma melhor experiência do usuário na prática. Embora os modelos das principais empresas chinesas pareçam competitivos com os modelos de fronteira dos EUA no papel, eles ficam aquém no uso real. O objetivo da Seed é alcançar desempenho de primeira linha global, mas Zhang declarou que não acredita que a equipe tenha atingido isso, nem que tenha alcançado a meta de liderança doméstica.
No fim de 2024, a Seed se via em igualdade com o GPT-4o, mas após o lançamento do DeepSeek, a equipe reconheceu que a lacuna permanecia. Quando Zhang entrou, todo o grupo estava mudando urgentemente para aprendizado por reforço para lidar com a deficiência.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
A OpenAI Lança o GPT-5.5 Instant para Todos os Usuários do ChatGPT a Partir de Hoje
De acordo com o anúncio da OpenAI em 6 de maio, o GPT-5.5 Instant agora está disponível para todos os usuários do ChatGPT. Para usuários pagantes, o GPT-5.3 Instant continuará acessível pelas configurações de modelo por mais três meses antes de ser descontinuado. O recurso de memória está sendo liberado para todos os usuários do plano consumidor do ChatGPT em th
GateNews6m atrás
Google testa o agente de IA “Remy” para o Gemini, rivais lançam o OpenClaw
De acordo com o Business Insider, o Google está testando um novo agente de IA chamado Remy para o Gemini em 6 de maio. O agente, atualmente disponível apenas para funcionários dentro do aplicativo interno do Gemini do Google, pode executar ações em nome dos usuários em tarefas de trabalho, aprendizado e do dia a dia, enquanto se integra com os outros do Google
GateNews8m atrás
A Meta planeja um assistente de IA alimentado pelo modelo Muse Spark para rivalizar com a OpenClaw por 3 bilhões de usuários em 6 de maio
De acordo com o Financial Times, a Meta está construindo uma assistente de IA altamente personalizada no dia 6 de maio para rivalizar com o OpenClaw, alimentada pelo seu novo modelo Muse Spark. A ferramenta atenderá aos mais de 3 bilhões de usuários da empresa e atualmente passa por testes internos. A assistente tem como objetivo permitir que os usuários criem IA
GateNews8m atrás
A Alphabet se aproxima do valor de mercado da Nvidia, em US$ 4,67 trilhões, alta de 24% neste ano
De acordo com a Reuters, em 6 de maio, a Alphabet foi avaliada em aproximadamente US$ 4,67 trilhões, chegando perto dos US$ 4,79 trilhões da Nvidia, enquanto os investidores apoiam sua estratégia de IA e o crescimento mais rápido da nuvem. As ações da Alphabet subiram 24% neste ano, em comparação com o ganho de 7% da Nvidia. A receita da Google Cloud disparou 63% em
GateNews21m atrás
Cloudflare: agentes de IA impulsionam tráfego não humano; x402 oferece solução
O diretor de estratégia da Cloudflare afirmou que mais da metade do tráfego da internet agora é não humano, destacando uma mudança significativa nos padrões de uso da web impulsionada por agentes de IA e sistemas automatizados. O executivo sugeriu que a Fundação x402 está construindo infraestrutura para enfrentar os desafios
CryptoFrontier2h atrás