Mensagem do Gate News, 24 de abril — Zhang Chi, ex-engenheiro da equipe Seed da ByteDance e atual professor assistente na Universidade de Pequim, revelou no podcast “Into Asia” que a ByteDance exige aproximadamente seis meses para concluir um ciclo completo de treinamento de pré-treinamento de modelo de linguagem grande (pretraining mais pós-treinamento), enquanto o Google, supostamente, precisa apenas de três meses. Zhang atribuiu a diferença de velocidade como um motivo central pelo qual as empresas chinesas têm dificuldades para alcançar o ritmo no desenvolvimento de IA.
Zhang descreveu uma “cultura de benchmarking” dentro da Seed, em que os líderes de equipe são avaliados com base nas pontuações de benchmarks que eles supervisionam, e todos os membros se concentram em aumentar os números. No entanto, ele observou que isso não se traduz em uma melhor experiência do usuário na prática. Embora os modelos das principais empresas chinesas pareçam competitivos com os modelos de fronteira dos EUA no papel, eles ficam aquém no uso real. O objetivo da Seed é alcançar desempenho de primeira linha global, mas Zhang declarou que não acredita que a equipe tenha atingido isso, nem que tenha alcançado a meta de liderança doméstica.
No fim de 2024, a Seed se via em igualdade com o GPT-4o, mas após o lançamento do DeepSeek, a equipe reconheceu que a lacuna permanecia. Quando Zhang entrou, todo o grupo estava mudando urgentemente para aprendizado por reforço para lidar com a deficiência.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Sierra levanta US$ 95 milhões, valuation de US$ 15,8 bilhões: Bret Taylor, com o papel de presidente da OpenAI, disputa a liderança do atendimento ao cliente em IA
A Sierra, cofundada por Bret Taylor, anunciou a conclusão de uma captação Series E de US$ 950 milhões, com avaliação de US$ 1,58 bilhões, liderada pela Tiger Global e pela GV. Em 8 rodadas, atingiu US$ 150 milhões em ARR e uma taxa de penetração na Fortune 50 acima de 40%. A empresa se posiciona como uma plataforma vertical de atendimento ao cliente centrada em agentes de IA, oferecendo fluxos de trabalho prontos para uso. Taylor também é presidente do conselho da OpenAI, com foco no tema de governança e divulgações de interesses.
ChainNewsAbmedia1h atrás
A API do Gemini vai usar Webhooks: o Google elimina a dor da repetição (polling) de tarefas longas, e o Batch/Veo podem ser enviados em tempo real
A Google Gemini API lançou Webhooks em 4 de maio: quando tarefas longas forem concluídas, ela envia automaticamente o resultado para a URL de callback, substituindo a verificação em polling, reduzindo uso de recursos e latência e simplificando o código. O recurso é compatível com Batch API, Veo2 e inferência com long context; é especialmente adequado para serverless. Em comparação, o OpenAI tende a usar SSE, e a Anthropic ainda recorre a polling; a Google destaca a infraestrutura voltada ao desenvolvedor. No futuro, o foco será em mecanismos de segurança e na expansão dos modelos. Para desenvolvedores em Taiwan, a integração imediata pode reduzir de forma significativa o quota e a carga do sistema.
ChainNewsAbmedia1h atrás
Krutrim muda para serviços de computação em nuvem de IA em 5 de maio, publica o primeiro lucro enquanto a receita do EF26 chega a US$ 31,6 milhões
De acordo com a Press Trust of India, a empresa indiana de IA Krutrim se reposicionou como provedora doméstica de serviços de nuvem de IA em 5 de maio, suspendendo seus esforços de design de chips e direcionando capital e talentos para a infraestrutura de nuvem.
A empresa informou uma receita do ano fiscal de 26 de aproximadamente 3 bilhões de rúpias (US$ 31,6 m
GateNews2h atrás
Investimentos da Anthropic e da OpenAI ultrapassam US$ 1,1 bilhão em operações de cripto no varejo desde o início de 2026
De acordo com a Bloomberg, investidores de varejo colocaram aproximadamente US$ 1,13 bilhão em operações alavancadas em derivativos de empresas privadas de IA desde o início de 2026. As plataformas cripto Ventuals e PreStocks permitem negociação 24 horas por dia em empresas como Anthropic, OpenAI e SpaceX sem conceder diretamente e
GateNews3h atrás