Antigo Engenheiro da ByteDance Seed: A iteração de IA da ByteDance demora seis meses, em comparação com os três meses do Google

Mensagem de Gate News, 24 de abril — Zhang Chi, um antigo engenheiro da equipa Seed da ByteDance e atualmente professor assistente na Universidade de Pequim, revelou no podcast “Into Asia” que a ByteDance necessita de aproximadamente seis meses para concluir um ciclo completo de treino de pré-formação de modelos de linguagem de grande dimensão (pretraining mais pós-treino), enquanto o Google, segundo se afirma, precisa apenas de três meses. Zhang atribuiu a diferença de velocidade como uma razão central pela qual as empresas chinesas têm dificuldade em acompanhar o desenvolvimento de IA.

Zhang descreveu uma “cultura de benchmark” dentro da Seed, em que os líderes de equipa são avaliados com base nas pontuações de referência que supervisionam, e todos os membros se concentram em aumentar os números. No entanto, referiu que isto não se traduz, na prática, numa melhor experiência do utilizador. Embora os modelos das principais empresas chinesas pareçam competitivos com os modelos de fronteira dos EUA em termos de papel, ficam aquém na utilização real. O objetivo da Seed é alcançar um desempenho de topo a nível global, mas Zhang afirmou que não acredita que a equipa tenha atingido esse patamar, nem que tenha alcançado a meta de liderança doméstica.

No final de 2024, a Seed considerava-se equivalente ao GPT-4o, mas após o lançamento da DeepSeek, a equipa reconheceu que a diferença continuava. Quando Zhang se juntou, todo o grupo estava a mudar com urgência para a aprendizagem por reforço para colmatar a lacuna.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Joint Venture da OpenAI com a Anthropic em negociações para adquirir três empresas de serviços de IA a 5 de maio

Segundo Jin 10, o empreendimento conjunto da OpenAI com a Anthropic está em negociações para adquirir três empresas de serviços de IA a 5 de maio. As empresas visadas incluem, segundo é noticiado, empresas focadas em engenharia nos serviços de IA

GateNews5m atrás

A Anthropic lança agentes de IA para serviços financeiros a 5 de maio

De acordo com a PANews, a 5 de maio a Anthropic lançou novos agentes de IA concebidos para empresas de serviços financeiros. O anúncio surgiu depois de responsáveis estaduais dos EUA terem enviado cartas aos CEOs (diretores executivos) tanto da OpenAI como da Anthropic.

GateNews6m atrás

UE e Japão aprofundam a cooperação em IA, governação de dados e tecnologia quântica a 5 de maio

De acordo com a Comissão Europeia, a UE e o Japão realizaram a sua quarta reunião do Conselho do Parceiro Digital em Bruxelas, a 5 de maio, anunciando uma cooperação aprofundada em matéria de governaça de dados, inteligência artificial e tecnologia quântica. As duas partes planeiam criar um grupo de trabalho conjunto para a «Data Strategy Working

GateNews25m atrás

A ARR da ElevenLabs dispara para $500M em 4 meses, acima de 43% desde o final do ano; a ronda D é encerrada com a BlackRock, a NVentures e mais de 30 celebridades

De acordo com Beating, a plataforma de voz com IA ElevenLabs anunciou que a sua receita anual recorrente (ARR) disparou para 500 milhões de dólares nos últimos 4 meses, acima de 43% face aos 350 milhões de dólares no final de 2025. O crescimento foi impulsionado pela adoção empresarial de agentes de voz com IA para atendimento ao cliente, vendas e recrutamento. A c

GateNews50m atrás

Elastics conclui uma ronda pré-seed de 2 milhões de dólares liderada pela Frst

De acordo com a ChainCatcher, a Elastics, um sistema operativo para mercados de previsão de IA, concluiu uma ronda de financiamento Pre-Seed no valor de 2 milhões de dólares. Frst liderou a ronda, com participação da ElevenLabs, XBTO, RedStone, e

GateNews1h atrás

O antigo executivo da Qualcomm Alex Katouzian junta-se à Intel como EVP de Client Computing e Physical AI a 4 de maio

A Intel anunciou a 4 de maio que Alex Katouzian, um veterano executivo da Qualcomm, se juntou à empresa como vice-presidente executivo e diretor-geral do Grupo de Client Computing e Physical AI, reportando diretamente ao CEO Chen Lixu. Katouzian passou 25 anos na Qualcomm, mais recentemente tendo servido como e

GateNews2h atrás
Comentar
0/400
Nenhum comentário