Mensagem do Gate News, 24 de abril — o engenheiro da OpenAI, Clive Chan, levantou objeções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-o de “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram o tópico de discussão mais popular na conferência acadêmica ISCA, ofereceu recomendações específicas alinhadas com padrões de interconexão da indústria. A V4, por outro lado, é muito mais vaga.
Chan contestou sistematicamente três recomendações-chave. Em consumo de energia, o relatório sugere que a otimização de software permite que os chips executem computação, armazenamento e comunicação com capacidade total simultaneamente, e recomenda que os fabricantes de chips reservem margem de energia adicional. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por limitações do processo físico, então reservar mais margem de energia apenas reduz a frequência de operação, diminuindo, por fim, o desempenho computacional. No que diz respeito à transferência de dados de GPU para GPU, o relatório defende um modelo pull—no qual as GPUs buscam ativamente os dados—em vez de um modelo push, citando alto overhead de notificação nas operações push. Chan contesta isso, afirmando que o pull na verdade é mais lento e que capacidades aprimoradas do adaptador de rede seriam preferíveis. No entanto, os dois podem estar discutindo camadas diferentes do problema: o relatório aborda o overhead do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.
Quanto às funções de ativação, o relatório recomenda substituir o SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho ideal usando SwiGLU. Chan suspeita que o DeepSeek possa ter “enfraquecido deliberadamente esta seção.”
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Empresas chinesas de IA consideram desmontar estruturas de “red-chip” após a pausa na aquisição do Manus pela Meta
De acordo com a Beating, a Comissão Nacional de Desenvolvimento e Reforma da China suspendeu a aquisição de US$ 2 bilhões da Meta da empresa de agentes de IA Manus, levando a Comissão Reguladora de Valores Mobiliários da China a apertar a aprovação para listagens de IPO em Hong Kong por empresas red-chip (empresas chinesas que detêm ativos domésticos th
GateNews1h atrás
Musk Conclui Depoimento de Três Dias em Processo da OpenAI, Cita Alegação de US$ 130-150 bilhões em Danos
De acordo com múltiplos relatos da mídia, Elon Musk concluiu três dias de depoimento em sua ação judicial contra a OpenAI em 28 a 30 de abril, com depoimento acumulado de mais de 7 horas. Musk, que cofundou a OpenAI em 2015 com um investimento inicial de US$ 38 milhões, afirmou que a empresa abandonou sua organização sem fins lucrativos não-profit m
GateNews1h atrás
A Meta adquire startup de IA robótica Assured Robot Intelligence em 1º de maio
De acordo com a Bloomberg, a Meta adquiriu a Assured Robot Intelligence, uma startup de robótica e IA com escritórios em San Diego e Nova York, em 1º de maio. A equipe adquirida, incluindo os cofundadores Lerrel Pinto e Xiaolong Wang, vai se juntar aos Meta Superintelligence Labs e trabalhar com o Meta Robotics Studio. Financeiro
GateNews1h atrás
Organização Ligada à OpenAI Paga Influenciadores US$ 5.000 Por TikTok Para Espalhar Mensagem de “Ameaça da IA da China”
De acordo com a WIRED, a organização sem fins lucrativos Build American AI, afiliada ao super PAC Leading the Future, vem recrutando sistematicamente influenciadores de redes sociais por meio da agência de marketing SM4 para disseminar a mensagem “A China ameaça a IA dos EUA” no TikTok e no Instagram. A organização
GateNews1h atrás
A Nebius compra a Eigen AI por $643M para impulsionar a implantação de modelos de IA
De acordo com o The Economic Times, em 1º de maio, a empresa de infraestrutura de IA com sede em Amsterdã, Nebius, anunciou que vai adquirir a Eigen AI por aproximadamente US$ 643 milhões em dinheiro e ações classe A. A Eigen AI, fundada por ex-pesquisadores do MIT, se especializa em tecnologia de inferência e otimização. A Nebius planeja
GateNews1h atrás
Pentágono fecha acordos de IA com 8 empresas, exclui a Anthropic do acesso à rede de nível secreto
De acordo com Beating News, o Pentágono anunciou acordos com oito empresas de tecnologia para implantar suas ferramentas e infraestrutura de IA em redes secretas de nível militar dos EUA (IL6) e redes top secret (IL7). As empresas recém-assinadas incluem Nvidia, Microsoft, AWS, Reflection AI, além de anteriormente
GateNews1h atrás