Mensagem de Gate News, 24 de abril — A DeepSeek lançou a série V4 de modelos de código aberto sob a Licença MIT, com pesos agora disponíveis no Hugging Face e no ModelScope. A série inclui dois modelos (MoE) de especialistas em mistura: V4-Pro com 1,6 trilhão de parâmetros totais e 49 bilhões ativados por token, e V4-Flash com 284 bilhões de parâmetros totais e 13 bilhões ativados por token. Ambos suportam uma janela de contexto de 1 milhão de tokens.
A arquitetura traz três melhorias principais: um mecanismo de atenção híbrido que combina atenção esparsa comprimida (CSA) e atenção fortemente comprimida (HCA), reduzindo significativamente a sobrecarga de contextos longos — os FLOPs de inferência do V4-Pro para contexto de 1M são apenas 27% dos do V3.2, e o cache de KV (VRAM para armazenar informações históricas durante a inferência) é apenas 10% do do V3.2; hipervínculos com restrição de manifold (mHC) substituindo conexões residuais tradicionais para aprimorar a estabilidade da propagação de sinais entre camadas; e o otimizador Muon para acelerar a convergência do treinamento. O pré-treinamento usou mais de 32 trilhões de tokens de dados.
O pós-treinamento emprega uma abordagem em duas etapas: primeiro, treinar especialistas específicos de domínio via fine-tuning supervisionado (SFT) e aprendizado por reforço com GRPO, depois fundi-los em um único modelo por meio de distilação online. O V4-Pro-Max (highest inference mode) afirma ser o modelo de código aberto mais forte, com benchmarks de codificação de ponta e lacunas significativamente reduzidas em relação a modelos de fronteira de código fechado em tarefas de raciocínio e de agentes. O V4-Flash-Max atinge desempenho de raciocínio no nível do Pro com orçamento de computação suficiente, mas é limitado pela escala de parâmetros em tarefas puramente de conhecimento e tarefas de agentes complexas. Os pesos são armazenados em precisão mista FP4+FP8.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Membro do Conselho do Fed Bowman: os reguladores precisam considerar como lidar com novas tecnologias como o Anthropic Mythos
PANews, 2 de maio, informou que a membro do Conselho de Governadores do Federal Reserve, Bowman, declarou que os reguladores precisam considerar como supervisionar da melhor forma novas tecnologias como o Mythos, da Anthropic. “Por um lado, essa capacidade permite que as empresas lidem com vulnerabilidades que elas próprias identificam, reforçando a segurança cibernética”, disse Bowman. “Mas, por outro lado, se for usada de forma mal-intencionada, ela pode ser utilizada para identificar e explorar fraquezas”. A Anthropic, ao avaliar medidas de proteção contra essa poderosa nova tecnologia, já limitou o lançamento de seu mais recente modelo de inteligência artificial. O modelo também levou autoridades do governo Trump a começarem a considerar a possibilidade de ataques cibernéticos que representem uma ameaça à estabilidade financeira.
GateNews7m atrás
Tribunal de Hangzhou impede demissões apenas com IA e apoia trabalhador após corte de 40% no salário em 28 de abril
De acordo com a Bloomberg, em 28 de abril, o Tribunal Intermediário Popular de Hangzhou decidiu que os empregadores não podem demitir trabalhadores nem reduzir salários apenas porque a IA automatizou suas funções. O tribunal confirmou a indenização de um trabalhador cujo salário foi reduzido em 40% e que foi demitido após recusar uma nova designação quando a IA
GateNews18m atrás
Tribunal chinês divulga novo precedente: automação com IA sem demitir funcionários por motivos legais
O tribunal de Hangzhou divulgou a mais recente decisão judicial, afirmando que é ilegal demitir, rebaixar de cargo ou reduzir significativamente o salário de funcionários sob o pretexto de introduzir tecnologias como IA. No caso em questão, o trabalhador foi rebaixado devido à automação e enfrentou uma redução salarial de até 40%; ao final, a corte decidiu a favor de sua indenização, destacando que, ao impulsionar a automação, é necessário garantir conformidade e oferecer reorientação de funções e requalificação.
ChainNewsAbmedia33m atrás
Hoskinson discute o papel do Midnight no ecossistema da Cardano no The Breakdown
Charles Hoskinson, fundador da Cardano e cofundador da Ethereum, apareceu como convidado no episódio 701 do podcast "The Breakdown", apresentado por David Gokhshtein, para discutir o projeto Midnight, os desafios de experiência do usuário no cripto e sua visão para o futuro da blockchain. Durante a entrevista, Hoskinson
CryptoFrontier7h atrás
A Berkshire Energy vê oportunidade de crescimento na demanda por energia impulsionada por IA
De acordo com Beating, na assembleia de acionistas da Berkshire, o CEO Abel destacou que a demanda de eletricidade impulsionada por IA está criando novas oportunidades de crescimento para o negócio de energia da empresa, com metade das suas concessionárias de energia já atendendo requisitos de energia relacionados a IA.
Em Iowa, data centers agora contabilizam
GateNews10h atrás
Depoimentos na 1ª semana do processo de Musk vs. Altman: ele admite que a XAI está “destilando” a OpenAI, e alerta que a IA é como um Exterminador
馬斯克, na primeira semana de depoimento em um tribunal federal de Oakland, acusou Altman e Brockman de fraudar recursos iniciais de uma organização sem fins lucrativos, alertou sobre riscos catastróficos de fim do mundo com a IA e admitiu que parte do xAI foi “destilada” de modelos da OpenAI; ele declarou ter investido US$ 38 milhões e ter visto a OpenAI se transformar de uma entidade sem fins lucrativos em uma empresa avaliada em US$ 800 bilhões. O investimento da Microsoft em 2022 é visto como um ponto de virada na quebra de confiança. A OpenAI argumenta que Musk tentou aliciar pessoas e contesta com a alegação de motivações competitivas. Na segunda semana, novos depoentes incluem Russell e Brockman.
ChainNewsAbmedia12h atrás