Gate News mensagem, 24 de abril — O DeepSeek V4-Pro e o DeepSeek V4-Flash foram oficialmente lançados e open-source em 24 de abril, com o comprimento de contexto de processamento significativamente expandido de 128K para 1M, representando um aumento de capacidade de quase 10 vezes. A Huawei Computing anunciou que os seus produtos de supernó Ascend suportam totalmente os modelos da série DeepSeek V4 através de uma colaboração estreita entre tecnologias de chips e de modelos.
O Huawei Ascend 950 alcança uma implementação de inferência dos modelos DeepSeek V4 com elevada taxa de transferência e baixa latência através de técnicas de kernel fundido e paralelismo multi-stream para reduzir a sobrecarga de computação de Attention e acessos à memória. Para o DeepSeek V4-Pro com entrada de 8K, o Ascend 950 atinge aproximadamente 20ms de TPOT com 4,700 TPS de throughput Decode por cartão; para o DeepSeek V4-Flash com entrada inferior a 8K, atinge aproximadamente 10ms de TPOT com 1,600 TPS de throughput. A série de supernós Ascend A3 também alcança compatibilidade total, com implementações de referência de treino fornecidas para uma afinação rápida. Com base no supernó Ascend A3 de 64 cartões com modo EP grande, o DeepSeek V4-Flash atinge mais de 2,000 TPS de throughput Decode por cartão em cenários de entrada/saída 8K/1K utilizando o motor de inferência vLLM. As linhas completas de produtos Huawei Ascend A2, A3 e 950 suportam tanto o DeepSeek V4-Flash como o V4-Pro.
A Huawei Cloud anunciou compatibilidade de primeira-mão com o DeepSeek V4, fornecendo aos programadores serviços de token de API com um clique através da sua plataforma MaaS. A Huawei Cloud otimizou as capacidades da camada de sistema, da camada de operadores e da camada de cluster para garantir adaptação rápida do modelo e uma implementação de alto desempenho. Empresas incluindo Kingsoft WPS e 360 já integraram o novo modelo da DeepSeek via a Huawei Cloud.
A Cambricon também anunciou compatibilidade Day 0 com o DeepSeek V4-Flash e o V4-Pro baseada no framework de inferência vLLM, com código de adaptação open-source para a comunidade GitHub. A Cambricon tinha anteriormente alcançado adaptação de primeira-mão quando o DeepSeek V3.2 foi lançado no ano passado, após ter realizado uma optimização profunda de desempenho colaborativa entre software e hardware nos modelos da série DeepSeek.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
Stockcoin.ai Conclui Ronda de Seed Funding Liderada pela Amber Group
De acordo com o anúncio oficial, Stockcoin.ai, uma plataforma orientada por IA para negociação de futuros de ações e cripto, concluiu uma ronda de seed financiada pela Amber Group, com participação de investidores anjo em cripto e finanças tradicionais. A plataforma centra-se em fazer a ponte entre dados on-chain e equities m
GateNews19m atrás
Os utilizadores mensais ativos da aplicação Claude disparam 658% para 85,79M em um ano, os downloads aumentam 2321%
De acordo com os dados da Similarweb monitorizados pela Beating, as métricas de abril do ano contra o ano da app Claude App registaram um crescimento significativo: os utilizadores ativos mensais (MAU) aumentaram de 11,31 milhões no ano passado para 85,79 milhões, um aumento de 658%; as transferências na app store dispararam de 920.000 para 22,3 milhões, um aumento de 2321%.
GateNews37m atrás
O presidente da OpenAI testemunha que Musk procurou controlo total e $800B para uma colónia em Marte a 5 de maio
De acordo com o testemunho do Presidente da OpenAI, Greg Brokeman, a 5 de maio, durante a segunda semana do julgamento na Califórnia, Elon Musk tinha anteriormente apoiado a conversão da OpenAI numa empresa com fins lucrativos e exigido controlo total da organização. Brokeman afirmou que Musk citou a necessidade de angariar 8 mil milhões de dólares para
GateNews39m atrás
A Tessera Labs encerra a Série A liderada pela a16z; equipa de IA com seis pessoas substitui 60 consultores da SAP
De acordo com Beating, a Tessera Labs, uma empresa de integração de sistemas de IA, concluiu uma ronda de financiamento Série A liderada pela a16z. A startup, fundada em 2024, utiliza uma plataforma multi-agente para automatizar migrações de SAP ECC para S/4HANA, tradicionalmente exigindo 3-5 anos e 100 milhões de dólares a 500 milhões de dólares por
GateNews45m atrás
Solana está a construir rails de pagamentos para a economia das máquinas de IA, diz o presidente da fundação Liu na Consensus 2026
Na Consensus Miami 2026, a Presidente da Solana Foundation, Lily Liu, defendeu que a adopção de stablecoins por empresas como a Western Union valida o papel da Solana como infra-estrutura financeira tanto para as economias humana como para as de máquinas.
GateNews1h atrás
O Taiwan Index está firme nos 40.000 pontos, as bolsas dos EUA atingem máximas históricas, mas a indústria de IA ainda está apenas numa fase inicial?
Goldman Sachs indicou que a procura de IA deverá aumentar significativamente o consumo de tokens devido a cargas de trabalho de agentes focados no consumo, com crescimento em 2030 que poderá exceder 12 vezes, podendo chegar a 60 biliões de tokens por mês; a diferença entre não-agents e consumer agents está na automatização de tarefas ao longo de longos períodos; se isso se concretizar, a IA entrará em fluxos de trabalho agentic. Larry Fink afirmou que a oferta de capacidade de computação está gravemente em falta, podendo surgir no futuro contratos de futuros sobre capacidade de computação, e que ambos sustentam a tese de mercado em alta para a construção de infraestruturas de IA; o artigo considera que a IA ainda está numa fase inicial.
ChainNewsAbmedia1h atrás