Tencent lança algoritmo Stem Sparse Attention da Hunyuan, reduz em 3,7x a latência do primeiro token em contexto de 128K

De acordo com a Guru Club, em 5 de junho, a Tencent Hunyuan lançou o algoritmo de atenção esparsa Stem, aprovado na principal conferência de aprendizado de máquina ICML-26. O algoritmo atinge precisão quase sem perdas com 25% de orçamento por meio de Token Position Decay (TPD) e Output-Aware Metric (OAM), reduzindo a latência do primeiro token em 3,7x no comprimento de contexto de 128K quando combinado com operadores de HPC.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários