2026-04-02 12:01:57

A Alibaba lançou silenciosamente uma grande novidade.

CoPaw-Flash-9B — Modelo de Agente AI baseado no Qwen3.5. Com 9B de parâmetros, pode ser executado no seu próprio computador.
Por que é impressionante?
Alguns benchmarks estão ao nível do Qwen3.5-Plus (grande modelo fechado).
90 bilhões de parâmetros versus centenas de bilhões, pontuações semelhantes.
O que me entusiasma ainda mais é o framework CoPaw:
- Suporta memória persistente (lembra das conversas anteriores)
- Conexões multi-canal (pode conectar-se ao Feishu, Discord, etc.)
- Implantação local, sem custos de API
A arquitetura do Qwen3.5 também é muito potente — total de 397B de parâmetros, ativando apenas 17B por token. Máxima eficiência.
Você não precisa de um servidor H100. Um MacBook pode ser suficiente para rodar um assistente AI pessoal.
Estou pensando em mover algumas etapas intermediárias do meu pipeline de conteúdo (limpeza de dados, conversão de formato) para o modelo local, economizando mais da metade dos custos de API.
Na segunda metade de 2026, o agente AI pessoal pode se tornar padrão.
Mas as pontuações de benchmark e a experiência real são coisas diferentes. Só vou falar quando conseguir rodar tudo localmente.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.