Tether lança a primeira "framework de treinamento de IA em escala de mil milhões" global para dispositivos móveis, iPhone e Samsung conseguem executar LoRA

Tether, a empresa-mãe de dados e IA, a QVAC, anunciou em 17 de março uma grande inovação tecnológica, lançando a primeira estrutura de ajuste fino LoRA (Low-Rank Adaptation) multiplataforma que suporta a arquitetura BitNet (LLM de 1-bit) da Microsoft. Essa tecnologia integrada ao QVAC Fabric reduz drasticamente os requisitos de memória e processamento, tornando modelos com bilhões de parâmetros acessíveis além do ambiente de GPU empresarial, possibilitando o treinamento “local e totalmente privado” em smartphones e laptops comuns.
(Prévia: Tether investe na Axiym para ampliar sua infraestrutura de pagamento: impulsionando a integração do USDT em redes de pagamento globais e reguladas)
(Complemento: Tether investe na interseção entre IA e tecnologia do sono! Liderando um aporte de 50 milhões de dólares na Eight Sleep, elevando sua avaliação para 1,5 bilhão de dólares)

Índice do artigo

Alternar

  • O poder da arquitetura de 1-bit: fazer o desempenho do celular “render mais com menos”
  • Dados de testes reais: velocidade surpreendente do Samsung S25 e do iPhone 16
  • Adeus às chaves API, criando uma IA pessoal 100% privada

No campo da inteligência artificial (IA), treinar modelos poderosos sempre foi considerado um “gasto de dinheiro”, altamente dependente de sistemas caros da NVIDIA ou de computação em nuvem. No entanto, o gigante das stablecoins, Tether, tenta reescrever essa regra com tecnologia própria. Em 17 de março, a equipe técnica da Tether, a “Tether Data”, anunciou o lançamento do primeiro framework de ajuste fino LoRA multiplataforma para sua plataforma QVAC (QuantumVerse Automatic Computer).

O valor central dessa inovação é: ela permite que modelos de IA com “bilhões de parâmetros” possam aprender de forma personalizada diretamente nos smartphones de cada usuário.

O poder da arquitetura de 1-bit: fazer o desempenho do celular “render mais com menos”

Esse avanço revolucionário é baseado na arquitetura BitNet de LLM de 1-bit, desenvolvida pela Microsoft. Com a otimização do QVAC Fabric, o uso de memória e a carga de processamento do modelo BitNet foram reduzidos a níveis extremamente baixos. Segundo o anúncio, essa estrutura não só suporta GPUs NVIDIA comuns, mas também é compatível com chips Intel, AMD, Apple M-series, além de GPUs móveis como Adreno (Android), Mali e Apple Bionic.

Isso significa que, ao contrário do que era possível apenas em centros de dados, agora é possível fazer ajuste fino de IA “LoRA” em smartphones. A Tether afirma que essa tecnologia permite que dispositivos de borda processem modelos com o dobro do tamanho de modelos quantizados Q4 tradicionais, demonstrando uma vantagem de memória sem precedentes.

Dados de testes reais: velocidade surpreendente do Samsung S25 e do iPhone 16

A equipe da Tether compartilhou dados de testes empolgantes, demonstrando a capacidade prática dessa estrutura em smartphones modernos:

  • Modelo de 125 milhões de parâmetros: ajustado em um conjunto de dados com 300 documentos biomédicos no Samsung S25, em cerca de 10 minutos.
  • Modelo de 1 bilhão (1B) de parâmetros: completou o mesmo ajuste em 1 hora e 18 minutos no Samsung S25 e em 1 hora e 45 minutos no iPhone 16.
  • Desafio extremo: a equipe conseguiu rodar um modelo de até 13 bilhões (13B) de parâmetros no iPhone 16 para ajuste fino, levando a IA móvel ao limite físico do dispositivo.

Adeus às chaves API, criando uma IA pessoal 100% privada

O CEO da Tether, Paolo Ardoino, sempre enfatizou: “Se você precisa de uma chave API para usar IA, ela não é realmente sua.” A filosofia central do QVAC é “prioridade ao local (Local-first)”.

Com o framework LoRA de BitNet, os usuários podem fazer com que a IA aprenda diretamente de seus e-mails, notas e mensagens locais, sem precisar enviar qualquer dado para servidores na nuvem. Isso elimina preocupações sobre o uso indevido de dados sensíveis por empresas e rompe com o monopólio de poucos gigantes no desenvolvimento de IA. Atualmente, o QVAC Fabric LLM está disponível como software de código aberto (licença Apache 2.0) e oferece adaptadores pré-configurados na Hugging Face, permitindo que desenvolvedores ao redor do mundo iniciem imediatamente essa revolução na computação de borda.

Ver original
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários