
Zero-knowledge machine learning é uma técnica que envolve o “processo de inferência” de um modelo numa prova de zero conhecimento. Isto permite a terceiros verificar que “o seu cálculo está correto” sem revelar o modelo subjacente ou os dados de entrada. É semelhante a apresentar um comprovativo de pagamento para provar que efetuou uma compra, sem mostrar a lista completa de artigos adquiridos.
Uma prova de zero conhecimento é um tipo de prova matemática que funciona como um elemento compacto de evidência. Qualquer pessoa pode verificar rapidamente a sua validade, sem que seja revelada informação adicional. Em machine learning, inferência é o processo em que um modelo recebe uma entrada e produz uma saída — por exemplo, determinar se uma imagem contém um gato. Zero-knowledge machine learning combina estes conceitos para que smart contracts em blockchain possam verificar se o resultado (por exemplo, “gato ou não”) está correto, sem revelar a imagem de entrada ou detalhes do modelo.
Zero-knowledge machine learning resolve a tensão entre “fiabilidade” e “confidencialidade”: os resultados precisam de ser confiáveis para várias partes, mas tanto os dados como o modelo devem muitas vezes permanecer privados. Isto é especialmente relevante em ambientes blockchain, onde os dados on-chain são transparentes mas não adequados para tratar informação sensível diretamente.
Na prática, as instituições não querem expor parâmetros do modelo ou segredos comerciais, e os utilizadores preocupam-se com a privacidade. Os reguladores exigem conformidade verificável, enquanto as aplicações on-chain requerem baixos custos e elevada confiança. Zero-knowledge machine learning permite verificabilidade e privacidade, tornando-se uma ponte fundamental entre IA e Web3.
O princípio central é “comprometer primeiro, depois provar, depois verificar”.
Primeiro passo: Comprometer os parâmetros do modelo e as entradas através de hashing — como selar objetos num envelope com uma etiqueta no exterior.
Segundo passo: Realizar a inferência localmente e gerar uma prova concisa de que “usando este modelo e esta entrada, obtém-se este resultado”.
Terceiro passo: Submeter o resultado e a prova a um verificador ou smart contract; o contrato apenas verifica a validade da prova e nunca acede ao conteúdo do “envelope”.
Existem duas abordagens principais para sistemas de prova de zero conhecimento:
Para tornar a inferência do modelo verificável, é necessário traduzir as operações do modelo para uma descrição computacional verificável, normalmente designada por “circuito”. Imagine dividir cálculos complexos em muitos passos pequenos e facilmente verificáveis. O sistema de prova gera então uma prova para esse “circuito”.
As operações on-chain seguem geralmente o paradigma “inferência off-chain + verificação on-chain”. O utilizador ou prestador de serviço realiza a inferência e gera as provas off-chain; o smart contract on-chain apenas verifica a prova, evitando cálculos on-chain dispendiosos.
Primeiro passo: Submeter compromissos. Hashes do modelo e da entrada são submetidos on-chain ou mantidos como registos offline para indicar qual modelo e entrada foram usados.
Segundo passo: Gerar provas. Localmente ou no servidor, gera-se uma prova de zero conhecimento demonstrando que “esta inferência foi realizada com o modelo e a entrada comprometidos, resultando em R”.
Terceiro passo: Verificação on-chain. Invoca-se a função de validação do smart contract, fornecendo o resultado e a prova. O contrato verifica a validade da prova; se for bem-sucedida, o resultado pode ser utilizado como dado confiável.
Em blockchains públicas como a Ethereum, o custo de verificação de cada prova depende do sistema de prova escolhido. Em 2024, as provas sucintas mais comuns podem ser verificadas com custos aceitáveis para a maioria das aplicações, frequentemente por alguns dólares (dependendo da congestão da rede e implementação do contrato). Para reduzir ainda mais os custos, são comuns estratégias como mover a verificação para redes Layer 2, utilizar provas recursivas para fundir múltiplas inferências numa só verificação e empregar verificação em lote para minimizar despesas totais.
Zero-knowledge machine learning é indicado para situações em que os resultados devem ser confiáveis, mas os detalhes têm de permanecer confidenciais.
Zero-knowledge machine learning pode complementar, mas não substitui TEE (Trusted Execution Environment), MPC (Multi-Party Computation) ou encriptação homomórfica — cada solução tem o seu foco próprio.
Na prática, estas soluções são frequentemente combinadas — por exemplo, acelerando a geração de provas dentro de TEE ou usando MPC para treino conjunto seguido de provas de zero conhecimento para os resultados de inferência.
O início envolve três fases principais:
Primeiro passo: Definir o objetivo. Escolher uma tarefa de decisão específica, como “esta transação é anómala?” ou “o preço ultrapassou um limite?”, em vez de geração aberta; especificar quais as partes que têm de permanecer confidenciais (parâmetros do modelo, dados de entrada, limites).
Segundo passo: Seleção do modelo e construção do circuito. Optar por modelos leves (por exemplo, pequenas árvores de decisão ou submódulos de redes convolucionais) e converter os passos de inferência em operações básicas verificáveis (“circuitização”). Quanto mais simples e pequeno for o modelo, mais rápida será a geração da prova. Fixar níveis de precisão e intervalos de operadores para evitar a complexidade de ponto flutuante nos circuitos.
Terceiro passo: Geração de provas e implementação de contratos. Selecionar um sistema de prova e implementar um contrato de verificação; implementar em Layer 2 ou Rollups para reduzir custos; reservar interfaces para processamento em lote ou recursivo. Implementar registo e testes de repetição para garantir consistência entre resultados de inferência off-chain e verificação on-chain.
No desenvolvimento, é essencial garantir consistência no pré-processamento de dados (o pré-processamento off-chain deve ser verificável), fixar aleatoriedade e seeds (para reprodutibilidade) e implementar limites de taxa e controlos de acesso para evitar fuga de modelos por excesso de consultas.
Zero-knowledge machine learning não é uma solução milagrosa; as principais limitações prendem-se com desempenho e custo.
As tendências do setor apontam para três grandes avanços:
Em 2024, os tamanhos das provas reduziram-se para dezenas ou centenas de kilobytes, os custos de verificação são geríveis e a maturidade do ecossistema já permite implementações iniciais para decisões baseadas em regras ou deteções de limiar — antes de evoluir gradualmente para casos mais complexos.
Zero-knowledge machine learning alia “verificação fiável” e “proteção de privacidade” em cenários blockchain: a inferência offline gera provas sucintas rapidamente verificadas on-chain, permitindo que smart contracts consumam resultados de forma segura. Na prática, optar por tarefas de decisão bem definidas, modelos leves e redes Layer 2 é atualmente o mais viável. Combinar ZKML com TEE, MPC ou encriptação homomórfica oferece um equilíbrio entre desempenho e privacidade. Em aplicações relacionadas com ativos ou controlo de risco, incorporar auditoria, limitação de taxa e mecanismos de contingência é fundamental para proteger fundos e integridade dos dados.
A principal diferença está nos mecanismos de proteção de privacidade. O machine learning tradicional exige o envio de dados brutos para servidores centralizados para processamento — aumentando o risco de fuga de dados. Com zero-knowledge machine learning, os titulares dos dados realizam os cálculos localmente e apenas partilham os resultados acompanhados de provas de privacidade; os dados brutos nunca saem do dispositivo. É como receber uma encomenda sem entregar as chaves de casa — o estafeta só precisa de confirmar a sua identidade para a entrega.
Existe de facto um compromisso de desempenho. Gerar e verificar provas de privacidade aumenta a carga computacional — normalmente tornando o processo 10 a 100 vezes mais lento do que o machine learning convencional, dependendo da complexidade do modelo. No entanto, este overhead é frequentemente aceitável em áreas sensíveis à privacidade, como diagnóstico médico ou gestão de risco financeiro. Graças a otimizações de hardware e avanços algorítmicos, esta diferença de desempenho continua a diminuir.
Sim. Zero-knowledge machine learning pode ser aplicado à deteção de risco on-chain e análise de fraude — identificando padrões de trading suspeitos enquanto protege a privacidade do utilizador. Por exemplo, ao negociar na Gate, modelos ZKML em segundo plano podem validar o score de risco da sua conta sem expor o histórico de transações ou o volume de ativos à plataforma — proporcionando uma proteção fiável e invisível.
As provas de privacidade de zero conhecimento baseiam-se em princípios criptográficos que as tornam teoricamente infalsificáveis. Falsificar tais provas exigiria quebrar pressupostos criptográficos fundamentais — algo considerado computacionalmente impraticável com a tecnologia atual. No entanto, a segurança depende da qualidade da implementação — por isso, optar por soluções auditadas e certificadas é fundamental.
Não. Utilizar ZKML é como usar qualquer outro software — só precisa de saber que a sua privacidade está protegida. Os programadores e plataformas encapsulam toda a complexidade criptográfica por detrás de interfaces intuitivas; com aplicações como a Gate, basta seguir os passos para usufruir dos benefícios de privacidade — tal como utiliza a internet sem conhecer os protocolos TCP/IP.


