孟醒, sócio da 5Yuan Capital, publicou recentemente um relatório de sua visita a Silicon Valley, propondo um julgamento que até mudou o hábito dele de fazer anotações: Silicon Valley está entrando numa fase em que até quem tenta “construir ondas” acaba sendo engolido pelas ondas. A velocidade de iteração da IA já passou de “por mês” para “por semana”; até o próprio Silicon Valley não consegue acompanhar a própria velocidade.
Quando a IA amplia a produtividade de uma equipe em cinco vezes, você pode reduzir em 80% a força de trabalho para manter a produção original, ou pode manter o número de pessoas para fazer cinco vezes mais. A observação de Meng Xing em Silicon Valley equivale, no local, ao rascunho de uma resposta: quando um aumento de eficiência em 100 vezes não gera 100 vezes a receita, quando o orçamento de tokens chega perto do custo de mão de obra, quando a máquina a vapor ainda não corre mais rápido que a carroça, mas ninguém se atreve a parar, Silicon Valley está escolhendo “aumentar a velocidade primeiro, e pronto”. Mas para onde esse caminho vai levar no fim—“capacidade de expansão” ou “redução de custos”—não há uma conclusão até agora.
YC sai de indicadores de liderança e passa a indicadores de atraso
Neste ano, em março, Meng Xing estava sentado na plateia do YC W26 batch Demo Day ao lado do público e, quando ouviu o pitch da quinta empresa, ele largou a caneta. O motivo é que, entre mais de cem empresas nessa rodada, cerca de 80% estão fazendo agentes verticais, por exemplo: ajudar advogados a organizar documentos, ajudar suporte ao cliente a distribuir tickets, ajudar RH a selecionar currículos.
Se ele tivesse visto esses temas em outubro passado, acharia “bem interessante”. Mas depois que o Claude Code saiu das ferramentas para desenvolvedores e virou uma interface quase disponível para todo mundo, e quando a Opus 4.6 baixou o patamar do vibe coding a ponto de ficar no chão, esses agentes verticais, antes de terem construído barreiras de negócio, podem ser copiados por um engenheiro comum em um fim de semana.
O sistema de batches do YC, do processo de candidatura, peneiragem, entrada no programa, lapidação até o demo day, foi desenhado para um mundo mais lento. Com a velocidade de iteração atual da IA, cinco meses são suficientes para ocorrerem várias mudanças de paradigma. Meng Xing descreveu que o YC está, aos poucos, saindo de indicadores de liderança para virar indicadores de atraso.
A Meta programa usando o produto do adversário
O maior impacto da viagem de Meng Xing a Silicon Valley foi o fato de a Meta inteira estar usando o Claude Code. Uma empresa com valor na escala de trilhões, fazendo dezenas de milhares de engenheiros usarem a API de um concorrente para acessar o próprio código, isso era completamente impensável há apenas meio ano.
Internamente, a Meta chegou a lançar uma ferramenta chamada myclaw para tentar resolver problemas de segurança de código, mas “não era bom, ninguém usava”. No fim, a empresa relaxou diretamente as políticas: desde que não envolvesse dados de clientes, os funcionários poderiam usar o Claude Code livremente, e começaram a convocar reuniões e treinamentos internos sobre “como se tornar uma organização nativa de IA”.
A Google, por considerações de segurança, em princípio proíbe que os funcionários usem ferramentas de concorrentes, mas a DeepMind é exceção; alguns times responsáveis pelo Gemini e pelas aplicações internas usam Claude Code. A própria ferramenta interna de codificação da Google, a Antigravity, que supostamente gera hoje cerca de 50% do código novo por IA, ainda assim não consegue impedir a preferência da DeepMind.
Um ponto-chave é que a Anthropic fez um deployment private, e o raciocínio e o treinamento da Anthropic já rodam em grande parte nos TPUs do Google Cloud, então existe uma base de confiança entre as duas partes; outros grandes players não têm essa relação e realmente deixaram a segurança do código de lado temporariamente, para primeiro colocar a velocidade lá em cima.
O gasto de tokens do engenheiro custa mais que o próprio engenheiro
Entre várias startups “nativas de IA” que Meng Xing visitou em Palo Alto, o orçamento anual de tokens de um engenheiro é de cerca de 200 mil dólares, o que já se aproxima do salário anual de um engenheiro. À primeira vista, parece que a empresa corta pessoas usando IA para economizar; na prática, o custo total talvez nem tenha caído—apenas trocou o custo da mão de obra pelo custo de tokens.
A Meta levou isso ao extremo: internamente, estabeleceu um ranking de consumo de tokens; quem usa mais aparece na lista, e quem estiver no fim pode ser demitido. Os funcionários acabaram se “competindo” por isso com um título não oficial chamado “token legend”. Mas no mesmo período, a Meta fez duas rodadas seguidas de demissões, somando mais de dez mil pessoas. Isso não é contraditório: por um lado, todos avançam nos tokens; por outro, demissões em massa. São dois lados da mesma coisa.
Meng Xing viu na prática uma empresa na rodada C: o responsável técnico abriu o Slack e mostrou para ele; era tudo com agentes rodando. Por trás, havia vários Cursor agent em paralelo, dezenas ao mesmo tempo; depois abriu mais uma janela do Claude Code para fazer a orquestração. A ansiedade mais popular entre os engenheiros é: antes de dormir, não saber o que aqueles meus agentes vão fazer, e aí fica muito em pânico.
Eficiência 100x, sem que isso se converta em receita 100x
Muitos CTOs empolgados contaram a Meng Xing: “Antes, 60 pessoas levavam 1 ano para fazer o que agora 2 pessoas, com o Claude Code, resolvem em uma semana”, falando de “engenharia cem vezes” e “aumento de eficiência dez vezes”.
Mas, quando Meng Xing se acalmou, ele fez uma pergunta: ok, a eficiência aumentou 100 vezes; então a receita da empresa cresceu 100 vezes? A expansão das linhas de produto cresceu 100 vezes? Ele não obteve uma resposta positiva. O fato é que quando o aumento de eficiência de 100x cai na receita, muitas vezes isso só aparece como 50% ou como uma vez. Onde está a diferença—agora ninguém consegue explicar claramente.
“Usamos tantos tokens; a empresa deveria, por assim dizer, sofrer uma mutação genética e virar outro tipo de empresa. Mas em que tipo, eu não sei.” Um fundador disse isso para ele. Até a própria Anthropic tem cenários em que não consegue acompanhar. Meng Xing perguntou a um amigo da Anthropic “qual cenário é o mais doloroso quando vocês mesmos usam agentes”; a resposta foi “oncall”, resposta imediata.
Quando a resposta da API fica lenta, um nó de raciocínio cai, ou a saída do feedback do usuário fica anormal, o engenheiro de oncall precisa identificar rapidamente se o problema é um bug no código, uma alocação de poder computacional ou se é o próprio modelo. A Anthropic é a empresa mais forte do mundo em coding agents; esse cenário fica tão perto do core das capacidades deles que não poderia estar mais perto—mesmo assim, os agentes de oncall internos ainda não são fáceis de usar.
A máquina a vapor ainda não corre tão rápido quanto a carroça, mas ninguém se atreve a parar
Meng Xing descreveu o estado atual assim: a máquina a vapor já foi inventada, mas às vezes corre ainda menos rápido que a carroça. O ponto é que todo mundo sabe que a máquina a vapor eventualmente correrá mais rápido, então a segurança do código também deixou de importar, o orçamento de tokens explodiu e o ranking virou competição. Quanto a saber quando a máquina a vapor realmente vai ultrapassar a carroça, ninguém sabe; mas ninguém se atreve a parar e esperar aquele dia, porque o custo de parar pode ser maior do que queimar tokens errados.
E o consumo de tokens provavelmente não cresce de forma linear. Meng Xing citou dados da instituição de pesquisa METR: um indicador mede o quanto tarefas um agente de IA consegue concluir com 50% de taxa de sucesso (estimado pelo tempo de conclusão de especialistas humanos). Em março de 2025, o Claude 3.7 Sonnet ainda levava 50 minutos; no fim de 2025, o Claude Opus 4.6 já fazia em 14,5 horas.
No ciclo de duplicação desse indicador nos últimos dois anos, o intervalo caiu de 7 meses para 4 meses. Assim que a confiabilidade dos agentes der mais um salto, o consumo de tokens deixa de ser um problema de “aumentar 50% por ano” e vira, de uma noite para outra, mais uma ordem de grandeza. Meng Xing também mencionou uma previsão compartilhada num grupo de amigos: até o fim deste ano, muitas empresas (incluindo empresas de tecnologia) na prática só precisarão de 20% das pessoas.
( Responda uma pergunta: quando a IA faz você melhorar em cinco vezes a eficiência, você reduz 80% dos custos ou faz cinco vezes mais coisas? )
O autor, em abril deste ano, já tinha perguntado em um artigo: quando a IA amplia em cinco vezes a produtividade de uma equipe, você pode reduzir 80% do pessoal para manter a produção original, ou pode manter o número de pessoas para fazer cinco vezes mais. Aaron Levie, no podcast da a16z, propôs que no futuro a quantidade de agentes de uma empresa pode ser de 100 a 1.000 vezes a quantidade de funcionários; já Huang Renxun foi direto ao dizer que, se o mundo não criar novas ideias, o aumento de produtividade trazido pela IA no fim só se converterá em desemprego. O problema não está na IA, mas em saber se os tomadores de decisão têm imaginação.
A observação de Meng Xing em Silicon Valley é, em essência, um rascunho da resposta dada em campo: quando uma eficiência 100x não se converte em 100x de receita, quando o orçamento de tokens chega perto do custo de mão de obra, quando a máquina a vapor ainda não corre mais rápido que a carroça, mas ninguém se atreve a parar, Silicon Valley agora escolhe “aumentar a velocidade primeiro, para depois”. Mas até onde esse caminho vai no fim—“capacidade de expansão” ou “redução de custos”—até agora não há uma conclusão.
No fim do artigo, Meng Xing deixa uma perspectiva mais equilibrada: ele viu, nesses meio mês, que tantas pessoas estão “ficando para trás” de fato deixam ansioso; mas se a IA realmente puder transformar câncer em doença crônica em alguns anos, e acelerar a ciência dos materiais em vinte anos, talvez esse “ficar para trás” seja o maior salto de velocidade da história do desenvolvimento humano.
Para os tomadores de decisão empresariais, o verdadeiro problema nunca é se a IA vai substituir pessoas; e sim que, depois que a produtividade for ampliada em cinco, dez ou cem vezes, você escolhe usá-la para demitir mais pessoas ou para fazer mais coisas. Essa escolha está acontecendo simultaneamente nas salas de reunião de Silicon Valley e de empresas globais.
Este artigo 用 AI 提升產出還是降低成本?百倍效率沒換來百倍營收,但矽谷沒人敢喊停 最早出現於 鏈新聞 ABMedia.
Related Articles
Do banheiro ao fornecedor de temperos: o valor da cadeia de suprimentos impulsionado por IA, que empresas estão ajudando?
A MediaTek Contrata Ex-Executivo da TSMC para Expansão de Chips de IA
OpenAI faz parceria com a Yubico para oferecer chaves de segurança de hardware personalizadas
Índia alerta para riscos cibernéticos à medida que a IA Mythos da Anthropic viola defesas em 83 dos 100 casos de teste
Oportunidade de entrada agora para investidores que estão vendo 1 ação se transformar em 480 ações, antes do próximo split de ações da Nvidia?