O cientista-chefe de IA da Tencent, Yao Shunyu, fez sua primeira aparição pública em 5 de junho, na Conferência de Aplicações da Indústria de IA da Tencent Cloud, onde discutiu o grande modelo de linguagem Hunyuan 3 da empresa e respondeu a críticas de que a Tencent teria ficado para trás no desenvolvimento de IA. Yao, que entrou na Tencent vindo da OpenAI e lidera a equipe do modelo Hunyuan, participou de um diálogo com a executiva-chefe sênior da Tencent, Tang Daosheng, abordando estratégia de modelos de IA, desenvolvimento de produtos e o futuro dos agentes inteligentes. O cientista, de 28 anos, tratou o ceticismo externo caracterizando a competição em IA como uma maratona, e não um sprint, afirmando que o mundo não pode depender apenas do ChatGPT como um único aplicativo dominante.

Yao Shunyu detalha a abordagem de desenvolvimento do Hunyuan 3

Yao descreveu três melhorias centrais no Hunyuan 3 durante o diálogo na conferência. “Na verdade, não há segredo. Construir grandes modelos hoje é, em certa medida, uma tarefa bastante tediosa. Devemos focar em acertar a infraestrutura, acertar os dados — a parte de algoritmo é relativamente simples”, afirmou Yao. As melhorias incluíram reconstruir toda a infraestrutura para pré-treinamento e aprendizado por reforço, atualizar de forma abrangente os sistemas de dados e avaliação com maior ênfase em definir problemas reais e melhorar a qualidade dos dados, e tomar decisões orientadas por gosto em contratações, cadência de desenvolvimento do modelo e trade-offs.

Yao, que propôs a arquitetura ReAct durante sua pesquisa de doutorado, enfatizou que muitas decisões no desenvolvimento de modelos são “orientadas por gosto”, e não baseadas em fórmula. “Muitas decisões são, de fato, orientadas por gosto”, ele repetiu várias vezes durante o diálogo. Sua tese de doutorado de 2019, intitulada “From Next Token Prediction to Digital Automation”, explorou agentes de linguagem na era do GPT-2. “Naquela época ainda era a era do GPT-2, e nem conseguia gerar parágrafos contínuos — havia muitas arestas”, relembrou Yao. “Mas eu senti na época que o GPT era algo muito elegante, e gerar o próximo token é uma tarefa extremamente simples, mas muito geral. Eu acreditei que, um dia, ele teria potencial não só para gerar o próximo token, mas para automatizar tudo neste mundo.”

Yao identificou agentes de codificação como a forma mais essencial de agentes inteligentes, porque eles são completos de Turing. Ele traçou a estratégia em três partes da Tencent para o desenvolvimento de agentes: enfatizar um design de sistema abrangente, aproveitar totalmente os dados que voltam das linhas de produto e manter imaginação suficiente para exploração. Sobre a estratégia de desenvolvimento de modelos, Yao compartilhou três direções: manter sistemas de dados abrangentes apesar de a codificação se tornar a linha mais importante, alavancar dados de feedback das linhas de produto por meio de experiência de co-design e explorar paradigmas seguintes na evolução de tecnologia e produtos.

Quanto às escolhas de trade-off entre custo e desempenho, Yao afirmou que desempenho é o pré-requisito para custo-efetividade. “Muitas pessoas acham que usar um modelo forte é mais barato do que usar um modelo ruim, porque ele resolve as coisas corretamente mais rápido”, explicou. Ele sugeriu que alcançar bom desempenho com modelos relativamente menores e manter desempenho robusto na maioria das tarefas “pode ser mais valioso na China de hoje”.

Tencent define requisitos organizacionais para AGI

Yao apresentou no ano passado, em um post em blog, o conceito de “segunda metade da IA”, um termo agora amplamente usado na indústria. Ele explicou que o cerne desse conceito está em uma mudança fundamental: enquanto as décadas anteriores do desenvolvimento de IA se concentraram em “encontrar métodos”, agora que as metodologias amadureceram, “encontrar bons problemas” ficou mais difícil. “No passado inventamos métodos como AlphaGo para jogar Go, mas ele só conseguia jogar xadrez. Criamos um modelo especial para tradução, mas ele só conseguia fazer tradução. Mas com pré-treinamento e pós-treinamento, agora temos um martelo universal que consegue acertar qualquer prego”, explicou Yao. “A coisa mais difícil, na verdade, é encontrar bons problemas para resolver.”

Yao afirmou que o amplo portfólio de produtos e cenários da Tencent fornecem fontes autênticas de problemas para a tecnologia de IA, o que seria sua segunda razão para entrar na empresa. Ele identificou a cultura como sua motivação principal. “Quando eu conversei pela primeira vez com o presidente Tang e com outros líderes executivos, minha primeira impressão foi que todo mundo era muito honesto sobre o que estamos fazendo bem e sobre o que não estamos fazendo bem — muito direto, sem maquiar as coisas”, disse Yao. “Em geral, a Tencent opera com base em confiança, e não em métricas. Essa cultura franca, de baixo ego e pragmática, junto com o compromisso com o longuísmo, é crucial para construir uma organização de IA de longo prazo.”

De acordo com Yao, a tarefa mais importante na segunda metade da IA é estabelecer, na China, uma organização longa baseada em AGI. Essa organização exige construir um “triângulo equilibrado”: tecnologia fundamental sólida, produtos que geram valor e um espírito de exploração de fronteiras.

Yao e Tang respondem a críticas de ritmo na conferência

Yao afirmou durante o diálogo que IA é um jogo de longo prazo e que a segunda metade já começou. “Eu não acho que ChatGPT e Claude Code serão as únicas superaplicações — isso seria um mundo muito sombrio. Hoje é como a década de 1970, quando os PCs surgiram pela primeira vez — ainda há muitas, muitas coisas que precisam ser feitas”, disse Yao. Ele previu que o futuro ficará mais diverso, e não mais singular, observando que “agentes de codificação estão apenas começando, e inteligência multimodal e incorporada — muitas, muitas coisas novas — é que estão começando a acontecer”.

“No passado, modelos e produtos passaram por muita exploração e deram muitas voltas. Eu acho que isso é normal”, afirmou Yao. “O mais importante é se conseguiremos encarar a nós mesmos honestamente, se conseguiremos ser reais, se conseguiremos ver o feedback e então mudar, e manter a paciência. Isso é o mais importante na segunda metade.”

Tang Daosheng afirmou que a Tencent recebe críticas e sugestões externas. “Somos uma empresa com formatos de negócios bem diversos. Às vezes podemos ser rápidos, às vezes lentos, e vamos falhar em algumas áreas. Mas isso é uma maratona, e acreditamos que os modelos vão iterar continuamente, as necessidades dos usuários vão continuar mudando e novos formatos de produtos vão surgir”, disse Tang.

FAQ

O que Yao Shunyu anunciou na conferência da Tencent em 5 de junho?

Yao Shunyu, cientista-chefe de IA da Tencent, discutiu na conferência de Aplicações da Indústria de IA da Tencent Cloud em 5 de junho a abordagem de desenvolvimento do modelo de linguagem Hunyuan 3. Ele detalhou três melhorias centrais: reconstruir a infraestrutura para pré-treinamento e aprendizado por reforço, atualizar sistemas de dados e avaliação e implementar tomada de decisão orientada por gosto em contratações e desenvolvimento de modelos. Yao também respondeu às críticas sobre o ritmo de desenvolvimento de IA da Tencent caracterizando a competição como uma maratona, e não um sprint.

Por que Yao Shunyu entrou na Tencent vindo da OpenAI?

Yao afirmou durante o diálogo na conferência que a cultura foi a principal razão para entrar na Tencent. Ele descreveu sua primeira impressão da liderança da Tencent como “muito honesta” e “direta, sem cobrir as coisas”. Yao explicou que a Tencent opera com base em confiança, e não em métricas, com uma “cultura franca, de baixo ego e pragmática”, além de um compromisso com o longuísmo que ele considera crucial para construir uma organização de IA de longo prazo. Sua segunda razão foi o amplo portfólio de produtos da Tencent, que fornece fontes autênticas de problemas para o desenvolvimento de tecnologia de IA.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

4h atrás

A Huawei Cloud lança produtos da série de IA agentic com novo framework de infraestrutura em 5 de junho

5h atrás

Cientista de IA da Tencent diz que a IA é um jogo de longo prazo à medida que a segunda fase começa

6h atrás

A Tencent abre o WeChat para assistentes de IA da Honor, Huawei, Xiaomi, Oppo e Vivo

Anthropic pede desaceleração global da IA diante do risco de autoaperfeiçoamento recursivo

Oliver Grant4h atrás

CEO da Google DeepMind prevê chegada da AGI até 2030 em palestra na Stanford

Oliver Grant14h atrás

Crise de Custos da IA impulsiona novas comparações com uma bolha de tecnologia estilo dot-com