Em 18 de abril, várias fontes de capital de risco confirmaram que a DeepSeek deu início à sua primeira ronda de angariação de fundos externa, segundo (Pail News). A empresa está a visar uma avaliação superior a $10 mil milhões e planeia angariar pelo menos $300 milhões para reforçar as suas reservas de capital num contexto de custos crescentes na competição em IA, de acordo com relatórios que citam fontes com conhecimento de causa.
A DeepSeek ganhou anteriormente reconhecimento na indústria por rejeitar um foco na comercialização, apoiando-se no fundador Liang Wenfeng e no apoio da Phantasm Capital. A empresa dispunha de fortes capacidades técnicas nos sectores de trading quantitativo e finanças inteligentes e foi uma das primeiras empresas chinesas de grandes modelos a operar um cluster de GPUs de 10.000 cartões.
Apesar da proeminência da DeepSeek após o seu sucesso viral durante o Ano Novo Chinês do ano passado, a empresa tem sofrido perdas significativas de talento. Segundo a cobertura da (Pail News), vários investigadores de base deixaram a empresa desde o ano passado, maioritariamente jovens cientistas “nascidos nos anos 95”:
Investigador de modelo multimodal: A 12 de abril, a empresa de condução autónoma YuanRong Autonomous Driving confirmou publicamente que Ruan Cong, um contributo central para o modelo multimodal da DeepSeek, se juntou como Cientista-Chefe e fará a sua primeira aparição pública no Salão do Automóvel de Pequim.
Autor de LLM da primeira geração: Wang Bingxuan, autor central do primeiro grande modelo de linguagem da DeepSeek, anunciou recentemente a sua entrada na Tencent.
Autor da série de OCR: Wei Haoran, autor central da série DeepSeek-OCR, deixou a empresa por volta do Ano Novo Chinês deste ano, mas não divulgou publicamente o seu novo empregador.
Investigador de algoritmo GRPO: A 16 de abril, foi noticiado que o antigo investigador central da DeepSeek Guo Daya se juntou à ByteDance com um salário reportado na casa das centenas de milhões de yuan. De acordo com divulgações relacionadas, Guo Daya juntou-se à organização Seed da ByteDance, responsável por investigação e desenvolvimento de grandes modelos, como um dos líderes de direção de (agente inteligente) no nível L8. Guo Daya é identificado como um grande contribuidor para o algoritmo GRPO, que é central para a metodologia de treino de raciocínio do DeepSeek-R1. No mesmo dia, o vice-presidente do Grupo ByteDance Li Liang respondeu que o relatório era impreciso e que a empresa não tinha contratado recentemente trabalhadores com salários anuais a rondar os cem milhões de yuan. No entanto, segundo múltiplas fontes confirmadas pela (Pail News), Guo Daya de facto já se juntou à ByteDance.
Investigadora de investigação em aprendizagem profunda: A 12 de novembro, a antiga investigadora central da DeepSeek Luo Fuli anunciou publicamente que se juntou à Xiaomi MiMo, afirmando numa publicação nas redes sociais: “A inteligência acabará por transitar da linguagem para o mundo físico. Estou na Xiaomi MiMo, a trabalhar com um grupo de investigadores criativos, talentosos e genuinamente apaixonados para construir este futuro e prosseguir o AGI que idealizamos.” Segundo informação pública, Luo Fuli licenciou-se no programa de Ciência da Computação da Beijing Normal University e concluiu um mestrado em linguística computacional na Peking University. Após o seu mestrado, juntou-se ao Alibaba DAMO Academy como investigadora no laboratório de inteligência de máquina, desenvolvendo o modelo de pré-treinamento multilingue VECO e promovendo o trabalho open-source AliceMind. Em 2022, Luo Fuli juntou-se à Phantasm Quantitative (empresa-mãe da DeepSeek) para trabalho de aprendizagem profunda, mais tarde atuando como investigadora de aprendizagem profunda na DeepSeek e participando no desenvolvimento de modelos, incluindo o DeepSeek-V2.
Com base na informação acima, a DeepSeek experienciou perdas de talento de base em múltiplos domínios, incluindo grandes modelos de linguagem de base (LLM), agentes inteligentes Agent, reconhecimento ótico de caracteres OCR e tecnologias multimodais.
Segundo fontes da indústria, o nível de salários e compensações da DeepSeek é intermédio no sector, não o mais alto. Contudo, os headhunters estão atualmente a acelerar a caça ao talento a partir da equipa da DeepSeek com salários 2-3 vezes superiores e opções de equidade, acelerando as perdas de pessoal.
A 8 de abril, foram observadas novas atualizações de interface na DeepSeek: a caixa de entrada passou a exibir opções “Modo Rápido” e “Modo Especialista”. De acordo com a exibição da página, o Modo Rápido é adequado para conversas diárias com respostas imediatas e suporta reconhecimento de texto a partir de imagens e ficheiros, enquanto o Modo Especialista se destaca em problemas complexos. Estas mudanças marcam a primeira introdução de modos em camadas na página oficial da DeepSeek.
Estas atualizações renovaram a especulação sobre o lançamento da V4 da DeepSeek. Com base em relatos da comunicação social externa e em informação das redes sociais e de múltiplas fontes, espera-se que a DeepSeek lance formalmente a V4 em abril. De acordo com expectativas externas, se este lançamento da V4 for replicar o fenómeno do Ano Novo Chinês do ano passado, enfrentará, sem dúvida, desafios maiores, e as perdas de pessoal terão, inevitavelmente, impacto no lançamento da V4.
Polymarket a aumentar rapidamente a sua quota de mercado, com rumores de uma ronda de financiamento para desafiar uma avaliação de 15 mil milhões de dólares
Polymarket, avaliada em 15 mil milhões de dólares, negocia uma nova ronda de financiamento de 400 milhões
Cursor entra em contacto para angariar 2 mil milhões de dólares, valorização rumo aos 50 mil milhões: em três anos, de zero a 2 mil milhões de ARR, criando o registo mais rápido na história do software B2B