Em 18 de abril, várias fontes de capital de risco confirmaram que a DeepSeek deu início à sua primeira ronda de angariação de fundos externa, segundo (Pail News). A empresa está a visar uma avaliação superior a $10 mil milhões e planeia angariar pelo menos $300 milhões para reforçar as suas reservas de capital num contexto de custos crescentes na competição em IA, de acordo com relatórios que citam fontes com conhecimento de causa.

Contexto: Rejeição anterior da comercialização

A DeepSeek ganhou anteriormente reconhecimento na indústria por rejeitar um foco na comercialização, apoiando-se no fundador Liang Wenfeng e no apoio da Phantasm Capital. A empresa dispunha de fortes capacidades técnicas nos sectores de trading quantitativo e finanças inteligentes e foi uma das primeiras empresas chinesas de grandes modelos a operar um cluster de GPUs de 10.000 cartões.

Saídas de pessoal-chave

Apesar da proeminência da DeepSeek após o seu sucesso viral durante o Ano Novo Chinês do ano passado, a empresa tem sofrido perdas significativas de talento. Segundo a cobertura da (Pail News), vários investigadores de base deixaram a empresa desde o ano passado, maioritariamente jovens cientistas “nascidos nos anos 95”:

Investigador de modelo multimodal: A 12 de abril, a empresa de condução autónoma YuanRong Autonomous Driving confirmou publicamente que Ruan Cong, um contributo central para o modelo multimodal da DeepSeek, se juntou como Cientista-Chefe e fará a sua primeira aparição pública no Salão do Automóvel de Pequim.

Autor de LLM da primeira geração: Wang Bingxuan, autor central do primeiro grande modelo de linguagem da DeepSeek, anunciou recentemente a sua entrada na Tencent.

Autor da série de OCR: Wei Haoran, autor central da série DeepSeek-OCR, deixou a empresa por volta do Ano Novo Chinês deste ano, mas não divulgou publicamente o seu novo empregador.

Investigador de algoritmo GRPO: A 16 de abril, foi noticiado que o antigo investigador central da DeepSeek Guo Daya se juntou à ByteDance com um salário reportado na casa das centenas de milhões de yuan. De acordo com divulgações relacionadas, Guo Daya juntou-se à organização Seed da ByteDance, responsável por investigação e desenvolvimento de grandes modelos, como um dos líderes de direção de (agente inteligente) no nível L8. Guo Daya é identificado como um grande contribuidor para o algoritmo GRPO, que é central para a metodologia de treino de raciocínio do DeepSeek-R1. No mesmo dia, o vice-presidente do Grupo ByteDance Li Liang respondeu que o relatório era impreciso e que a empresa não tinha contratado recentemente trabalhadores com salários anuais a rondar os cem milhões de yuan. No entanto, segundo múltiplas fontes confirmadas pela (Pail News), Guo Daya de facto já se juntou à ByteDance.

Investigadora de investigação em aprendizagem profunda: A 12 de novembro, a antiga investigadora central da DeepSeek Luo Fuli anunciou publicamente que se juntou à Xiaomi MiMo, afirmando numa publicação nas redes sociais: “A inteligência acabará por transitar da linguagem para o mundo físico. Estou na Xiaomi MiMo, a trabalhar com um grupo de investigadores criativos, talentosos e genuinamente apaixonados para construir este futuro e prosseguir o AGI que idealizamos.” Segundo informação pública, Luo Fuli licenciou-se no programa de Ciência da Computação da Beijing Normal University e concluiu um mestrado em linguística computacional na Peking University. Após o seu mestrado, juntou-se ao Alibaba DAMO Academy como investigadora no laboratório de inteligência de máquina, desenvolvendo o modelo de pré-treinamento multilingue VECO e promovendo o trabalho open-source AliceMind. Em 2022, Luo Fuli juntou-se à Phantasm Quantitative (empresa-mãe da DeepSeek) para trabalho de aprendizagem profunda, mais tarde atuando como investigadora de aprendizagem profunda na DeepSeek e participando no desenvolvimento de modelos, incluindo o DeepSeek-V2.

Fuga de talento em múltiplos domínios

Com base na informação acima, a DeepSeek experienciou perdas de talento de base em múltiplos domínios, incluindo grandes modelos de linguagem de base (LLM), agentes inteligentes Agent, reconhecimento ótico de caracteres OCR e tecnologias multimodais.

Segundo fontes da indústria, o nível de salários e compensações da DeepSeek é intermédio no sector, não o mais alto. Contudo, os headhunters estão atualmente a acelerar a caça ao talento a partir da equipa da DeepSeek com salários 2-3 vezes superiores e opções de equidade, acelerando as perdas de pessoal.

Atualizações da plataforma e expectativas para a V4

A 8 de abril, foram observadas novas atualizações de interface na DeepSeek: a caixa de entrada passou a exibir opções “Modo Rápido” e “Modo Especialista”. De acordo com a exibição da página, o Modo Rápido é adequado para conversas diárias com respostas imediatas e suporta reconhecimento de texto a partir de imagens e ficheiros, enquanto o Modo Especialista se destaca em problemas complexos. Estas mudanças marcam a primeira introdução de modos em camadas na página oficial da DeepSeek.

Estas atualizações renovaram a especulação sobre o lançamento da V4 da DeepSeek. Com base em relatos da comunicação social externa e em informação das redes sociais e de múltiplas fontes, espera-se que a DeepSeek lance formalmente a V4 em abril. De acordo com expectativas externas, se este lançamento da V4 for replicar o fenómeno do Ano Novo Chinês do ano passado, enfrentará, sem dúvida, desafios maiores, e as perdas de pessoal terão, inevitavelmente, impacto no lançamento da V4.

Ver fonte

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.

Polymarket a aumentar rapidamente a sua quota de mercado, com rumores de uma ronda de financiamento para desafiar uma avaliação de 15 mil milhões de dólares

ChainNewsAbmedia04-20 04:31

Polymarket, avaliada em 15 mil milhões de dólares, negocia uma nova ronda de financiamento de 400 milhões

Market Whisper04-20 03:37

Cursor entra em contacto para angariar 2 mil milhões de dólares, valorização rumo aos 50 mil milhões: em três anos, de zero a 2 mil milhões de ARR, criando o registo mais rápido na história do software B2B

ChainNewsAbmedia04-20 01:45

Comentar

0/400

GossipingOnlooker002

· 04-23 17:19

Projeto de engano financeiro

Ver originalResponder0

MACDGoldenCross

· 04-19 20:13

Avaliação > 10 bilhões de dólares, indicando que as instituições continuam a ampliar as expectativas em relação aos grandes modelos nacionais.

Ver originalResponder0

GateUser-4bd1cc87

· 04-19 06:45

Se conseguir captar 300 milhões de dólares, a capacidade de processamento e o desenvolvimento do ecossistema terão mais confiança.

Ver originalResponder0

NarrativeCartographer

· 04-19 01:04

O que importa é se, após o dinheiro entrar, o ritmo de desenvolvimento será desviado pelos KPIs, para não se transformar numa narrativa puramente comercial.

Ver originalResponder0

ByteSizedAlpha

· 04-19 00:49

O financiamento externo finalmente chegou, dando ao mercado um sinal claro.

Ver originalResponder0

TrendlineSculptor

· 04-19 00:15

Estou mais interessado em ver como ele resolve os custos de computação e a margem de lucro na inferência, caso contrário, mesmo com uma avaliação alta, não aguentará.

Ver originalResponder0

MiningGeologist

· 04-19 00:13

Começo de avaliação de 10 bilhões? Impressionante.

Ver originalResponder0

AmberTeaSwirl

· 04-19 00:06

A onda de IA, que passou de uma competição técnica para uma competição de capital, a DeepSeek está oficialmente na mesa.

Ver originalResponder0

FarmingNoSleep

· 04-18 23:58

A entrada de capital também significa maior transparência, esperando que mais produtos sejam implementados.

Ver originalResponder0

RugCheckSkeptic

· 04-18 23:55

Espero que após o financiamento possam continuar a abrir o código / disponibilizar algumas funcionalidades, e não fechar completamente as portas logo após obterem financiamento.

Ver originalResponder0

Ver mais