18 квітня кілька джерел венчурного капіталу підтвердили, що DeepSeek розпочала свій перший раунд зовнішнього залучення коштів, повідомляє (Pail News). Компанія орієнтується на оцінку, що перевищує $10 мільярда, і планує залучити щонайменше $300 мільйона, щоб зміцнити свої резерви капіталу на тлі зростання витрат у конкурентній боротьбі в сфері ШІ, повідомляється з посиланням на поінформовані джерела.
Раніше DeepSeek здобула визнання в індустрії завдяки відмові від фокусу на комерціалізацію: компанія спиралася на засновника Ляна Венфэна та підтримку Phantasm Capital. У компанії були сильні технічні можливості у сферах кількісного трейдингу й інтелектуальних фінансів, і вона була однією з перших компаній у Китаї, що працювали з кластером GPU на 10 000 карток.
Попри популярність DeepSeek після її вірусного успіху під час китайського Нового року минулого року, компанія зазнала відчутних втрат талантів. За даними повідомлень (Pail News), з минулого року пішли кілька ключових дослідників, переважно молоді вчені «покоління пост-95-х»:
Дослідник мультимоделі: 12 квітня компанія автономного керування YuanRong Autonomous Driving публічно підтвердила, що Руан Цун — ключовий учасник мультимодельної моделі DeepSeek — приєднався як Головний науковий співробітник, і зробить свою першу публічну появу на Пекінському автосалоні.
Автор першого покоління LLM: Ван Бінсюань, один із ключових авторів першої великої мовної моделі DeepSeek, нещодавно оголосив про приєднання до Tencent.
Автор серії OCR: Вей Хаоран, ключовий автор серії DeepSeek-OCR, відбув приблизно під час китайського Нового року цього року, але не розкрив публічно, де працюватиме далі.
Дослідник алгоритму GRPO: 16 квітня стало відомо, що колишній ключовий дослідник DeepSeek Го Дая приєднався до ByteDance з повідомленою зарплатою в сотні мільйонів юанів. За відповідними розкриттями, Го Дая приєднався до Seed-організації ByteDance, відповідальної за дослідження та розробку великих моделей, як один із керівників напрямку агентів (intelligent agent) на рівні L8. Го Дая визначають як одного з головних внесків у алгоритм GRPO, який є основою методології тренування міркування DeepSeek-R1. У той самий день віцепрезидент ByteDance Group Лі Лянь відповів, що повідомлення є неточним і що компанія не наймала працівників нещодавно на рівнях щорічної зарплати, близьких до сотень мільйонів юанів. Втім, за кількома джерелами, підтвердженими (Pail News), Го Дая справді приєднався до ByteDance.
Дослідник глибинного навчання: 12 листопада колишній ключовий дослідник DeepSeek Ло Фулі публічно оголосила про приєднання до Xiaomi MiMo, зазначивши в дописі в соціальних мережах: «Інтелект з часом перейде від мови до фізичного світу. Я в Xiaomi MiMo, працюю з групою креативних, талановитих і по-справжньому захоплених дослідників, щоб збудувати це майбутнє й реалізувати той AGI, який ми уявляємо». Згідно з публічною інформацією, Ло Фулі закінчила програму з комп’ютерних наук Пекінського педагогічного університету та здобула магістерський ступінь з обчислювальної лінгвістики в Пекінському університеті. Після здобуття магістерського ступеня вона приєдналася до Академії Alibaba DAMO як дослідниця лабораторії машинного інтелекту, що розробляє багатомовні моделі довгого попереднього навчання VECO та просуває відкриту роботу AliceMind. У 2022 році Ло Фулі приєдналася до Phantasm Quantitative (материнської компанії DeepSeek) для робіт із глибинного навчання, згодом працювала як дослідниця глибинного навчання в DeepSeek і брала участь у дослідженнях і розробці моделей, зокрема DeepSeek-V2.
На основі наведеної інформації DeepSeek зазнала втрат ключових талантів у кількох доменах, зокрема в базових великомовних моделях (LLM), інтелектуальних агентах Agent, оптичному розпізнаванні символів OCR та мультимодальних технологіях.
За даними індустрійних джерел, рівень зарплат і компенсацій DeepSeek є середнім у галузі, а не найвищим. Однак хедхантери зараз пришвидшують переманювання талантів із команди DeepSeek, пропонуючи зарплати у 2–3 рази вищі та опціони на акції, тим самим прискорюючи втрати персоналу.
8 квітня на DeepSeek помітили оновлення інтерфейсу: у полі введення тепер відображаються опції «Quick Mode» і «Expert Mode». Згідно з відображенням на вебсторінці, Quick Mode підходить для щоденних розмов із негайними відповідями та підтримує розпізнавання тексту з зображень і файлів, тоді як Expert Mode найкраще справляється зі складними задачами. Це означає, що DeepSeek уперше запровадила багаторівневі режими на офіційній вебсторінці.
Ці оновлення відновили припущення щодо релізу DeepSeek V4. За даними повідомлень зовнішніх медіа та інформації з соцмереж і кількох джерел, DeepSeek, як очікується, офіційно запустить V4 у квітні. З огляду на зовнішні очікування, якщо цей реліз V4 має відтворити феномен китайського Нового року минулого року, він безсумнівно зіткнеться з більшими викликами, а втрати персоналу неминуче вплинуть на реліз V4.