Gate News 消息,4 月 24 日——字节跳动种子团队的前工程师张弛、现任北京大学助理教授在播客“Into Asia”中透露,字节跳动完成一次大型语言模型训练(预训练以及后训练)需要大约六个月,而据称谷歌只需要三个月。张弛将这种速度差异视为中国公司在 AI 开发方面难以追赶的核心原因。
张弛描述了种子内部的一种“基准测试文化”:团队负责人会根据他们所负责的基准测试得分来接受评估,所有成员都致力于提升数据指标。不过他指出,这种做法在实践中并不会转化为更好的用户体验。尽管从纸面上看,中国大型公司的模型似乎与美国前沿模型具备竞争力,但在实际使用中却有所欠缺。种子的目标是达到全球一流水平,但张弛表示他不认为团队已经实现了这一目标,也未达成国内领导者的目标。
在 2024 年末,种子团队认为自己与 GPT-4o 处于同一水平,但在深度求索发布之后,团队意识到差距仍然存在。张弛加入时,整个团队正急切地转向强化学习,以弥补这一不足。
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
xAI Илона Маска переименуют в SpaceXAI, поскольку статус независимой компании прекращается
Согласно Odaily, Илон Маск объявил, что xAI будет переименована в SpaceXAI, поскольку компания больше не будет работать как независимое юрлицо.
GateNews32м назад
IBM расширяет набор корпоративных AI-инструментов с новыми агентными решениями на Think 2026
По данным IBM, компания объявила о расширении своих корпоративных возможностей ИИ на конференции Think 2026 в Бостоне, запуская новые агентные инструменты, чтобы помочь организациям внедрять искусственный интеллект в повседневные операции. Context Studio, теперь доступный в общем пользовании, позволяет предприятиям
GateNews40м назад
Акции Hut 8 выросли на 30% до аренды дата-центра для ИИ на $9,8 млрд
Акции Hut 8 подскочили более чем на 30% после новости о соглашении об аренде AI-ЦОД на 9,8 миллиарда долларов. Биткоин-майнер расширяется в AI-инфраструктуру благодаря долгосрочному контракту на уровне hyperscale, размещённому в Техасе.
Расширение AI-инфраструктуры
Контракт включает опции, которые могут увеличить общую
CryptoFrontier53м назад
Мечты Claude от Anthropic: агент сам упорядочивает память между задачами, устраняет дубликаты и противоречия
Anthropic на мероприятии Code with Claude объявила Dreams: чтобы Claude Managed Agents автоматически систематизировали воспоминания, устраняли дубликаты и противоречия между несколькими сессиями, а также обновляли устаревшие записи, выводя проверяемую сводную базу воспоминаний; входной лимит — 100 сессий и 4 096 символов, асинхронное выполнение, занимает от нескольких минут до нескольких десятков минут, поддерживает наблюдение в режиме стриминга. Исследовательский превью-тест нужно подать отдельно; пока что доступна только поддержка claude-opus-4-7 и claude-sonnet-4-6, дата официального релиза не определена.
ChainNewsAbmedia3ч назад
Anthropic заключает сделку с SpaceX по вычислительным мощностям: получает Colossus 1 целиком — 220 тыс. GPU, а для Claude снимают ограничения
Anthropic объявила о сотрудничестве по вычислительным мощностям с SpaceX для дата-центра Colossus 1: будет задействовано более 220 тыс. GPU Nvidia, мощность — свыше 300MW. Планируется, что в течение месяца вся инфраструктура будет полностью развернута для использования Anthropic, чтобы улучшить вычисления и впечатления для Claude и Code. Параллельно будет ослаблен лимит потребления для Pro/Max/Team/Enterprise каждые 5 часов, отменены лимиты на пиковые нагрузки и повышена скорость Opus API. Также одновременно расширяется базовая инфраструктура в Азии и Европе; в будущем есть намерения вроде «орбитальных AI-вычислений», но сделок пока не заключено.
ChainNewsAbmedia4ч назад