torygreen

vip
Возраст 2.8 год
Максимальный уровень 0
Пока нет содержимого
Ограничение ИИ в 2026 году — это не качество модели. Это пропускная способность сети.
PJM только что зафиксировал скачок цен на мощность на 833% в Вирджинии. Этот штат теперь направляет около 40% своей электроэнергии в центры обработки данных и импортирует больше энергии, чем Калифорния. Дублин потребляет почти 80% национальной сети Ирландии. Франкфурт — 42% регионального снабжения.
МЭА считает, что спрос центров обработки данных примерно удвоится к 2030 году, в то время как половина строящихся в США проектов сосредоточена в местах, где сеть уже испытывает нагрузку.
Мы становимся лучше в выдав
Посмотреть Оригинал
post-image
  • Награда
  • 1
  • Репост
  • Поделиться
NexaCrypto:
2026 Вперёд-вперёд-вперёд 👊
Провел время с цифрами по инференсу, и одна статистика продолжает возвращаться.
70% AI-инференса в 2026 году выполняется на периферии. Не в гипермасштабном центре обработки данных. Не на AWS. На промышленных системах, автономном оборудовании и подключенных устройствах, где круговая поездка к облачному серверу — это не проблема задержки, это режим отказа.
Рынок инференса объемом $106 млрд растет не потому, что люди отправляют больше запросов "чат" своему ИИ. Он растет, потому что ИИ встраивается в физическую инфраструктуру, которая работает непрерывно, функционирует в средах без надежной сети и
Посмотреть Оригинал
  • Награда
  • комментарий
  • 1
  • Поделиться
Казалось бы, близость к физической технологии имеет очень мало общего с её фактическим внедрением.
Калифорния — дом для всех ведущих AI-лабораторий, которые имеют значение. В Нью-Йорке больше компаний из списка Fortune 500, чем в любом другом штате. Оба штата обогнал Колорадо, где уровень внедрения AI среди бизнеса достиг 23,2%, в то время как в Нью-Йорке — 13,8%.
У Колорадо и Аризоны нет лучшей инфраструктуры или талантов. У них есть готовность действовать до того, как индустрия даст сигнал, что это безопасно. Штаты, наиболее близкие к технологии, часто внедряют её медленнее всех, потому что
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
На бумаге затраты на ИИ должны были уже обвалиться.
Та же самая задача переднего края, которая стоила $30 за миллион токенов при запуске GPT-4 в 2023 году, сегодня с GPT-5 стоит $1.25. Падение в 96 раз за три года, среди известных моделей с опубликованными ценами.
По любым нормальным правилам, корпоративные счета за ИИ должны были рухнуть. Вместо этого средние бюджеты на ИИ компаний из списка Fortune-500 выросли с $7M в 2024 году до $19M в 2026 году. Почти в 3 раза за два бюджетных цикла.
Причина: дешевые токены не экономят, их превращают в оружие. Чат-бот запускает токены один раз и останав
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
В этом году в AI-вычислениях что-то тихо перевернулось, и это меняет то, для чего на самом деле предназначено строительство.
В 2023 году 2/3 AI-вычислений уходили на обучение, фактическую работу по созданию модели. Оставшаяся, меньшая часть шла на инференс, работу по фактическому запуску модели после её создания.
Но это соотношение тихо начало меняться.
Сейчас инференс составляет 2/3 и продолжает расти, по данным Deloitte, а чипы, созданные для его выполнения, пересекли $50B в этом году.
Главная причина, почему этот переворот важен (и это не в процентном соотношении): обучение и инференс — ра
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
Два года назад открытая модель на этом графике была бы почти внизу. Закрытые лаборатории были на поколения впереди, и этот разрыв был единственной причиной, по которой люди арендовали модели, а не владели ими.
Теперь GLM-5.2 находится на 51-м месте в индексе @ArtificialAnlys.
Открытые веса, китайская лаборатория, пятое место в целом. И вычеркните Fable из списка, поскольку он недоступен, а модель с открытыми весами гораздо ближе к вершине, чем показывает её рейтинг.
Главным аргументом закрытых моделей всегда было лидерство. Плати за API, принимай условия, строй на том, чем ты не управляешь, по
GLM4,16%
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Вот как распределяются вычисления ИИ, которые многие неправильно понимают.
Фронтальное обучение с каждым кварталом становится всё более концентрированным: тысячи GPU должны находиться в одном месте, соединённые вместе. Но обучение составляет лишь 30% спроса в 2026 году. Остальные 70% — это инференс, и его выполнение на гиперскейлере означает оплату инфраструктуры, созданной для самой сложной задачи, для выполнения самой простой.
На распределённых сетях тот же инференс может быть на 45–75% дешевле, и для любого, кто оценивает бюджет на инфраструктуру ИИ, этот разрыв и есть вся суть.
Обучение це
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
Думал о недавних новостях GLM 5.2 и об угле открытых весов, с которым все бегут, но они упускают совершенно другой угол здесь.
Все сосредоточены на том, что китайская лаборатория достигла производительности на уровне frontier и открыла её исходный код, но часть, над которой стоит задуматься, — это как. ZAI и остальные китайские лаборатории были отрезаны от Nvidia в начале 2025 года, так что, предположительно, с тех пор у них нет H100s, H200s напрямую.
Они пересекли $128B на модели, обученной, вероятно, на китайском кремнии, которая оказывается в нескольких пунктах от frontier.
Экспортные огра
GLM4,16%
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
95% мощности корпоративных GPU сейчас простаивают.
Эта цифра взята из данных Cast AI, измеряющих 23 000 реальных производственных кластеров, а не из общего опроса.
Средняя загрузка составляла 5%, и это происходит в тот самый момент, когда Nvidia повысила цены на H200 на 15%, впервые за 20 лет.
Оборудование, которое все считают дефицитным, в основном ничего не делает.
Если вы пытаетесь понять, почему кажется невозможным получить вычислительные ресурсы, вот почему.
Никто не возвращает выделение, на которое они ждали месяцами.
Итак, парк устройств работает на 5%, оплачивается по часам
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
Некоторые крупные инициативы по политике ИИ в ЕС, по сообщениям, скоро появятся, но вот какая инфраструктура у них есть.
> Расходы на суверенную инфраструктуру ИИ в ЕС в 2026 году: 12,6 миллиарда долларов.
> Капитальные затраты гиперскейлеров в США в тот же год: 725 миллиардов долларов.
Европа потратила шесть лет на создание 19 фабрик ИИ и 14 суперкомпьютеров, и только Amazon за два недели в этом году превысит все эти затраты.
Большинство европейских команд по ИИ не используют европейскую инфраструктуру. Они арендуют из Вирджинии и Айовы и платят премию за соответствие GDPR сверху над маржой г
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
Я не ожидал, что это число появится в этом году.
GitHub идет к 14 миллиардам коммитов в 2026 году.
Это выросло с 1 миллиарда в 2025 году.
Увеличение в 14 раз за один год, и большая часть этого не написана людьми.
Нагрузка стала настолько тяжелой, что Microsoft, владеющая и управляющая второй по величине облачной платформой на Земле,
пришлось направлять трафик через AWS, чтобы сохранить работу платформы.
Только в мае произошло девять инцидентов с сервисами.
Доступность снизилась до 88,4%.
Для каждой инженерной команды, поставщика инфраструктуры и облачного провайдера,
которые
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
Доход Nvidia — это доказательство того, что «агентный вычислительный процесс» — не теория. Он уже отражен в отчете о доходах.
$26B четыре года назад. 215,9 миллиарда долларов в прошлом году. Этот восьмикратный рост произошел, пока большинство ИИ все еще сидело в чат-боте, ожидая, когда вы зададите ему вопрос.
Важна не только рост. Важно, что Nvidia превратила свою архитектуру в необсуждаемый вход для почти всех остальных дорожных карт. Лаборатории, облака, предприятия. Разные логотипы на API, под ним — один и тот же силикон. Почти каждый доллар, потраченный на инфраструктуру ИИ в этом цикл
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
Я не ожидал, что пятилетний показатель Гольдмана будет таким большим.
Пять гиперскалеров, по прогнозам, потратят 5,3 триллиона долларов на инфраструктуру ИИ в период с 2025 по 2030 год. В 2022 году они потратили $162B вместе взятые.
В этом году они планируют достичь 725 миллиардов долларов. К 2027 году аналитики прогнозируют 1 триллион долларов за один год.
Для тех, кто создает продукты или инфраструктуру ИИ за пределами этих пяти балансовых отчетов, эта траектория — самое важное число в ваших предположениях о планировании.
Разрыв между тем, что они могут развернуть, и тем, к чему име
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Все предсказывали, что ИИ сначала возьмёт на себя рутинную административную работу. Данные показывают что-то иное.
Принятие решений сейчас составляет 28% активности ИИ на рабочем месте. Самое популярное применение — это не автоматизация. Это суждение.
Люди используют ИИ для анализа вариантов, взвешивания компромиссов и поддержки выводов, за которые они отвечают, и этот сдвиг важен за пределами вопроса о рынке труда.
Работы, основанные на суждении, выполняются непрерывно, требуют больше контекста за сессию и неэффективно группируются.
Требования к инфраструктуре для ИИ, который помогает
Посмотреть Оригинал
post-image
  • Награда
  • 1
  • Репост
  • Поделиться
Millionairetasks:
Отличная возможность для всех быть
Глобальная облачная инфраструктура 1 квартал 2026 года. 129 миллиардов долларов за один квартал. Рост на 35% в годовом выражении.
Рынок быстро расширяется, но концентрация не меняется. AWS, Azure и Google Cloud занимали примерно ту же долю два года назад, что и сегодня, но абсолютный разрыв между ними и всеми остальными шире в долларовом выражении, чем когда-либо.
Это часть, которую не показывает процентная диаграмма. Доля «Другие» не растет в сторону настоящей альтернативы. Она остается пропорционально такой же, в то время как три гиперскейлера добавляют десятки миллиардов долларов в абсо
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
PJM управляет электросетью в 13 штатах США и обслуживает 65 миллионов человек. Это крупнейший в мире конкурентный оптовый рынок электроэнергии.
Цена на рынок мощности, ставка, которая сигнализирует о том, сможет ли будущий запас электроэнергии удовлетворить спрос, выросла с 28,92 долларов за МВт в 2024 году до 329,17 долларов в 2026 году. Два цикла аукционов.
Спрос на дата-центры признан основным драйвером. Аукцион 2027/2028 just прошел по цене 333,44 доллара, при этом PJM прямо связывает увеличение нагрузки на 5100 МВт с дата-центрами.
Это не шок предложения или геополитическое событие.
Посмотреть Оригинал
post-image
  • Награда
  • 2
  • Репост
  • Поделиться
DiveNate:
2026 ВПЕРЕД 👊
Подробнее
Два числа из этой таблицы.
Цена API ИИ: снизилась на 96% с 2022 года.
Капитальные затраты гиперскейлеров: выросли в 12 раз за тот же период.
Большинство людей видят первое число и называют это демократизацией, но никто не строит стратегию вокруг второго.
Это не случайность. Это структурная игра захвата.
Каждая стартап-компания в области ИИ, празднующая дешевые модели, работает на вычислительных ресурсах, которыми она не владеет, на инфраструктуре, которую она не может воспроизвести, управляемой тремя компаниями.
Суверенный ИИ начинается с суверенной инфраструктуры. Всё остальное —
Посмотреть Оригинал
post-image
  • Награда
  • 1
  • Репост
  • Поделиться
Yuhuan:
gsgsgshsokzkzkzkxhxj
То, что в пятницу было раскрыто, заключается не в том, что правительства могут отключить модели ИИ.
Это в том, что вся глобальная база пользователей самых мощных моделей мира сосредоточена за одним операционным решением одной компании, реагирующей на одну директиву. Без резервных копий или предупреждений.
Три крупнейшие компании в области ИИ в настоящее время контролируют 88% доступа к передовым ИИ и один канал соответствия для всего этого.
То, что сделало видимым в пятницу, — это то, что когда вычисления и доступ к моделям сосредоточены внутри нескольких компаний, вся стековая архитекту
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
В 2024 году карта вычислений ИИ имела две супердержавы. США — 53,7 ГВт, Китай — 31,9 ГВт.
В 2026 году Китай — 2,5 ГВт.
Это контролируемая демонтаж инфраструктуры ИИ страны через экспортную политику. Без бомб, без санкций, только правила по чипам.
То, что это доказывает, — теперь вычислительные мощности являются геополитическим оружием. Любая страна, которая не владеет своей инфраструктурой, не хочет узнавать, каково это — оказаться на receiving end этого оружия.
Вопрос не в том, выигрывает ли децентрализованные вычисления. Вопрос в том, придут ли они раньше, чем следующая политическая
Посмотреть Оригинал
post-image
  • Награда
  • комментарий
  • Репост
  • Поделиться
Самое крупное технологическое IPO 2000-х годов — Visa за 28 миллиардов долларов. Самое крупное 2010-х — Alibaba за 168 миллиардов долларов. Примерно в 6 раз за десятилетие.
Теперь продолжите линию. OpenAI и Anthropic уже стоят $1T даже до выхода на биржу.
Если сложить самые крупные технологические дебюты последних 25 лет. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave — все они. Получается примерно 800 миллиардов долларов.
OpenAI + Anthropic одни стоят почти 2 триллиона долларов. Всё ещё частные. В 2,5 раза больше, чем четверть века крупнейших листингов Уолл-ст
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
  • Закреплено