Миллионы сайтов и сервисов по всему миру столкнулись с проблемами подключения 18 ноября 2025 года в 06:58 по UTC, причиной чего стала внутренняя ошибка у поставщика сетевой инфраструктуры Cloudflare. Компания позже в тот же день выпустила полное объяснение инцидента, предоставив прозрачную информацию о том, как произошел этот технический сбой, как его устранили и какие меры будут приняты в будущем для предотвращения подобных случаев.
Проблема всплыла: услуги в разных частях мира вышли из строя
Cloudflare сбой произошел 18 ноября в 06:58 по UTC (примерно в 14:00 по тайваньскому времени), из-за чего многие сайты, использующие CDN и DNS услуги Cloudflare, включая крупные коммерческие платформы, новостные медиа и веб-приложения, не могли нормально открываться. Этот сбой продолжался почти 40 минут, что привело к полной недоступности некоторых сайтов в определенных регионах, а пользователи не могли успешно взаимодействовать с API и сервером.
Компания отметила, что данный инцидент является прерыванием на уровне сети, которое затрагивает ее глобальную сервисную инфраструктуру, а не проблему отдельного дата-центра или региона.
Корень проблемы: Ошибка конфигурации BGP привела к бедствию
Cloudflare далее объясняет, что данное прерывание произошло из-за ошибки в настройке протокола Border Gateway Protocol (BGP). BGP является одним из основных протоколов, управляющих интернет-трафиком, и используется для того, чтобы глобальные сети знали, как маршрутизировать данные к определенному пункту назначения.
Исходная цель заключалась в обновлении внутренней политики маршрутизации и повышения эффективности инфраструктуры, однако из-за ошибок в ручной настройке некоторые префиксы IP Cloudflare стали недоступны для других провайдеров через BGP, что фактически привело к “исчезновению” маршрутов этих услуг в Интернете.
Эта ошибка не была немедленно обнаружена внутренним инструментом автоматизированного развертывания, поэтому она была широко распространена по нескольким регионам до того, как ее влияние проявилось.
Активация экстренного восстановления: быстрое отмена неверной настройки
Команда инженеров Cloudflare обнаружила аномалию через несколько минут после происшествия и срочно запустила процедуру восстановления. Они начали отмену ошибочной настройки BGP-политики около 07:15 UTC и завершили восстановление в 07:28 UTC, большая часть услуг также была восстановлена и работала нормально в это время.
В целом, этот сбой продолжался примерно 30-40 минут, согласно временной шкале, предоставленной Cloudflare, услуги полностью восстановились в 07:28 по UTC.
Почему автоматизация и механизмы защиты не смогли остановить проблему?
Cloudflare признал, что эта ошибка выявила возможности для улучшения их внутренних процессов развертывания. Ранее автоматизированный процесс имел “механизм безопасности”, который мог предотвратить ошибочные BGP-рассылки, но это обновление было внедрено на более низком уровне системных настроек и не попало под эту защиту.
Кроме того, это изменение должно было касаться только определенных экспериментальных сетей, но неожиданно повлияло на основную производственную среду. Они уже начали исправлять определение диапазона развертывания системы и усилили возможности автоматического обнаружения ошибочной политики.
Cloudflare обещает улучшения в будущем
Cloudflare заявила, что примет следующие меры, чтобы избежать повторения подобных инцидентов:
Усилить механизм проверки настроек, связанных с BGP, чтобы избежать непредвиденной маршрутизации.
Четкое разделение прав доступа к настройкам тестовой и производственной среды;
Увеличение автоматизированной системы оповещения, способной реагировать на аномальный сетевой трафик за секунды;
Укрепление контроля за внутренними изменениями и процессами ручной обработки.
Компания также подчеркивает, что они будут продолжать повышать прозрачность, и в будущем, если произойдут какие-либо сбои, они быстро опубликуют соответствующую информацию, чтобы поддержать доверие пользователей.
Ответственность и вызовы интернет-гигантов
Cloudflare, как один из крупнейших поставщиков сетевой инфраструктуры в мире, предлагает услуги в таких ключевых областях, как CDN, DNS, интернет-безопасность и защита от DDoS-атак. Одна ошибка в настройках BGP может привести к глобальному “цифровому отключению”. Хотя это событие было быстро устранено, оно все же подчеркивает риски и вызовы, связанные с высокой концентрацией инфраструктуры Интернета.
Эта статья о глобальном «цифровом отключении» Cloudflare: официальное сообщение раскрывает детали сбоя 18 ноября, впервые опубликованные на ChainNews ABMedia.