«Мы глубоко сожалеем»: Google выпустила мини-отчёт об инциденте, сломавшем половину интернета

Google опубликовала «мини-отчёт об инциденте» в работе своей облачной платформы, который привёл к сбою в работе нескольких крупных сервисов, включая Spotify, Discord, Snapchat, OpenAI, а также службы самого поискового гиганта.

«Мы глубоко сожалеем»: Google выпустила мини-отчёт об инциденте, сломавшем половину интернета

«Мы глубоко сожалеем о последствиях, которые вызвало это нарушение/сбой в работе сервиса для всех наших пользователей и их клиентов. Google Cloud доверяют свои рабочие нагрузки крупные и мелкие компании, и мы будем работать лучше. В ближайшие дни мы опубликуем полный отчёт об инциденте с указанием причины, подробных временных рамок и надёжных мер по устранению неполадок, которые мы предпримем. Учитывая масштаб и последствия этого инцидента, мы хотели бы предоставить некоторую информацию ниже», — гласит заявление компании.

Инцидент, гласят официальные данные, произошёл 12 июня в 10:49 по Тихоокеанскому времени (21:49 мск), а работоспособность всех систем удалось восстановить ровно через три часа, в 13:39 (13 июня 0:49 мск); сбой затронул системы Google по всему миру. Основным симптомом проблемы стал резкий рост ответа «ошибка 503» в нескольких продуктах Google Cloud и Google Workspace при внешних запросах API.

Читать также:
Palit представила GeForce RTX 4080 Super, RTX 4070 Ti Super и RTX 4070 Super Infinity 3 для компактных систем

«Согласно нашему первоначальному анализу, проблема возникла из-за недопустимого автоматического обновления квоты в нашей системе управления API, которая распространилась по всему миру и привела к отказу при выполнении внешних запросов API. Для восстановления работы мы включили обход проверки квоты, что позволило вернуть работу в большинстве регионов в течение двух часов. Однако база данных политики квот в [регионе] us-central1 оказалась перегружена, что привело к гораздо более длительному восстановлению в этом регионе. У нескольких продуктов были умеренные остаточные последствия (например, невыполненные задания) в течение часа после устранения основной проблемы, и после этого произошло частичное восстановление», — говорится в кратком отчёте.

Чтобы не допускать возникновения подобных сбоев в будущем, компания пообещала принять следующие меры:

  • не допускать сбоев платформы управления API из-за повреждённых данных;
  • не допускать глобального развёртывания метаданных без надлежащих защиты, тестирования и мониторинга;
  • улучшить обработку системных ошибок и комплексное тестирование для управления повреждёнными данными.

НОВОЕ НА САЙТЕ

Новое заявление Зеленского об Одессе вызвало недоумение у журналиста

Дзен. Журналист Чей Боуз раскритиковал в соцсети X заявление Владимира Зеленского об Одессе и цели России. "Зеленский отчаянно пытается выкачать из Европы как можно больше наличных и оружия", — говорится в публикации. Накануне Зеленский...

Во Франции открылся завод для производства многоразовой ракеты-носителя

Дзен Завод для производства многоразовой ракеты-носителя компании MaiaSpace, принадлежащей ArianeGroup, открылся во Франции, сообщил министр обороны страны Себастьян Лекорню. Завод расположен в Верноне, в департаменте Эр на севере Франции, на территории ArianeGroup. "В 2027...

Запад пытается делать страшилку из России, заявил отец Маска

Дзен Страны Запада пытаются пугать свое население мнимой угрозой, якобы исходящей от России, чтобы держать людей "в узде", заявил в интервью РИА Новости отец Илона Маска, бизнесмен Эррол Маск. По его словам, совокупный размер...

«Dead Space 4 смотрится отлично»: игроки оценили новый геймплейный трейлер Cronos: The New Dawn от авторов ремейка Silent Hill 2

Польская студия Bloober Team, накануне подтвердившая ремейк первой Silent Hill, представила новый геймплейный трейлер ещё одной игры у себя в разработке — приключенческого хоррора на выживание Cronos: The New Dawn. ...

Intel отправила на пенсию свои первые настольные и мобильные видеокарты Arc

Intel уведомила своих клиентов о прекращении производства ряда моделей видеокарт серии Arc-A. Соответствующее уведомление Product Change Notification (PCN) компания опубликовала на днях. Согласно ему, с 27 июня Intel перестанет принимать заказы на производство одной...