Глобален прекъсване на Amazon Web Services: Какво се случи и кой беше засегнат?

  • Глобален инцидент с AWS, възникнал в US-EAST-1 (Вирджиния), е идентифициран като проблем с DNS.
  • Междусекторно въздействие: Amazon, Alexa, Prime Video, банки (BBVA, Santander, CaixaBank), телефони за данни, Ticketmaster и видеоигри като Fortnite или Roblox.
  • Предупрежденията започнаха около 08:40 ч. (CST). Очакваха се признаци на възстановяване в средата на сутринта, а основният проблем отшумяваше до ранния следобед.
  • AWS препоръча изчистване на DNS кешовете и предупреди за евентуални ограничения, докато системите се нормализират.

Глобално въздействие върху AWS

Провал в облака от Amazon Web Services (AWS) причини глобален прекъсване в понеделник, което засегна уебсайтове, приложения и видеоигри. Рано тази сутрин многобройни потребители в Испания съобщиха за проблеми с достъпа и бавност в популярните услуги, сочейки към... глобален спад необичаен по своя обхват.

Първите предупреждения на уебсайта за мониторинг DownDetector започнаха около 08:40 (Полуостровно време). Оттогава мрежите са изпълнени със съобщения, описващи грешки в свързаността, безкрайни качвания и периодични прекъсвания на критични платформи, които зависят от AWS инфраструктура.

Кои услуги са засегнати

Сред засегнатите платформи бяха собствените продукти на Amazon, като например онлайн магазина, асистента Alexa y Прайм видео, както и услуги на трети страни. Инциденти бяха докладвани в Canva, Duolingo, търсачката с изкуствен интелект недоумение и социални мрежи като Snapchat, със специален шум в игралните общности поради проблеми в Fortnite, Roblox y Сблъсъкът Royale.

Финансовият сектор понесе удара: платформи BBVA, CaixaBank, Banco Santander и платежни услуги, като например Бизум преживя грешки, както и телефони за данни във физически магазини. В Съединените щати, Venmo (подобно на Bizum) също регистрира проблеми, отразяващи каскадния ефект на падане.

Смущенията са засегнали и издаването и продажбата на билети. Live Nation докладвани повреди в системите Ticketmaster, до степен да се наложи да се отложат издания, като например турнето на Ухото на Ван Гог, докато други продажби, като например тези на Ерик Клептън, успяха да продължат по-нормално.

В областта на свързаността и обществените услуги са докладвани инциденти при оператори като Movistar, оранжев y Vodafone, а Аена предупреди за проблеми с плащането с карта в паркинг на летищетоУспоредно с това, някои инструменти за сътрудничество и стрийминг, както и медийни и електронни търговски платформи, обвиниха периодични повреди.

Къде беше техническият произход

Според официалната комисия по състоянието на инцидента, мястото на инцидента е било в региона. US-EAST-1 (Северна Вирджиния, САЩ), един от най-големите и най-стари анклави на AWS. Компанията отбеляза основен проблем с DNS като основна причина, критичен компонент, който преобразува имената на услугите в IP адреси, за да могат машините да комуникират.

DNS грешката е повлияла на разрешаването на имена в региона, така че множество услуги вече не са могли да намерят своите домейни. крайни точкиСред най-силно засегнатите беше Amazon DynamoDB, чиято точка за достъп е претърпяла грешки, които са се разпространили до множество приложения, зависещи от тази база данни.

AWS посочи, че ако след смекчаване на последиците проблемите с връзката с крайните точки продължават DynamoDB в US-EAST-1 беше удобно изчистване на DNS кешоветеСъщевременно той предупреди за частични ограничения на определени заявки, докато всички слоеве на платформа.

Въздействие в Испания и други страни

В Испания ефектът се усети в онлайн банкиране и плащания в магазини, в приложения за масово ползване и при закупуване на билети. Някои компании съобщиха, че телефони за данни спря обработката на сделки през части от сутринта и потребителите срещнаха пречки при влизане в системата или завършване на транзакции на приложения общ.

Въздействието беше глобално, с ясен фокус върху Северна Америка поради местоположението на проблема, но с последици в Европа и други пазари. В мрежи като X и Reddit съобщенията за проблема се умножиха. Alexa неотзивчиви, рутини, които не се изпълняваха, и приложения, които не успяваха да преминат през екрана за зареждане – типичен модел, когато DNS резолюция.

Имаше и времеви съвпадения с инциденти, несвързани с AWS, като например временен спад Redsys което се отрази на плащанията в Испания. Въпреки че официално беше отделено от проблема с Amazon, едновременността засили усещането за колапс в някои сектори.

Хронология и състояние на възстановяване

Предупрежденията започнаха около 08:40 в Испания. Към средата на сутринта AWS обяви, че вече наблюдава признаци на възстановяване след прилагане на смекчаващи мерки. Около обяд трафикът започна да се връща към нормалното във все по-голям брой Servicios, с ясни спадове в отчетите на DownDetector.

След първите часове компанията съобщи, че Проблем с DNS базата са били смекчени и че повечето операции функционират нормално. Той обаче предупреди за евентуални специфични ограничения по конкретни искания, докато пълното възстановяване на засегнатия регион беше в процес на завършване.

Защо прекъсване на AWS парализира половината интернет

AWS дава възможност на бизнеса и разработчиците наем на изчислителни ресурси (изчисления, съхранение, бази данни, мрежи, изкуствен интелект), вместо да се съхраняват локално. Този модел превърна платформата в гръбнак Интернет: от големите стрийминг услуги до мобилните приложения и платежните системи, всички зависят, пряко или косвено, от неговата инфраструктура.

Когато един регион е толкова критичен, колкото US-EAST-1 страда от проблем с DNS, въздействието се увеличава рязко: услуги, които не могат да разрешават имена, бази данни, които не достигат до крайните си точки, и вериги от зависимости, които се прекъсват. Следователно, един-единствен инцидент води до широко разпространени провали в толкова разнообразни области като банково дело, образование, развлечения и електронна търговия.

Това, което преживяхме, подчертава необходимостта от проектиране на системи с еластичност и диверсификация: резервиране между регионите, планове за превключване при срив и стратегии за контролирана деградация. Въпреки че много услуги се възстановиха бързо, на други им отне повече време, което подчертава колко е важно да се предвиди сценарии на есента.

Въпреки че повечето операции вече са възобновени, техническите екипи все още следят последните детайли и гарантират, че няма странични ефекти; компанията подчертава, че след отстраняване на първопричината, те могат да продължат. настройки докато движението в засегнатия район не бъде напълно нормализирано.

Денят оставя ясно наблюдение: инцидент от DNS на US-EAST-1 бяха предизвикани прекъсвания за десетки услуги, от Amazon.com, Alexa o Прайм видео дори банки, телефони за данни, Ticketmaster и видеоигри, с предупреждения, започващи в 08:40 ч. сутринта и постепенно възстановяващи се от обяд; напомняне за това колко много интернет зависи от инфраструктурата на AWS.

Най -добрите оператори на Rainbow Six Siege на 2021 г.
Свързана статия:
Най -добрите оператори на Rainbow Six Siege на 2021 г.