Amazon Web Services (AWS) bulut barındırma hizmetlerinde yaşanan ve milyarlarca internet kullanıcısını etkileyen büyük kesinti, teknoloji dünyasında şok etkisi yarattı. Pazartesi öğleden sonra başlayan ve dünya genelinde büyük kargaşaya neden olan bu kesinti, internetin adeta bel kemiği konumundaki AWS'nin küresel çapta 28'den fazla hizmetini etkiledi. Uzmanlar, bu olayın milyarlarca dolarlık bir zarara yol açmış olabileceğini tahmin ediyor.
En popüler uygulamalardan Snapchat, Signal ve Reddit'in erişilemez hale gelmesi, uçuşların gecikmesi, bankacılık ve finansal hizmetlerin durması, hatta Fortnite gibi devasa oyunların oynanamaması, sorunun ne kadar geniş çaplı olduğunu gözler önüne serdi. Amazon'un kendi hizmetleri de nasibini aldı; e-ticaret platformu, Alexa sanal asistanı ve Prime Video gibi servisler de bu kesintiden etkilendi. Milyonlarca işletme, çalışanlarının sistemlere giriş yapamaması veya ödeme alamaması nedeniyle operasyonlarını durdurmak zorunda kaldı.
İnternet performansı izleme firması Catchpoint'in CEO'su, bu olayın internetin ne kadar karmaşık ve kırılgan olduğunu ve işimizin her yönünün internete ne kadar bağımlı olduğunu bir kez daha gösterdiğini belirtti. Kayıp verimlilik ve duran iş operasyonları nedeniyle finansal etkinin yüz milyarlarca dolara ulaşabileceğini söyledi.
Sorunun kaynağının, AWS'nin en eski ve en büyük veri merkezlerinden biri olduğu ve birçok AWS hizmeti için varsayılan bölge olarak kullanıldığı belirtildi. Bu bölge daha önce de 2020 ve 2021 yıllarında kesintiler yaşamıştı, ancak yapılan düzeltmelerin kalıcı bir çözüm sunamadığı anlaşıldı.
Teknik detaylara inildiğinde, sorunun ilk olarak bulut veritabanı teknolojisiyle ilgili olarak "artan hata oranları ve gecikmeler" şeklinde kendini gösterdiği anlaşıldı. Mühendisler, sorunun temelinde bir Alan Adı Sistemi (DNS) çözümleme problemi olduğunu belirleyip hızla düzeltti. Ancak, bu düzeltmenin ardından diğer AWS hizmetlerinin de peş peşe arızalanması, platformun uzun süre daha kullanılamaz hale gelmesine neden oldu.
Kesintinin zirve yaptığı Pazartesi günü, küresel çapta 8 milyondan fazla kullanıcının benzer sorunları bildirdiği kaydedildi. Bilgisayar bilimcileri, bu tür büyük ölçekli kesintileri önlemek için yazılım geliştiricilerin daha iyi hata toleransı geliştirmesi gerektiğini vurguluyor. Maliyetten kaçınma ve son adımı atlamanın şirketleri riske attığı belirtiliyor.
Amazon için bu durum, müşterilerin başka bulut sağlayıcılara yönelmesi halinde gelir kaybına yol açabilir. Özellikle finansal hizmetler gibi riskten kaçınan firmaların, kritik iş yüklerini AWS, Microsoft Azure ve Google Cloud gibi birden fazla sağlayıcıya yayarak "çoklu bulut" stratejisi benimseme eğiliminde olduğu konuşuluyor.